Я пытаюсь сравнить данные из двух источников.
ORIG Kick-Ass: Music From The Motion Picture ALT Kick-A*s (Music from the Motion Picture) ALT Kick-Ass: (Music from the Motion Picture)[Explicit] ALT Kick-Ass: A dedication
ALT 1 ALT 2 и ORIG совпадают. ALT 3 – фиктивный результат.
Мне нужно проверить, что они имеют соответствие, есть ли какие-либо методы, доступные мне в библиотеке PHP. Я думал о подсчете каждого отдельного символа с помощью count_chars, а затем сравнивал строку ORIG, используя процентное совпадение. Однако, если его короткий заголовок не будет работать слишком хорошо.
Есть ли у вас идеи, как я могу проверить, что они соответствуют,
Ура,
J
Ну, всегда есть левенштейновское расстояние , но я не уверен, как в конечном итоге это будет полезно для вас.
Однако можно сделать снимок .
вы можете рассмотреть возможность использования расстояния редактирования
http://en.wikipedia.org/wiki/Levenshtein_distance
вызов php:
http://ca2.php.net/levenshtein
он возвращает количество изменений, которые вы должны были бы сделать (вставки и удаления), чтобы преобразовать одну строку в другую
НТН
Вы можете попробовать что-то вроде: расстояние Хэмминга