Articles of соответствия строк

Оптимизация поиска с близлежащим дублированием

Я пытаюсь найти близлежащие повторяющиеся значения в наборе полей, чтобы позволить администратору очистить их. Есть два критерия, по которым я Одна строка целиком содержится внутри другой и имеет по крайней мере 1/4 ее длины Строки имеют расстояние редактирования менее 5% от общей длины двух строк Код псевдо-PHP: foreach($values as $value){ $matches = array(); foreach($values as […]

Строковое сходство в PHP: функция типа levenshtein для длинных строк

Функция levenshtein в PHP работает с строками с максимальной длиной 255. Каковы хорошие альтернативы для вычисления оценки подобия предложений в PHP. В основном у меня есть база данных предложений, и я хочу найти приблизительные дубликаты. Функция similar_text не дает мне ожидаемых результатов. Какой самый простой способ для меня найти похожие предложения, как показано ниже: $ss="Jack […]