Расстояние Левенштейна: как лучше обрабатывать слова, заменяющие позиции?
У меня был некоторый успех, сравнивающий строки, используя функцию PHP levenshtein . Однако для двух строк, которые содержат подстроки, которые меняют местами, алгоритм считает их целыми новыми подстроками. Например: levenshtein("The quick brown fox", "brown quick The fox"); // 10 differences рассматриваются как имеющие меньше общего, чем: levenshtein("The quick brown fox", "The quiet swine flu"); // […]