Недавно мы столкнулись с интересной проблемой, когда в нашей базе данных были обнаружены дублированные пользовательские данные. Мы поняли, что расстояние Левенштейна между большей частью этих данных было просто разницей между двумя указанными строками. Это указывает на то, что если мы просто добавим символы из одной строки в другую, то мы получим одну и ту же […]
Поэтому у меня есть база данных с длиной от 3 до 20 символов. Я хочу что-то закодировать в PHP, который находит все более мелкие слова, которые содержатся в большом слове. Например, в слове «внутрь» есть слова «дождь», «победа», «избавление» и т. Д. Сначала я подумал о добавлении поля в таблицы слов (Words3 через Words20, обозначая […]