Я имею в PHP массив, например:
$arr = array("hello", "try", "hel", "hey hello");
Теперь я хочу сделать переупорядочивание массива, который будет основываться на наиболее близких словах между массивом и моим $ search var.
Как я могу это сделать?
Это может быть быстрое решение, используя http://php.net/manual/en/function.similar-text.php :
Это вычисляет сходство между двумя строками, как описано в «Классификация программирования: реализация лучших алгоритмов мира» Оливера (ISBN 0-131-00413-1). Обратите внимание, что эта реализация не использует стек, как в псевдокоде Оливера, а рекурсивные вызовы, которые могут ускорить процесс или не ускорить его. Заметим также, что сложность этого алгоритма O (N ** 3), где N – длина самой длинной строки.
$userInput = 'Bradley123'; $list = array('Bob', 'Brad', 'Britney'); usort($list, function ($a, $b) use ($userInput) { similar_text($userInput, $a, $percentA); similar_text($userInput, $b, $percentB); return $percentA === $percentB ? 0 : ($percentA > $percentB ? -1 : 1); }); var_dump($list); //output: array("Brad", "Britney", "Bob");
Или с помощью http://php.net/manual/en/function.levenshtein.php :
Расстояние Левенштейна определяется как минимальное количество символов, которые вы должны заменить, вставить или удалить, чтобы преобразовать str1 в str2. Сложность алгоритма O (m * n), где n и m – длина str1 и str2 (довольно хорошая по сравнению с аналогичным_text (), которая равна O (max (n, m) ** 3), но еще дорогой).
$userInput = 'Bradley123'; $list = array('Bob', 'Brad', 'Britney'); usort($list, function ($a, $b) use ($userInput) { $levA = levenshtein($userInput, $a); $levB = levenshtein($userInput, $b); return $levA === $levB ? 0 : ($levA > $levB ? 1 : -1); }); var_dump($list); //output: array("Britney", "Brad", "Bob");
Вы можете использовать функцию levenshtein
<?php // input misspelled word $input = 'helllo'; // array of words to check against $words = array('hello' 'try', 'hel', 'hey hello'); // no shortest distance found, yet $shortest = -1; // loop through words to find the closest foreach ($words as $word) { // calculate the distance between the input word, // and the current word $lev = levenshtein($input, $word); // check for an exact match if ($lev == 0) { // closest word is this one (exact match) $closest = $word; $shortest = 0; // break out of the loop; we've found an exact match break; } // if this distance is less than the next found shortest // distance, OR if a next shortest word has not yet been found if ($lev <= $shortest || $shortest < 0) { // set the closest match, and shortest distance $closest = $word; $shortest = $lev; } } echo "Input word: $input\n"; if ($shortest == 0) { echo "Exact match found: $closest\n"; } else { echo "Did you mean: $closest?\n"; } ?>
если вы хотите отсортировать массив, вы можете сделать это:
$arr = array("hello", "try", "hel", "hey hello"); $search = "hey"; //your search var for($i=0; $i<count($arr); $i++) { $temp_arr[$i] = levenshtein($search, $arr[$i]); } asort($temp_arr); foreach($temp_arr as $k => $v) { $sorted_arr[] = $arr[$k]; }
$sorted_arr
должен быть в порядке убывания, начиная с самого близкого слова к вашему поисковому запросу.
Другой способ – использовать функцию like_text, которая возвращает результат в процентах. См. Больше http://www.php.net/manual/en/function.similar-text.php .