В принципе, если две строки будут оценивать как то же самое в моей базе данных, я также хотел бы иметь возможность проверить это на уровне приложения. Например, если кто-то входит в «bjork» в поле поиска, я хочу, чтобы PHP смог сопоставить это с строкой «Björk» так же, как MySQL.
Я предполагаю, что PHP не имеет прямого эквивалента опциям сопоставления MySQL, и что проще всего было бы написать простую функцию, которая преобразует строки, используя strtolower (), чтобы сделать их равномерно нижним регистром и strstr () для замены многобайтные символы с соответствующими эквивалентами ASCII.
Это точная предпосылка? Есть ли у кого-нибудь дурацкий массив, который можно использовать в качестве второго параметра strstr () для соответствия строк, как это делают различные сопоставления MySQL (в частности, для моих текущих потребностей, utf8_general_ci)? Или, если этого не хватает, где можно найти документацию о том, как различные сопоставления в MySQL обрабатывают разные символы? (Я видел где-то, что в некоторых сопоставлениях ß рассматривается как S, а в других – как Ss, например, но он не начертил каждую оценку персонажа.)
Вот что я использовал, но мне еще предстоит проверить его на полную совместимость с MySQL.
function collation_conform($string,$collation='utf8_general_ci') { if($collation === 'utf8_general_ci') { if(!is_string($string)) return $string; $string = strtr($string, array( 'Š'=>'S', 'š'=>'s', 'Ð'=>'D', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'Ss','à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f')); return strtolower($string); } else die('Unsupported Collation (collation_conform() collation_helper.php)'); }
Вы посмотрели класс сопоставления PHP? http://www.php.net/manual/en/class.collator.php
Попробуйте следующий код.
$s1 = 'Björk'; $s2 = 'bjork'; var_dump( is_same_string($s1, $s2) ); function is_same_string($str, $str2, $locale = 'en_US') { $coll = collator_create($locale); collator_set_strength($coll, Collator::PRIMARY); return 0 === collator_compare($coll, $str, $str2); }