Что такое нормализованный UTF-8?
В проекте ICU (который теперь также есть библиотека PHP ) содержатся классы, необходимые для нормализации строк UTF-8, чтобы упростить сравнение значений при поиске. Тем не менее, я пытаюсь понять, что это означает для приложений. Например, в каких случаях я хочу «Каноническая эквивалентность» вместо «эквивалентности совместимости» или наоборот?