Обнаружение Syllable PHP

Я хотел бы найти способ разделить слово на слоги с PHP. Например, слово «nevermore» пробежало через detect_syllables (), вернуло бы «nev-er-more». Есть ли хорошие API или что-то там?

Существует полезная докторская диссертация Фрэнк Лян, в которой описывается исключительно точный алгоритм для этого: написанный более 25 лет назад, он по-прежнему действителен. Но я не знаю о какой-либо реализации в PHP

РЕДАКТИРОВАТЬ

Быстрый google определил эту ссылку на библиотеку текстовой статистики в PHP, которая включает в себя алгоритмы подсчета слогов в словах (среди других алгоритмов измерения удобочитаемости). Здесь вы сможете найти код для разделения слогов.

На самом деле я нахожусь на завершающей стадии создания класса PHP Hyphenator на основе алгоритма Фрэнка Ляна и словарей TeX, что в значительной степени похоже на то, что касается всех офисных наборов. (На самом деле я нашел эту тему, ища доброе имя для нее, которое еще не было принято). При медленном улучшении поддержки браузеров для лица это становится реалистичным вариантом для переноса содержимого на веб-сайтах.

Функциональность ядра работает; расщепление (и, следовательно, подсчет) и / или перенос текста и / или HTML, анализ синтаксических тегов TeX, кэширование этих анализируемых словарей. Некоторые запланированные функции все еще отсутствуют, но ничто не мешает вам использовать его. Также нет хорошей документации, образцов, официального сайта unittest или тщеславия.

Я создал здесь сайт github и опубликую текущую версию на нем как можно скорее, поэтому зайдите через несколько дней.

Я тестировал его только с голландским (мой родной язык) и с английским английским, поэтому у него могут быть некоторые проблемы с языками, использующими разные наборы символов.

Обратите внимание, что статья Фрэнка Ляна находится на переносе, а не на обнаружении слога. Кроме того, в его тезисах говорится, что его коэффициент успеха составляет около 89% для словаря, который он использовал, что не будет достаточно хорошим для всех. На самом деле нет никакой замены для ручного делать это за каждое отдельное слово. Не так уж и нужно, чтобы для этого требовался полный список слов «один-один» для поиска, но в наши дни пространство для хранения намного дешевле, чем время процессора.

Возможно, кто-то может подумать о создании службы, подобной CAPTCHA, чтобы многие пользователи могли попросить предоставить решение каждому известному слову, при этом результаты были проверены друг на друге, так что одному человеку не пришлось бы все это делать самостоятельно. Я надеюсь, что результаты будут выпущены свободно после завершения.