Я пишу регулярное выражение, которое должно извлекать следующие шаблоны; «çççoookkk gggüüüzzzeeelll» (это означает vvveeerrryyy gggoooddd с турецкими персонажами «ç» и «ü») «ccccoookkk ggguuuzzzeeelll» (это значит одно и то же, но с английскими символами «c» и «u») вот регулярные выражения, которые я пытаюсь; "\b[çc]+o+k+\sg+[üu]+z+e+l+\b" : это работает на английском языке, но не в турецких символах "çok" […]
Я хотел бы найти способ разделить слово на слоги с PHP. Например, слово «nevermore» пробежало через detect_syllables (), вернуло бы «nev-er-more». Есть ли хорошие API или что-то там?
Хотелось бы превратить текст с вложенными скобками в вложенный массив. Ниже приведен пример вывода анализатора NLP: (TOP (S (NP (PRP I)) (VP (VBP love) (NP (NP (DT a) (JJ big) (NN bed)) (PP (IN of) (NP (NNS roses))))) (. .))) (orig: Мне нравится большая кровать из роз.) Хотелось бы превратить это в вложенный массив, чтобы […]
Я новичок в NLP и занимаюсь исследованием того, какой языковой инструментарий я должен использовать, чтобы сделать следующее. Я хотел бы сделать одну из двух вещей, которая выполняет одно и то же: В основном я хотел бы классифицировать текст, обычно одно предложение, содержащее 15 слов. Хотелось бы классифицировать, говорит ли речь о конкретном предмете. Есть ли […]
Я хочу извлечь имя (firstnames и lastnames) из текста, используя php. Пример. Из текста ниже я хочу извлечь имена (в этом случае Алине Райт и Джесси Райт) Алин Райт – выживший рак, ампутант и новобранец. В среду вечером она начала показывать признаки того, что у нее был инсульт. «Я начал ощущать онемение левой руки и […]
Я хотел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое обеспечивает точность ~ 95% и улучшает работу с использованием лучшего подхода. Я видел инструменты NLP, которые делают это в Perl, Java и C, но не вижу ничего, что бы соответствовало PHP. Знаете ли вы о таком инструменте?
Мне нужно взять абзац текста и извлечь из него список «тегов». Большая часть этого довольно прямолинейна. Однако мне нужна некоторая помощь, которая теперь приводит к появлению списка слов, чтобы избежать дублирования. Пример: Сообщество / Сообщества Я использовал реализацию алгоритма Porter Stemmer (кстати, я пишу на PHP): http://tartarus.org/~martin/PorterStemmer/php.txt Это работает, вплоть до точки, но не возвращает […]
У меня есть случайный текст, хранящийся в $sentences . Используя regex, я хочу разделить текст на предложения, см. function splitSentences($text) { $re = '/ # Split sentences on whitespace between them. (?<= # Begin positive lookbehind. [.!?] # Either an end of sentence punct, | [.!?][\'"] # or end of sentence punct and quote. ) […]
Я делаю проект для колледжа, который я беру. Я использую PHP для создания простого веб-приложения, которое классифицирует твиты как «позитивные» (или счастливые) и «негативные» (или печальные) на основе набора словарей. Алгоритм, о котором я сейчас думаю, – это классификатор Naive Bayes или дерево решений. Однако я не могу найти какую-либо библиотеку PHP, которая помогла бы […]