nlp PHP Lang

Регулярное выражение не работает должным образом с турецкими персонажами

Я пишу регулярное выражение, которое должно извлекать следующие шаблоны; «çççoookkk gggüüüzzzeeelll» (это означает vvveeerrryyy gggoooddd с турецкими персонажами «ç» и «ü») «ccccoookkk ggguuuzzzeeelll» (это значит одно и то же, но с английскими символами «c» и «u») вот регулярные выражения, которые я пытаюсь; "\b[çc]+o+k+\sg+[üu]+z+e+l+\b" : это работает на английском языке, но не в турецких символах "çok" […]

Обнаружение Syllable PHP

Я хотел бы найти способ разделить слово на слоги с PHP. Например, слово «nevermore» пробежало через detect_syllables (), вернуло бы «nev-er-more». Есть ли хорошие API или что-то там?

PHP и NLP: вложенная скобка (результат анализатора) в массив?

Хотелось бы превратить текст с вложенными скобками в вложенный массив. Ниже приведен пример вывода анализатора NLP: (TOP (S (NP (PRP I)) (VP (VBP love) (NP (NP (DT a) (JJ big) (NN bed)) (PP (IN of) (NP (NNS roses))))) (. .))) (orig: Мне нравится большая кровать из роз.) Хотелось бы превратить это в вложенный массив, чтобы […]

Как вы находите предмет предложения?

Я новичок в NLP и занимаюсь исследованием того, какой языковой инструментарий я должен использовать, чтобы сделать следующее. Я хотел бы сделать одну из двух вещей, которая выполняет одно и то же: В основном я хотел бы классифицировать текст, обычно одно предложение, содержащее 15 слов. Хотелось бы классифицировать, говорит ли речь о конкретном предмете. Есть ли […]

Как распознавать имена из текста, используя php

Я хочу извлечь имя (firstnames и lastnames) из текста, используя php. Пример. Из текста ниже я хочу извлечь имена (в этом случае Алине Райт и Джесси Райт) Алин Райт – выживший рак, ампутант и новобранец. В среду вечером она начала показывать признаки того, что у нее был инсульт. «Я начал ощущать онемение левой руки и […]

Определение границ предложения php

Я хотел бы разделить текст на предложения в PHP. В настоящее время я использую регулярное выражение, которое обеспечивает точность ~ 95% и улучшает работу с использованием лучшего подхода. Я видел инструменты NLP, которые делают это в Perl, Java и C, но не вижу ничего, что бы соответствовало PHP. Знаете ли вы о таком инструменте?

Алгоритм строгания, создающий реальные слова

Мне нужно взять абзац текста и извлечь из него список «тегов». Большая часть этого довольно прямолинейна. Однако мне нужна некоторая помощь, которая теперь приводит к появлению списка слов, чтобы избежать дублирования. Пример: Сообщество / Сообщества Я использовал реализацию алгоритма Porter Stemmer (кстати, я пишу на PHP): http://tartarus.org/~martin/PorterStemmer/php.txt Это работает, вплоть до точки, но не возвращает […]

Разделить строку на предложения с использованием регулярного выражения

У меня есть случайный текст, хранящийся в $sentences . Используя regex, я хочу разделить текст на предложения, см. function splitSentences($text) { $re = '/ # Split sentences on whitespace between them. (?<= # Begin positive lookbehind. [.!?] # Either an end of sentence punct, | [.!?][\'"] # or end of sentence punct and quote. ) […]

Текстовая обработка с PHP

Я делаю проект для колледжа, который я беру. Я использую PHP для создания простого веб-приложения, которое классифицирует твиты как «позитивные» (или счастливые) и «негативные» (или печальные) на основе набора словарей. Алгоритм, о котором я сейчас думаю, – это классификатор Naive Bayes или дерево решений. Однако я не могу найти какую-либо библиотеку PHP, которая помогла бы […]

Intereting Posts

UTF-8 в регулярных выражениях PHP Выполнить код после HTTP-запроса в PHP? Автопоток (канал) для пользователей приложений Список значений перечисления в раскрывающемся списке php mysql Laravel 4: просмотр гнезда внутри макета с данными Многократное извлечение PDO одного и того же запроса Файл по умолчанию для Apache localhost FFMPEG работает в командной строке, но не в exec (), он возвращает 127 PHPExcel занимает очень много времени, чтобы прочитать файл Excel API Twitter возвращает NULL на XAMPP Как эхо-элемент ассоциативного массива в строке? Каков наилучший способ проверки чисел с запятой как десятичной разделитель? Maxmind geolocation apis: Apache vs PHP читать файлы в папке получение изображений из базы данных и отображение всех на странице

Articles of nlp