Резюме / CV Анализ в PHP

Мы разрабатываем базовый сайт социальных сетей с использованием LAMP.

Для этого мы хотим сделать Resume / CV Parsing в PHP.

Мы смогли разобрать идентификатор электронной почты и телефон, но не уверены, как разбирать другую информацию, такую ​​как полное имя, адрес, образование, занятость и т. Д. Из резюме.

Плюс резюме / CV может быть в различных форматах, таких как doc, html, rtf, txt и т. Д.

Кто-нибудь знает сценарий PHP, где мы можем захватить данные. или любую идею развития, чтобы начать игру.

Заранее спасибо.

Я бы посмотрел, есть ли у существующего анализатора резюме API, который вы можете использовать, или пользовательский крючок, который вы можете добавить в свою структуру. Проверьте Sovren или TextKernel

Согласно сайту Sovren's, они цитируют:

Как только ваш экземпляр веб-службы SovrenConvertAndParse запущен, вы получите доступ к нему через SOAP. Практически во всех средах программирования есть возможность автоматически создавать клиент Web-сервиса или прокси-сервер веб-службы из WSDL веб-службы. У нас также есть образцы клиентов для некоторых сред, таких как PHP. В любом случае создание клиента веб-службы должно быть очень быстрой задачей: обычно несколько минут, может быть, несколько часов.

После того, как вы создали клиент веб-службы, вы можете вызвать один метод в веб-службе, чтобы преобразовать и проанализировать резюме в одной операции, получив результат HR-XML взамен.

http://www.sovren.com/sovren-products-parser-implementation.php

http://www.sovren.com/sovren-products-web-service.php

TextKernel цитирует:

Обработка документов для всех типов документов (документы DOC, DOCX, PDF, RTF, HTML, TIFF, TXT, XML, MSG и EML). Textkernel предлагает следующие 11 языков: английский, немецкий, французский, голландский, испанский, шведский, датский, польский, румынский, итальянский, словацкий.

Кажется, их веб-интерфейс называется Sourcebox:

Исходный код полностью настраивается с помощью утилиты Extract !, Textkernel CV Parsing.

Sourcebox имеет многоязычный веб-интерфейс для персонала, который может управлять очередью CV и проверять и исправлять ошибки вручную.

Исходный код можно использовать в качестве интерфейса для многих ведущих CRM, ATS, двигателей соответствия, систем HRMS и вашего собственного веб-сайта или портала для найма.

http://www.textkernel.com/hr_solutions.php?nav=sourcebox

Оба они кажутся достаточно многообещающими для использования и не должны изобретать колесо здесь, особенно с PHP.