Мы разрабатываем базовый сайт социальных сетей с использованием LAMP.
Для этого мы хотим сделать Resume / CV Parsing в PHP.
Мы смогли разобрать идентификатор электронной почты и телефон, но не уверены, как разбирать другую информацию, такую как полное имя, адрес, образование, занятость и т. Д. Из резюме.
Плюс резюме / CV может быть в различных форматах, таких как doc, html, rtf, txt и т. Д.
Кто-нибудь знает сценарий PHP, где мы можем захватить данные. или любую идею развития, чтобы начать игру.
Заранее спасибо.
Я бы посмотрел, есть ли у существующего анализатора резюме API, который вы можете использовать, или пользовательский крючок, который вы можете добавить в свою структуру. Проверьте Sovren или TextKernel
Согласно сайту Sovren's, они цитируют:
Как только ваш экземпляр веб-службы SovrenConvertAndParse запущен, вы получите доступ к нему через SOAP. Практически во всех средах программирования есть возможность автоматически создавать клиент Web-сервиса или прокси-сервер веб-службы из WSDL веб-службы. У нас также есть образцы клиентов для некоторых сред, таких как PHP. В любом случае создание клиента веб-службы должно быть очень быстрой задачей: обычно несколько минут, может быть, несколько часов.
После того, как вы создали клиент веб-службы, вы можете вызвать один метод в веб-службе, чтобы преобразовать и проанализировать резюме в одной операции, получив результат HR-XML взамен.
http://www.sovren.com/sovren-products-parser-implementation.php
http://www.sovren.com/sovren-products-web-service.php
TextKernel цитирует:
Обработка документов для всех типов документов (документы DOC, DOCX, PDF, RTF, HTML, TIFF, TXT, XML, MSG и EML). Textkernel предлагает следующие 11 языков: английский, немецкий, французский, голландский, испанский, шведский, датский, польский, румынский, итальянский, словацкий.
Кажется, их веб-интерфейс называется Sourcebox:
Исходный код полностью настраивается с помощью утилиты Extract !, Textkernel CV Parsing.
Sourcebox имеет многоязычный веб-интерфейс для персонала, который может управлять очередью CV и проверять и исправлять ошибки вручную.
Исходный код можно использовать в качестве интерфейса для многих ведущих CRM, ATS, двигателей соответствия, систем HRMS и вашего собственного веб-сайта или портала для найма.
http://www.textkernel.com/hr_solutions.php?nav=sourcebox
Оба они кажутся достаточно многообещающими для использования и не должны изобретать колесо здесь, особенно с PHP.