Есть ли свободные библиотеки OCR, которые работают с PHP или Python на сервере Linux? Идея состоит в том, чтобы иметь возможность загружать изображение и вытаскивать из него символы или разрешать пользователям «рисовать символы» и анализировать их из указанного изображения.
Поскольку вы находитесь в ящике Linux, я бы настоятельно рекомендовал ocropus с открытым исходным кодом Google .
Это не PHP, но я думаю, что это будет ваш лучший вариант. Конечно, вы можете вызвать его из PHP через exec
. Его зрелый и имеет много вариантов. С сайта проекта:
Двигатель OCRopus основан на двух исследовательских проектах: высокопроизводительный распознаватель почерка, разработанный в середине 90-х годов и развернутый Бюро переписи США, и новые высокопроизводительные методы анализа макета.
Существует также еще один проект с открытым исходным кодом, tesseract . Я использовал это и в прошлом, и был доволен результатами. Включает обучение, ограничение вашего алфавита и т. Д.
Вы видели уроки phpOCR Андрея Кучеренко? http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html Это старая статья, но может вам помочь.