Предположим, у меня есть изображение, состоящее из белого фона и черного текста. Как извлечь текст из файла и сохранить его как png с прозрачным backgorund с помощью PHP?
Есть несколько библиотек PHP OCR , хотя я не уверен, что PHP будет лучшим инструментом для работы.
Если у вас уже есть изображение с использованием цветовой палитры (gif или png) и при условии, что верхний левый пиксель белого цвета в любом случае, вы можете просто использовать:
$im = imagecreatefrompng($filename); imagecolortransparent($im, imagecolorat($im, 0, 0));
В противном случае вам придется перебирать пиксели, находить белые (jpeg) и устанавливать их каждый. Вот еще несколько примеров: http://www.php.net/manual/en/function.imagecolortransparent.php
Это может помочь: Как я могу реализовать OCR на веб-сайте с помощью PHP?
На самом деле это не так прямо, чтобы извлечь текст из изображения. Процесс извлечения текста из изображений называется оптическим распознаванием символов (OCR), является одним и тем же системным сканером, который используется для «чтения» документов и импорта их непосредственно в виде текста.
Для PHP есть библиотека, которая работает с таким признанием, проверьте это: http://sourceforge.net/projects/phpocr/ .