Преобразование PDF в HTML

Какое наилучшее решение для конвертирования PDF-документов для просмотра в браузере как HTML? На сайте есть несколько PDF-документов, и посетитель может щелкнуть по нему как HTML, и его следует просмотреть на экране в виде файла HTML.

Стандартный веб-сайт работает под управлением PHP, Linux, Apache.

    pdftohtml отлично работает: быстрый, стабильный, но результат html в лучшем случае уродлив. Я использовал его в течение некоторого времени для веб-сайта, который имеет много резюме работы.

    Однако это хорошее решение для извлечения текстового контента.

    Я бы попросил API-интерфейс scribd

    или API документов Google Apps. GOogle отлично справляется с отображением и преобразованием файлов PDF

    Рассматривали ли вы хранение данных PDF в базе данных, а затем либо динамическое создание PDF-файла, либо страницы html в зависимости от того, что выбрали посетители?

    Если у вас есть доступ к командной строке у вашего хостинг-провайдера, есть утилита pdftohtml внутри пакета poppler_utils.

    http://poppler.freedesktop.org/

    Выглядит довольно прост в использовании, не вызвал его изнутри PHP, но он должен работать.

    Если вы готовы вызвать Java с PHP, вы можете посмотреть http://www.jpedal.org/html_index.php