Преобразование HTML в RTF (конвертер HTML2RTF)

Я ищу простой конвертер HTML2RTF, который я могу использовать на своем веб-сайте, который использует * nix как операционная система. Я ничего не нашел в Интернете и надеялся, что сообщество SO поможет мне.

PS: Я не хочу реализовывать это с нуля, и на самом деле не имеет значения, на каком языке он находится, если я могу запустить его в системе типа * nix. Если вы, ребята, уже сделали какую-то персонализированную реализацию, предпочтительным языком будет PHP.

Самый простой способ – использовать следующий модуль PERL.

http://metacpan.org/pod/HTML::FormatRTF

Быстрое и около 10 строк кода 🙂

Если OpenOffice в командной строке является опцией, проверьте эту запись в форуме с большим количеством отправных точек. Конечно, есть и автономные инструменты, но OpenOffice обладает неплохими возможностями рендеринга, и я уверен, что он будет успешно конвертировать много, что другие конвертеры не будут (например, маркированные / пронумерованные списки).

Zopyx.convert основан на высококачественном синтаксическом анализаторе BeautifulSoup html. Для этого нужна Java & Jython.

Если зависимость Java слишком велика, вы должны иметь возможность использовать BeautifulSoup для итерации по HTMl и наращивания вывода с использованием генератора RTF PyRTF . Не пятиминутная задача!

Вы можете рассмотреть возможность комбинирования gnuhtml2latex и latex2rtf