Как архивировать динамический (PHP) сайт как статический HTML?

Мы находимся в процессе закрытия Сети Беседы (включая подкаст IT-беседы ). План состоит в предоставлении статической HTML-версии наших веб-сайтов для постоянного хостинга в Интернет-архиве .

Каков самый простой способ генерации статического HTML из примерно 5000 динамических страниц, создаваемых в настоящее время динамически с PHP?

Я знаю, что мы можем настроить код для кэширования вывода PHP, записать его в файлы, а затем просмотреть файлы Sitemap для создания каждой страницы. Но мне интересно, есть ли какие-то варианты, которые мы должны рассмотреть. Любые инструменты для этого и соскабливание HTML как есть? (Что-то другое, чем Acrobat Pro?)

К сожалению, у нас также есть много вызовов Ajax, которые сделают это более сложным. Я предполагаю, что нам придется сначала отказаться от них.

Related of "Как архивировать динамический (PHP) сайт как статический HTML?"

К сожалению, есть большое программное обеспечение под названием « Teleport Pro » (квитанция об оплате), и он может создавать просматриваемые / дублированные копии веб-сайта. Который после загрузки на сервер должен работать точно так же, как и исходный сайт.

Следует помнить, что когда вы создаете статический html с динамических страниц;

  • Ваши текущие вызовы ajax должны быть неактивными (как вы сказали сами)
  • .htaccess, mod_rewrite, например, может сделать ваши статические файлы бесполезными. Потому что ссылки могут не работать.

Но «Teleport pro» – настоящая прочная программа, которая существует довольно давно. Я использовал его в прошлом и, вероятно, буду использовать его снова.


Другим подходом может быть php-модуль «php-apc», который создает кеш. В этом случае вам нужно будет сканировать весь сайт до создания полного кеша. Я не ТО, с этим знаком, но легко установить, и вы можете увидеть, могут ли сгенерированные файлы использовать.

Возможно, это не то, что вы ищете; но HTTrack будет просматривать ваш сайт для ссылок и сохранять HTML-версию. Это зеркало будет включать все статическое содержимое, которое связано, например, изображения, css и javascript.

Единственная проблема, о которой я могу думать, это то, что ваш AJAX-скрипт извлекает жизненно важные данные с сервера, но, возможно, HTTrack имеет для этого настройки.