PHP: как очистить содержимое веб-сайта на основе Javascript

Я пытаюсь получить содержание этого сайта, используя PHP simplehtmldom library.

http://www.immigration.govt.nz/migrant/stream/work/workingholiday/czechwhs.htm "

Он не работает, поэтому я попытался использовать CURL:

function curl_get_file_contents($URL) { $c = curl_init(); curl_setopt($c, CURLOPT_RETURNTRANSFER, 1); curl_setopt($c, CURLOPT_URL, $URL); $contents = curl_exec($c); curl_close($c); if ($contents) return $contents; else return FALSE; } 

Но всегда приходите только с кодом JS и содержимым:

 <noscript>Please enable JavaScript to view the page content.</noscript> 

Есть ли возможность решить эту проблему с помощью PHP? В этом случае я должен использовать PHP, поэтому мне нужно смоделировать браузер на основе JS.

Большое спасибо за любые советы.

В этом случае я должен использовать PHP, поэтому мне нужно смоделировать браузер на основе JS.

Я бы рекомендовал вам два способа:

  1. Используйте плагин v8js php для работы с js сайта при скребке. См. Здесь пример использования.
  2. Имитировать браузер на основе JS через использование Selenium , iMacros или webRobots.io Chrome ext. Но в этом случае вы работаете с PHP-скриптами.