PHP ПАРСИНГ JS САЙТОВ

Php парсинг JS сайтов позволяет получать данные непосредственно из пользовательского интерфейса веб-страницы. Данные можно извлечь с использованием PHP библиотек, таких как Simple HTML DOM и PHP HTML Parser, которые позволяют анализировать HTML страницы в поисках нужных данных.

Для парсинга JS-сайтов с помощью PHP необходимо использовать библиотеки, которые способны выполнить выполняемый через JS код из HTML. Некоторые из них:

  • PhantomJS
  • Headless Chrome
  • CasperJS

Пример парсинга JS-сайта с использованием библиотеки Simple HTML DOM:

$curl = curl_init();$html = curl_exec($curl);curl_close($curl);$dom = new simple_html_dom();$dom->load($html);$span = $dom->find('span[id=my-span]', 0);echo $span->innertext;

В данном примере мы используем cURL, чтобы получить HTML-код страницы. Затем мы загружаем HTML-код в объект DOM и используем метод find(), чтобы найти тег span с id my-span, и выводим его содержимое с помощью свойства innertext.

Если нужно выполнить более сложный парсинг, то можно использовать Headless Chrome. Пример выполнения JS через браузер Chrome:

$url = "http://example.com";$chromeBin = '/usr/bin/google-chrome-stable';$res = exec($chromeBin . ' --headless --disable-gpu --dump-dom --virtual-time-budget=10000 --no-sandbox --disable-extensions --disable-dev-shm-usage --remote-debugging-port=9999 --no-first-run --no-default-browser-check \ about:blank ' . $url);$dom = new \DOMDocument();@$dom->loadHTML($res);$xpath = new \DOMXPath($dom);$elements = $xpath->query('//div[@class="some-class"]');foreach($elements as $element) { echo $element->nodeValue;}

В данном примере мы используем команду exec() для запуска Chrome в headless-режиме, который загружает страницу, выполнит JavaScript и вернет DOM-дерево. Затем мы ищем все div-элементы с классом 'some-class' и выводим их содержимое с помощью свойства nodeValue.

Парсинг: Как собрать данные с динамических сайтов? Практический урок на примере Wildberries

Парсинг сайтов на PHP. Библиотека DiDom. Урок 1

Парсинг сайтов на PHP. Как написать простой парсер и получить контент с других сайтов

Парсинг в Python за 10 минут!

cURL парсинг динамических страниц JavaScript - cURL parsing dynamic JavaScript pages

Парсинг сайтов на PHP. Всё что нужно знать о парсинге #1

Парсинг музыки с помощи PHP с сайта ruphp.com

Python парсинг сайтов с JavaScript - Инструмент для рендеринга JS

PHP для начинающих. Урок #15 - Работа по протоколу HTTP. Парсинг сайта с помощью регулярок.

Python парсинг динамических страниц сайтов с JavaScript Ajax

Реклама
Новое
Реклама