php class html-dom dosen't возвращает весь html

Я хочу получить все ссылки с сайта www.gifgif.ir

все, что мне нужно / продукт, и они 360. но мне только 37.

Мой код:

<?php /** * Created by PhpStorm. * User: saleh * Date: 10/16/17 * Time: 9:58 PM */ set_time_limit(-1); header('Content-Type: text/html; charset=utf-8'); // example of how to use basic selector to retrieve HTML contents include('/home/saleh/Downloads/simple_html_dom_1_5/simple_html_dom.php'); // get DOM from URL or file $html = file_get_html('http://img.ruphp.com/php/www.gifgif.ir/'); $c=""; // find all image with full tag foreach($html->find('a') as $e){ if (isset($e->attr['href'])) { if (strstr($e->attr['href'], "/product")) { if ($c == $e->attr['href']) { } else { echo $e->attr['href'] . "\n"; $c= $e->attr['href']; } } } } ?> 

Но он возвращает только 10 ссылок. Что мне делать, чтобы вернуть все ссылки?

 http://img.ruphp.com/php/www.gifgif.ir/product/pId-2HnAXuEJBRdsM4 http://img.ruphp.com/php/www.gifgif.ir/product/pId-TeYhzl2oPwnIgr http://img.ruphp.com/php/www.gifgif.ir/product/pId-KoYUDejZa7Jc9m http://img.ruphp.com/php/www.gifgif.ir/product/pId-r1H0kayBexIcXF http://img.ruphp.com/php/www.gifgif.ir/product/pId-FaLdA5P4WqDyXi http://img.ruphp.com/php/www.gifgif.ir/product/pId-lYXV65Fw0NzB3e http://img.ruphp.com/php/www.gifgif.ir/product/pId-Gc1uxSp6tHFmhi http://img.ruphp.com/php/www.gifgif.ir/product/pId-Qe3TZltc2WEpvj http://img.ruphp.com/php/www.gifgif.ir/product/pId-ybZ2kPLewHojsd http://img.ruphp.com/php/www.gifgif.ir/product/pId-yJS8czqOMT7vjB 

Related of "php class html-dom dosen't возвращает весь html"

Содержимое на странице загружается динамически – первая страница обслуживается только подмножеством фактического HTML. Если вы просматриваете вкладку «Сеть» под инструментами разработчика в своем браузере по выбору, вы увидите, что она загружает содержимое (вызов getList ) при прокрутке.

Вам придется обойти это, сделав запросы к фактической конечной точке, которая загружает контент, а не просто читает начальный контент, обслуживаемый этой страницей. Поскольку я предполагаю, что создатель контента сайта не хочет, чтобы их API публиковал публично, я не собираюсь писать код, который на самом деле это делает, но вы должны иметь возможность создать цикл, который вызывает вызовы getList , анализирует HTML и извлекает соответствующие данные.