Привет, я очень новичок в скрипинге экрана. Я пытаюсь очистить отзывы от веб-сайта бронирования отелей, чтобы отобразить на моем ..
Я получил это далеко, но немного застрял. Может ли кто-нибудь помочь?
<?php $data = file_get_contents('http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx'); $regex = '/<div id="summary"> (.+?)</div>/'; preg_match($regex,$data,$match); var_dump($match); echo $match[1]; ?>
использовать DomDocument
<?php define('URL', 'http://www.laterooms.com/en/hotel-reviews/238902_the-westfield-bb-sandown.aspx'); $doc = new DOMDocument(); $doc->loadHTML(file_get_contents(URL)); $summary = $doc->getElementById('summary'); // also have $doc->getElementsByTagName , etc var_export($summary); ?>
Кроме того, для более сложных запросов вы должны рассмотреть возможность поиска в XPATH (использует синтаксис типа jQuery)