Существует какой-либо способ извлечь содержимое страницы HTML
которая начинается с <body>
и заканчивается </body>
в php. Если кто-нибудь может отправить какой-нибудь образец кода.
Вы должны взглянуть на ссылку DOMDocument
.
В этом примере читается html-документ, создается DOMDocument
и получает тег body:
libxml_use_internal_errors(true); $dom = new DOMDocument; $dom->loadHTMLFile('http://example.com'); libxml_use_internal_errors(false); $body = $dom->getElementsByTagName('body')->item(0); echo $body->textContent; // print all the text content in the body
Вы также должны проверить следующие ресурсы:
Документация DOM API
Спецификация языка XPATH
Попробуйте PHP Простой HTML DOM Parser
$html = file_get_html('http://www.example.com/'); $body = $html->find('body');
Вы также можете попробовать использовать не-DOM-решение на основе функции strpos
:
$html = file_get_contents($url); $html = substr($html,stripos($html,'<body>')+6); $html = substr($html,0,strripos($html,'</body>'));
stripos
– нечувствительная к регистру версия strpos
, strripos
– нечувствительная к регистру «крайняя позиция» версии strpos
.
Надеюсь, что это поможет вам!