Существует какой-либо способ извлечь содержимое страницы HTML которая начинается с <body> и заканчивается </body> в php. Если кто-нибудь может отправить какой-нибудь образец кода.
Вы должны взглянуть на ссылку DOMDocument .
В этом примере читается html-документ, создается DOMDocument и получает тег body:
libxml_use_internal_errors(true); $dom = new DOMDocument; $dom->loadHTMLFile('http://example.com'); libxml_use_internal_errors(false); $body = $dom->getElementsByTagName('body')->item(0); echo $body->textContent; // print all the text content in the body
Вы также должны проверить следующие ресурсы:
Документация DOM API
Спецификация языка XPATH
Попробуйте PHP Простой HTML DOM Parser
$html = file_get_html('http://www.example.com/'); $body = $html->find('body');
Вы также можете попробовать использовать не-DOM-решение на основе функции strpos :
$html = file_get_contents($url); $html = substr($html,stripos($html,'<body>')+6); $html = substr($html,0,strripos($html,'</body>'));
stripos – нечувствительная к регистру версия strpos , strripos – нечувствительная к регистру «крайняя позиция» версии strpos .
Надеюсь, что это поможет вам!