Извлечение содержимого html-страницы в php

Существует какой-либо способ извлечь содержимое страницы HTML которая начинается с <body> и заканчивается </body> в php. Если кто-нибудь может отправить какой-нибудь образец кода.

Вы должны взглянуть на ссылку DOMDocument .

В этом примере читается html-документ, создается DOMDocument и получает тег body:

 libxml_use_internal_errors(true); $dom = new DOMDocument; $dom->loadHTMLFile('http://example.com'); libxml_use_internal_errors(false); $body = $dom->getElementsByTagName('body')->item(0); echo $body->textContent; // print all the text content in the body

Вы также должны проверить следующие ресурсы:

Документация DOM API
Спецификация языка XPATH

Попробуйте PHP Простой HTML DOM Parser

 $html = file_get_html('http://www.example.com/'); $body = $html->find('body');

Вы также можете попробовать использовать не-DOM-решение на основе функции strpos :

 $html = file_get_contents($url); $html = substr($html,stripos($html,'<body>')+6); $html = substr($html,0,strripos($html,'</body>'));

stripos – нечувствительная к регистру версия strpos , strripos – нечувствительная к регистру «крайняя позиция» версии strpos .

Надеюсь, что это поможет вам!