Извлечение содержимого html-страницы в php

Существует какой-либо способ извлечь содержимое страницы HTML которая начинается с <body> и заканчивается </body> в php. Если кто-нибудь может отправить какой-нибудь образец кода.

    Вы должны взглянуть на ссылку DOMDocument .

    В этом примере читается html-документ, создается DOMDocument и получает тег body:

     libxml_use_internal_errors(true); $dom = new DOMDocument; $dom->loadHTMLFile('http://example.com'); libxml_use_internal_errors(false); $body = $dom->getElementsByTagName('body')->item(0); echo $body->textContent; // print all the text content in the body 

    Вы также должны проверить следующие ресурсы:

    Документация DOM API
    Спецификация языка XPATH

    Попробуйте PHP Простой HTML DOM Parser

     $html = file_get_html('http://www.example.com/'); $body = $html->find('body'); 

    Вы также можете попробовать использовать не-DOM-решение на основе функции strpos :

     $html = file_get_contents($url); $html = substr($html,stripos($html,'<body>')+6); $html = substr($html,0,strripos($html,'</body>')); 

    stripos – нечувствительная к регистру версия strpos , strripos – нечувствительная к регистру «крайняя позиция» версии strpos .

    Надеюсь, что это поможет вам!