Возможный дубликат:
читать идентификатор тега XML из php
каков способ получения данных из определенного идентификатора div с помощью PHP. То, что я хочу сделать, – это получить данные из идентификатора div, называемого <div id="content">
, поэтому все данные из этого идентификатора div будут выбраны в переменной.
Я могу получить весь контент с помощью моего скрипта, но не могу его фильтровать, чтобы извлекать данные из определенного тега div.
Вот сценарий, который я использую для получения любого контента:
function file_get_contents_curl($url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); $data = curl_exec($ch); curl_close($ch); return $data; } $html = file_get_contents_curl("http://www.example.com"); //parsing all content: $doc = new DOMDocument(); @$doc->loadHTML($html); echo "$html";
Есть идеи?
Попробуйте это, но убедитесь, что вы загрузили и включили PHP Simple HTML DOM Parser
$html = file_get_html("http://www.example.com"); $displaybody = $html->find('div[id=content]', 0)->plaintext;
Их некоторые способы исключить контент из id div или идентификатора тега, например,
1) Использование регулярного выражения
2) Использование SimpleXML
3) с расширением DOM или XPath
С помощью простого HTML DOM Parser
<?php $content = file_get_contents_curl("http://www.example.com"); $html = file_get_html($content ); $ret = $html->find('div[id=divname]'); ?>