Articles of dom

Как очистить первый абзац от страницы википедии?

Скажем, я хочу захватить первый абзац на этой странице википедии . Как получить основной текст между полем заголовка и содержимого с помощью XPath или DOM и PHP или чего-то подобного? Есть ли для этого php-библиотека? Я не хочу использовать api, потому что он немного сложный. Примечание. Мне просто нужно добавить виджет под моими страницами, который […]

Поиск количества узлов в PHP, DOM, XPath

Я загружаю HTML в DOM, а затем запрашиваю его с помощью XPath в PHP. Моя текущая проблема заключается в том, как узнать, сколько совпадений было сделано, и как только это будет установлено, как мне получить к ним доступ? В настоящее время у меня есть это грязное решение: $i = 0; foreach($nodes as $node) { echo […]

Удалить всех детей из XML-узла PHP DOM

Я хочу удалить всех детей из XML-узла с помощью PHP DOM, есть ли разница между: A) while ($parentNode->hasChildNodes()){ $parentNode->removeChild($parentNode->childNodes->item(0)); } А ТАКЖЕ B) $node->nodeValue = ""; Я предпочитаю второй, кажется, что получаю тот же результат, но я не уверен. Спасибо, Карлос

php: parse html: извлекать теги скрипта из тела и вводить перед </ body>?

Мне все равно, что такое библиотека, но мне нужен способ извлечь <.script.> Элементы из <.body.> Страницы (в виде строки). Затем я хочу вставить извлеченные <.script.> S перед <./ body.>. В идеале я хотел бы извлечь <.script.> S в 2 типа; 1) Внешние (те, у которых есть атрибут src) 2) Встроенные (те, у которых есть код […]

PHP change DOM useragent

У меня есть этот простой код, чтобы получить название любой страницы <?php $doc = new DOMDocument(); @$doc->loadHTMLFile('http://www.facebook.com'); $xpath = new DOMXPath($doc); echo $xpath->query('//title')->item(0)->nodeValue."\n"; ?> Он отлично работает на всех страницах, которые я пробовал, но не в Facebook. Когда я пытаюсь в Facebook, он не отображается. Welcome to Facebook – Log In, Sign Up or Learn […]

Как индексировать XML-элементы в PHP?

Я фиктивный для PHP и XML, поэтому, пожалуйста, будьте терпеливы, если мой вопрос кажется немым. Я хочу знать, как индексировать элементы XML, чтобы я мог получить к ним доступ. Я планирую положить их в массив. Однако я не знаю, как получить количество возвращаемых элементов. Вот коды: exer.xml <?xml version="1.0" encoding="ISO-8859-1"?> <actionstars> <name>Jean Claude Van Damme</name> […]

Как удалить дубликаты, вложенные элементы DOM в PHP?

Предполагая, что у вас есть дерево DOM с вложенными тегами, я хотел бы очистить объект DOM, удалив дубликаты. Однако это должно применяться только в том случае, если тег имеет только один дочерний тег того же типа. Например, Исправить <div><div>1</div></div> а не <div><div>1</div><div>2</div></div> . Я пытаюсь выяснить, как это сделать, используя расширение DOM PHP . Ниже […]

Как включить сжатие gzip с помощью PHP Simple HTML DOM Parser

Я попробовал несколько вещей, чтобы включить сжатие gzip с помощью PHP Simple HTML DOM Parser, но пока ничего не работает. С помощью ini_set мне удалось изменить пользовательский агент, поэтому я решил, что возможно также включить сжатие gzip? include("simpdom/simple_html_dom.php"); ini_set('zlib.output_compression', 'On'); $url = 'http://www.whatsmyip.org/http_compression/'; $html = file_get_html($url); print $html; Веб-сайт выше проверяет его. Пожалуйста, дайте мне […]

Как я могу получить значения td с помощью dom и php

У меня есть таблица такая: <table> <tr> <td>Values</td> <td>5000</td> <td>6000</td> </tr> </table> И я хочу получить контент td. Но я не мог справиться с этим. <?PHP $dom = new DOMDocument(); $dom->loadHTML("figures.html"); $table = $dom->getElementsByTagName('table'); $tds=$table->getElementsByTagName('td'); foreach ($tds as $t){ echo $t->nodeValue, "\n"; } ?>

получить скрытое значение входного тега как строку, используя PHP простой HTML DOM

Я пытаюсь получить значения скрытого тега типа ввода (CAS, AH, 11 и т. Д.) Вместе с атрибутом name, но все, что я получаю, является пустой страницей при запуске моего парсера на основе PHP. Кто-нибудь знает, что случилось? Я уже проверил Grabbing скрытые входы как строку (используя PHP Simple HTML DOM Parser), но это не помогло. […]