Articles of xpath

Как я могу выбрать только ближайший родительский узел текстовой строки, используя xpath для каждого соответствия

Примечание: это отличается от следующего вопроса тем, что здесь мы имеем значения, появляющиеся внутри узла и внутри дочернего узла того же узла: XPath содержит (текст (), «некоторая строка») не работает при использовании с узлом с более чем одним текстовым подзоном Учитывая следующий html: $content = '<html> <body> <div> <p>During the interim there shall be nourishment […]

PHP DOMXPath дает пустую строку для / @ ID

Упрощенный HTML <tr> <td class="orderOverviewAnotherColumn">0177-4066356</td> <a name="orderTableSorted:orderTable:10:j_id504" id="orderTableSorted:orderTable:10:j_id504" href="#"> </tr> <tr> <td class="orderOverviewAnotherColumn">0177-4066357</td> <a name="orderTableSorted:orderTable:11:j_id504" id="orderTableSorted:orderTable:11:j_id504" href="#"> </tr> <tr> <td class="orderOverviewAnotherColumn">0177-4066358</td> <a name="orderTableSorted:orderTable:12:j_id504" id="orderTableSorted:orderTable:12:j_id504" href="#"> </tr> <tr> <td class="orderOverviewAnotherColumn">0177-4066359</td> <a name="orderTableSorted:orderTable:13:j_id504" id="orderTableSorted:orderTable:13:j_id504" href="#"> </tr> Использование следующего кода в PHP libxml_use_internal_errors(true); $doc = new DOMDocument(); $doc->loadHTMLFile('448713409.html'); $xpath = new DOMXPath($doc); $vRes = $xpath->query(".//*[@id='orderTableSorted:orderTable:tbody_element']/tr[contains(.,'4066356')]//a[contains(@id,':j_id504')]/@ID"); foreach ($vRes as […]

Xpath Regex в PHP не работает

Вот мой XML, который возвращается: <?xml version="1.0" encoding="utf-8"?> <lists> <list> <id>6791</id> <title><![CDATA[List 1]]></title> <type>0</type> <priority>0</priority> <due><![CDATA[0000-00-00 00:00:00]]></due> <notes><![CDATA[]]></notes> <user_id>49211</user_id> <owner><![CDATA[]]></owner> <item1> <done>0</done> <title><![CDATA[Bamboo Montage-83 Knee High Studded Contrast Colored Zipper Riding Boot – Brown PU]]></title> <barcode>B00H2Y2UY6</barcode> <priority>2</priority> <item_id>57741</item_id> </item1> <item2> <done>0</done> <title><![CDATA[List 2]]></title> <barcode><![CDATA[]]></barcode> <priority>2</priority> <item_id>57751</item_id> </item2> <item3> <done>0</done> <title><![CDATA[List Item 1]]></title> <barcode><![CDATA[]]></barcode> <priority>2</priority> <item_id>57761</item_id> […]

Удалите несколько пустых узлов с помощью SimpleXML

Я хочу удалить все пустые узлы в моем XML-документе, используя SimpleXML Вот мой код: $xs = file_get_contents('liens.xml')or die("Fichier XML non chargé"); $doc_xml = new SimpleXMLElement($xs); foreach($doc_xml->xpath('//*[not(text())]') as $torm) unset($torm); $doc_xml->asXML("liens.xml"); с $xs = file_get_contents('liens.xml')or die("Fichier XML non chargé"); $doc_xml = new SimpleXMLElement($xs); foreach($doc_xml->xpath('//*[not(text())]') as $torm) unset($torm); $doc_xml->asXML("liens.xml"); Я видел с print_r() что XPath что-то захватывает, […]

Получение непредвиденных результатов Xpath

Вот источник xml: xml Это xml файла fxg, созданного Adobe. Документ FXG является действительным xml, и он в основном содержит всю информацию для документа, который можно редактировать. Этот конкретный вопрос относится к тексту, который может быть изменен в FXG, чтобы контент мог измениться. Я пытаюсь захватить все элементы и атрибуты RichText внутри этого элемента, которые […]

DOM и xpath в случае разбора HTML-кода

Вот HTML, который я хотел бы проанализировать: $html = ' <h1>title</h1> <div id="main"> <div id="page"> <div class="article"> <h2><span>date1</span> <a href="link1">title1</a></h2> <p>text1</p> </div> <div class="article"> <h2><span>date2</span> <a href="link2">title2</a></h2> <p>text2</p> </div> </div> </div>'; Вот что я хотел бы получить: Array ( [0] => Array ( [link] => link1 [title] => title1 [description] => description1 [date] => date1 […]

xPath не извлекает HTML как часть того, что необходимо

Возможный дубликат: xPath не извлекает HTML как часть содержимого Я анализирую веб-страницу с помощью xPath и извлекаю содержимое элемента div, он опускает HTML, который содержится в этом элементе div. Как заставить его получить все содержимое элемента div с включенным HTML?

исключая двойной http из url

Я ссылаюсь на эту ссылку, чтобы извлечь URL-адрес с веб-страницы, содержащей конкретные слова regex для печати URL-адреса с любой веб-страницы со специальным словом в url но несколько URL-адресов, таких как pinterest и URL-адрес реферала facebook, содержат слова, которые мне интересны, но я не хочу использовать facebook, pinterest urls, поскольку они не являются прямым URL-адресом, поэтому […]

Проблемы с контентом и новыми линиями PHP XPath

Я использую DOMXPath для запроса узлов в HTML-документе, содержимое которого я хотел бы извлечь. У меня есть следующий HTML-документ: <p class="data"> Immediate Text <br> Text In Second Line <br> E-Mail: <script>Some Script Tag</script> <a href="#"> <script>Another Script Tag</script> Some Link In Third Line </a> <br> Text In Last Line </p> Я хотел бы получить следующий […]

Какой язык использовать для разбора xml для навигации

Я написал некоторый PHP-код для анализа XML-файла уже с SimpleXML, его довольно грязный, но может включать, если это поможет. Это выглядит как xml-файл (файл навигации, который был сделан действительно странно и не может быть изменен) <root name="menutest"> <menu> <nav name="home" path="index.php" /> <nav name="menulink1" path="link1.php"> <nav name="menulink1child1" path="menulink1childlink1.php"> <nav name="menulink1child1child1" path="menulink1childlink1childlink1.php" /> </nav> </nav> <nav […]