Articles of parsing

PHP DOM перемещает узлы HTML и дочерние узлы

Я использую код для выделения всех тегов <td> с HTML-страницы: $dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('td') as $node) { $array_data[ ] = $node->nodeValue; } Это сохраняет данные в моем массиве. Рассматриваемые html-данные: <tr> <td>DATA 1</td> <td><a href="12345">DATA 2</a></td> <td>DATA 3</td> </tr> $array_data : Array([0])=>DATA 1 [1]=>DATA 2 [2]=> DATA 3) Мой желаемый результат – […]

PHP: анализ разделенных запятыми значений между квадратными скобками в многомерном массиве

У меня есть следующая строка: [aaaa,bbbb,cccc] [aaaa,bbbb,cccc] [aaaa,bbbb,cccc] [aaaa,bbbb,cccc] [aaaa,bbbb,cccc] и хотел бы проанализировать эту строку в многомерном массиве, который будет выглядеть так: 0 > ( 0 > aaaa, 1 > bbbb, 3 > cccc), 1 > ( 0 > aaaa, 1 > bbbb, 3 > cccc), 2 > ( 0 > aaaa, 1 > […]

Нужна помощь в очистке веб-страницы – получение конкретного контента …

У меня есть таблица, число столбцов которой может меняться в зависимости от конфигурации сломанной страницы (я не контролирую ее). Я хочу получить только информацию из определенного столбца, обозначенного заголовком столбцов. Вот упрощенная таблица: <table> <tbody> <tr class='header'> <td>Image</td> <td>Name</td> <td>Time</td> </tr> <tr> <td><img src='someimage.png' /></td> <td>Name 1</td> <td>13:02</td> </tr> <tr> <td><img src='someimage.png' /></td> <td>Name 2</td> […]

Разбор SOAP в PHP

Я создал SOAP-клиент в PHP: $client = new SoapClient("http://xxxx.net/Service/Service.svc?wsdl"); $response= $client->GetHotelNugget($data); Но я не могу разобрать ответ. Мне нужно значение <a:TITLE> . Вывод клиента SOAP: <s:Envelope xmlns:s="http://schemas.xmlsoap.org/soap/envelope/"> <s:Body> <GetHotelNuggetResponse xmlns="http://tempuri.org/"> <GetHotelNuggetResult xmlns:a="http://schemas.datacontract.org/2004/07/Model" xmlns:i="http://www.w3.org/2001/XMLSchema-instance"> <a:HotelNugget> <a:NUGGETNAME>Yaz Tatili Otelleri</a:NUGGETNAME> <a:NUGGETORDER>10</a:NUGGETORDER> <a:PARENTUNIQUECODE>AS_SOL_UST</a:PARENTUNIQUECODE> <a:REWRITENUGGETNAME>yaz-tatili-otelleri</a:REWRITENUGGETNAME> <a:TITLE>Yaz Tatili Otelleri</a:TITLE> <a:UNIQUECODE>YTOTL</a:UNIQUECODE> <a:WEBNUGGETID>306</a:WEBNUGGETID> </a:HotelNugget> <a:HotelNugget> <a:NUGGETNAME>Ramazan Fırsatları</a:NUGGETNAME> <a:NUGGETORDER>20</a:NUGGETORDER> <a:PARENTUNIQUECODE>AS_SOL_UST</a:PARENTUNIQUECODE> <a:REWRITENUGGETNAME>ramazan-firsatlari</a:REWRITENUGGETNAME> <a:TITLE>Ramazan Fırsatları</a:TITLE> <a:UNIQUECODE>RFIR</a:UNIQUECODE> […]

Как удалить теги HTML с помощью черного списка в PHP?

PHP strip_tags использует белый список для пропуска некоторых тегов, которые вы не хотите, избавлялись. Кто-нибудь знает какую-то реализацию, но использует черный список вместо белого списка?

PHP DOM Parser: найдите текст всех ссылок и измените его.

Я новичок в PHO DOM Parser. У меня есть строка вроде этого: $coded_string = "Hello, my name is <a href="link1">Marco</a> and I'd like to <strong>change</strong> all <a href="link2">links</a> with a custom text"; и я хотел бы изменить весь текст в ссылках (в примере, Марко и ссылки ) с пользовательской строкой, позвольте поздороваться . Как я […]

Извлечение детей из XML с помощью PHP

Хелле есть, есть сообщение: https://stackoverflow.com/questions/5816786/counting-nodes-in-a-xml-file-using-php У меня такой же вопрос, но вместо подсчета я хочу эхо Это. У меня этот код в xml: <?xml version="1.0" encoding="UTF-8" standalone="yes"?> <Root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"> <Row> <ModeNumber>1</ModeNumber> <Mode>online</Mode> </Row> <Row> <ModeNumber>2</ModeNumber> <Mode>mmorpg</Mode> </Row> И это как PHP: $xml = simplexml_load_file("include/gamemodes.xml"); foreach ($xml->Row->children() as $child) { echo $child->getName(), ": ", $child, "<br>"; […]

Получить название из ссылки, PHP Простой HTML DOM Parser

Я пытаюсь получить название из ссылки, которую я уже определил, это всего лишь последний бит с получением заголовка из той же ссылки. Чтобы найти нужную ссылку, я использую этот код: $html->find('a[href=http://mylink.se']'); Но я также хочу название из этой ссылки. Как мне это сделать?

Разбор HTML-страницы с использованием curl и xpath в PHP

Мне нужно разобрать эту веб-страницу https://www.galliera.it/118, получая цифры под цветными полосками. Это мой код (это не работает !!) … <?php ini_set('display_errors', 1); $url = 'https://www.galliera.it/118'; print "The url … ".$url; echo '<br>'; echo '<br>'; //#Set CURL parameters … $ch = curl_init(); curl_setopt($ch, CURLOPT_AUTOREFERER, TRUE); curl_setopt($ch, CURLOPT_HEADER, 0); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, […]

Разбор этой файловой структуры JSON

У меня есть файл с внутренними данными, отформатированными в формате json: { "данные": { «пользователи»: [ { "ragione_sociale": "", «ном»: «Аннамария Заккариелло», "indirizzo": "", "кепка": "", "citta": "", «провинция»: «», "telefono1": "", "telefono2": "", «факс»: «», «целлулар»: «», "codice_fiscale": "", «информационный бюллетень»: «1», "sesso": "", «имя пользователя»: «annamaria.zaccariello@libero.it», «scadenza_tessera»: «09/08/2012», «tipo_tessera»: «Красный ковер», «stato_tessera»: «0», […]