Articles of html parsing

Удаление символов из переменной, созданной с использованием preg_replace

Поэтому я пытаюсь взломать несколько символов в конце URL-адреса, который я получаю от функции preg_replace. Однако, похоже, он не работает. Я не знаком с использованием этих переменных в preg_replace (это было просто то, что я нашел, что «в основном» работал). Вот моя попытка: function addlink_replace($string) { $pattern = '/<ul(.*?)class="slides"(.*?)<img(.*?)src="(.*?)"(.*?)>(.*?)<\/ul>/is'; $URL = substr($4, 0, -8);; $replacement […]

Разбирайте HTML и получите многомерный массив с датой с использованием регулярного выражения (скребущие данные)?

Я пытаюсь сгруппировать результаты, я получаю мудрый день. Пожалуйста, напишите мой предыдущий вопрос. Как игнорировать ссылку http в строке и возвращать все остальное? В принципе, сейчас я получаю список расписаний, но в нем нет какой-либо даты. Поэтому трудно понять, какое событие будет происходить вживую, с какой датой и временем, это путает людей из-за отсутствия даты, […]

Получение массива изображений на HTML-странице с помощью PHP

Я получаю изображения из каталога, используя php. Изображения отображаются на странице PHP (getUser.php), но как эти изображения могут отображаться на любом HTML. getUser.php <?php $dir = 'images'; $file_display = array('jpg','jpeg','png','gif'); if (file_exists ($dir) == false) { echo 'Directory \'', $dir, '\' not found!'; } else{ $dir_contents = scandir($dir); foreach($dir_contents as $file) { $file_type = strtolower(end(explode('.', […]

Он! P с элементами PHP DOM

Я пытаюсь получить автоматически синонимы с словами, используя CURL, но у меня проблемы. Это часть HTML-кода, загружаемого с помощью curl, где синонимы: «vagabunda», «piriguete», «vagabundagem», «gandaia» и т. Д. <div class="box_palavra_escolhida"> <img src="../img/icone-livro.png" width="41px" height="35px" border="0" alt="imagem icone livro" /> <a class="link_escolhida" href="dicsin_edicao.php?id=26708" title="Vagabunda"> Vagabunda </a> <a class="link_escolhida_sinonimo" href="dicsin_sinonimo_edicao.php?id=26708"> Adicionar palavra</a> </div> <div class="palavras_encontradas"> <div […]

cURL Отправка полей POST после загрузки страницы (curl_exec)?

Я должен создать бота для сбора некоторых данных с моего веб-сайта в колледже, он использует вход simeple с полями regno и captcha, они не используют реальный captcha, его поддельный (можно увидеть в источнике страницы). Поэтому моя идея – использовать DOM Parser и получить его, например Я использую PHP-Curl для выполнения этой задачи. Мой код: ` […]

Искать блок текста, возвращать ссылки в формате MP3 с помощью PHP

Я только что столкнулся с некоторыми проблемами с некоторыми PHP в моем последнем проекте. В основном у меня есть блок текста ( $text ), и я бы хотел найти этот текст и вернуть все ссылки в формате MP3. Я знаю, что это имеет какое-то отношение к регулярным выражениям, но я просто не могу заставить его […]

Php проанализировал таблицу html и подсчитал значение <td>, похожее на другое

Этот вопрос следует другому, просто решен здесь Теперь я хочу сделать другой счет, который сложнее понять. В моей анализируемой таблице HTML каждая строка содержит два очень похожих и последовательных слова «td» ( число 4 и 5 ): <tr> (1) <td class="tdClass" ….</td> (2) <td class="tdClass" ….</td> (3) <td class="tdClass" ….</td> (4) <td class="tdClass" align="center" nowrap="">No</td> […]

PHP DOM перемещает узлы HTML и дочерние узлы

Я использую код для выделения всех тегов <td> с HTML-страницы: $dom = new DOMDocument; $dom->loadHTML($html); foreach ($dom->getElementsByTagName('td') as $node) { $array_data[ ] = $node->nodeValue; } Это сохраняет данные в моем массиве. Рассматриваемые html-данные: <tr> <td>DATA 1</td> <td><a href="12345">DATA 2</a></td> <td>DATA 3</td> </tr> $array_data : Array([0])=>DATA 1 [1]=>DATA 2 [2]=> DATA 3) Мой желаемый результат – […]

Как я могу извлечь данные из таблицы HTML в PHP?

Возможный дубликат: Как анализировать и обрабатывать HTML с помощью PHP? Предположим, я хочу извлечь из таблицы определенный номер / текст из таблицы: http://www.fifa.com/associations/association=chn/ranking/gender=m/index.html Я хочу получить первый номер на правой таблице td в позиции рейтинга FIFA . Это будет 88 сейчас. При проверке это <td class="c">88</td> . Как я могу использовать PHP для извлечения информации […]

Парсер Html Dom получает первый элемент

Привет, я использую библиотеку simple_html_dom php для получения содержимого с другого сайта. У меня ниже html-структуры, <h1 class="nik_product_title" style="color: #000;"> DSLR D7100 <span class="new_big_parent"> <span class="new_big_child"> <span class="new_big_child1">new</span> </span> </span> </h1> Используя это @$html->find ( 'div[class=nik_block_product_main_info_component_inner] h1',0)->plaintext; Но я получаю вывод как DSLR+D7100new Как получить только первый простой текст, т. Е. Нужно извлечь только DSLR […]