Articles of html parsing

Создать массив из содержимого тегов <div> в php

У меня есть содержимое веб-страницы, назначенной переменной $html Ниже приведен пример содержимого $html : <div class="content">something here</div> <span>something random thrown in <strong>here</strong></span> <div class="content">more stuff</div> Как, используя PHP, я могу создать массив из того, что находит содержимое областей <div class="content"></div> подобных этому (для примера выше), поэтому: echo $array[0] . "\n" . $array[1]; //etc выходы something […]

Как получить строку из HTML с регулярным выражением?

Я пытаюсь разобрать блок с html-страницы, поэтому я пытаюсь выполнить preg_match этот блок с помощью php if( preg_match('<\/div>(.*?)<div class="adsdiv">', $data, $t)) но не работает </div> blablabla blablabla blablabla <div class="adsdiv"> я хочу grep только blablabla blablabla слова любая помощь

как извлечь текст из элемента html по id и назначить переменной php?

У меня есть это: <h4 class="modal-title" id="exampleModalLabel"> hello </h4> и я хочу извлечь слово hello, используя свой id и назначить это php var, но у меня нет идеи. Если бы это был вход, было бы легче, но я использовал бы другой элемент

Динамическое исключение контента в PHP Простой HTML DOM Parser

Я делаю PHP-приложение, которое будет получать контент с сайта с помощью PHP Simple HTML DOM Parser . Я хочу, чтобы исключить текст из двух тегов HTML из контента динамически. Если исходный код содержимого: Some description or content ETC ABC <span class="s"> May 3 2009 <b> ABC Some Text </b> Some photo or video… Я хочу […]

Удалить <br /> из тега <pre> </ pre>

Я сделал простой скрипт BBCode, и все работает отлично. Но потом я использую javascript-библиотеку, чтобы украсить мои коды в <pre></pre> . Теперь единственная проблема, с которой я сталкиваюсь, что у меня есть теги <br /> после каждой строки кода в тегах <pre></pre> . Поэтому вопрос заключается в том, как удалить теги <br /> которые используются […]

Использование DOMDocument для анализа HTML с помощью JS-кода

Я беру HTML в качестве строки, а затем разбираю его, чтобы изменить все ссылки href на что-то еще. Это работает, однако, когда на HTML-странице есть некоторые теги скриптов JS, т.е. <script> он удаляется! Например, эта строка: <script type="text/javascript" src="/js/jquery.js"></script> Получено Изменено: [removed][removed] Тем не менее, я хотел бы сохранить все. Это моя функция: function parse_html_code($code, […]

Simplexml: синтаксический анализ HTML оставляет вложенные элементы внутри элемента с текстовым узлом

Я пытаюсь разобрать конкретный html-документ, какой-то словарь, содержащий около 10000 слов и описание. Это прошло хорошо, пока я не заметил, что записи в определенном формате не получают синтаксический анализ. Вот пример: <?php $html = ' <p> <b> <span>zot; zotz </span> </b> <span>Nista; nula. Isto <b>zilch; zip.</b> </span> </p> '; $xml = simplexml_load_string($html); var_dump($xml); ?> Результатом […]

PHP-HTML-парсинг :: Как можно взять значение кодировки веб-страницы с помощью простого анализатора html dom?

PHP :: Как можно взять значение кодировки веб-страницы с помощью простого анализатора html dom (utf-8, windows-255 и т. Д.)? замечание: его нужно сделать с помощью html dom parser http://simplehtmldom.sourceforge.net Пример 1: ввод в кодировку веб-страницы: <meta content="text/html; charset=utf-8" http-equiv="Content-Type"> Результат: UTF-8 Пример2: ввод символа веб-страницы: <meta content="text/html; charset=windows-255" http-equiv="Content-Type"> Результат: окна-255 Редактировать: Я пробую это […]

Сохранение смещений файлов при разборе HTML с помощью DOM?

Я хочу изменить атрибуты <img src=""> в не слишком искаженном HTML (сообщения WordPress). Я знаю, что могу взять простой способ и использовать регулярные выражения, но я боюсь, что люди в синих пушистых костюмах придут ко мне во сне . Если я использую парсер DOM для чтения HTML и изменения тегов <img> , я боюсь, что […]

Как я могу найти содержимое первого тега h3?

Я ищу регулярное выражение, чтобы найти содержимое первого <h3> . Что я могу использовать там?

Intereting Posts
Используя pdo query () и пользовательский getValue () на том же объекте базы данных? Как я могу поместить результаты подготовленного оператора MySQLi в ассоциативный массив? Почему мой 301 Redirect занимает так много времени? установить сеанс в базе данных в php Проблема с отправкой объекта JSON через POST в Google Gears Изображения DOMPDF не отображаются на новом сервере php Установить анонимную функцию в экземпляре Динамически назначать псевдоним всем именам полей в запросе msyql изменить CakePhp1.3 URL-адрес назначения paginator? Ошибка сертификата SSL не может получить сертификат локального эмитента Какая лучшая логика для переключения языка в Laravel? Поймать фатальное исключение и продолжить как отсортировать многомерный массив с помощью внутреннего ключа phpunit 3.7: что случилось с аннотацией @assert? Проверка проверки JQuery, если значение существует в базе данных