Articles of html parsing

PHP DOMDocument, поиск определенных элементов

Я ищу, чтобы найти конкретный атрибут определенного элемента в документе HTML с помощью PHP DOMDocument. В частности, существует div с уникальным набором классов и только один интервал внутри него. Мне нужно получить атрибут стиля этого элемента span. Пример: <div class="uniqueClass"><span style="text-align: center;" /></div> В этом примере, когда uniqueClass является единственным экземпляром этого класса в документе, […]

Regex PHP, сопоставить все ссылки с определенным текстом

Я ищу регулярное выражение в PHP, которое будет соответствовать якорю с определенным текстом на нем. Например, я хотел бы получить привязки с текстом mylink как: <a href="blabla" … >mylink</a> Поэтому он должен соответствовать всем якорям, но только если они содержат определенный текст. Поэтому он должен соответствовать этим строкам: <a href="blabla" … >mylink</a> <a href="blabla" … […]

Получить данные только из таблицы html, используемой preg_match_all в php

У меня есть таблица html: <table … > <tbody … > <tr … > <td …> string… </td> <td …> string… </td> <td …> string… </td> <td …> string… </td> <td …> string… </td> </tr> <tr … > <td …> string… </td> <td …> string… </td> <td …> string… </td> <td …> </td> <td …> […]

PHP: пример формы, который будет шифровать строку запроса (GET) (скрытие данных, а не безопасность)

Я намерен использовать GET для своей формы, но хотел бы зашифровать значения в строке запроса, чтобы пользователи не могли ее изменить. (не для безопасности, а для скрытия данных) Я столкнулся с несколькими веб-сайтами, которые объяснили шифрование, но мне не ясно, как реализовать его, как только пользователь нажмет кнопку отправки. Пример: http://myscriptlibrary.wordpress.com/2010/04/14/how-to-encrypt-query-string-in-php/ Есть ли пример, который […]

php regex для извлечения данных из таблицы HTML

Я пытаюсь сделать регулярное выражение для вывода некоторых данных из таблицы. код, который у меня есть сейчас: <table> <tr> <td>quote1</td> <td>have you trying it off and on again ?</td> </tr> <tr> <td>quote65</td> <td>You wouldn't steal a helmet of a policeman</td> </tr> </table> Это я хочу заменить на: quote1: вы пытаетесь снова и снова? quote65: Ты […]

Symfony DomCrawler: найдите элемент с определенным значением атрибута

Я использую компонент DomCrawler: http://symfony.com/doc/current/components/dom_crawler.html Я хотел бы, используя синтаксис CSS, получить элемент с определенным значением атрибута. Вот код, который я использую: $link = $crawler->filter('#product a[data-type="bla"]'); Кажется, что это работает, поскольку следующее возвращает 1: echo count($link); Однако я никогда не могу фильтровать дальше этого. Я не могу: $link->filter('img')->attr('src'); В результате появляется следующее сообщение об ошибке: […]

Как извлечь img src, title и alt из html с помощью php?

Я хотел бы создать страницу, где все изображения, которые находятся на моем веб-сайте, перечислены с заголовком и альтернативным представлением. Я уже написал мне небольшую программу для поиска и загрузки всех HTML-файлов, но теперь я застрял в том, как извлечь src , title и alt из этого HTML: <img src ="/image/fluffybunny.jpg" title ="Harvey the bunny" alt […]

Очистка HTML путем удаления лишних / избыточных тегов форматирования

Я использовал редактор CKEditor wysiwyg для веб-сайта, где пользователям разрешено использовать HTML-редактор для добавления комментариев. В итоге у меня был очень избыточный вложенный HTML-код в моей базе данных, который замедляет просмотр / редактирование этих комментариев. У меня есть комментарии, которые выглядят так (это очень маленький пример. У меня есть комментарии с более чем 100 вложенными […]

Как вы анализируете и обрабатываете HTML / XML в PHP?

Как можно разобрать HTML / XML и извлечь из него информацию?

как печатать ячейки таблицы с простым html dom

У меня есть этот html-код. Я использую Simple HTML Dom для анализа данных в моем собственном сценарии php. <table> <tr> <td class="header">Name</td> <td class="header">City</td> </tr> <tr> <td class="text">Greg House</td> <td class="text">Century City</td> </tr> <tr> <td class="text">Dexter Morgan</td> <td class="text">Miami</td> </tr> </table> Мне нужно получить текст внутри TDs в массиве, например: $ array [0] = массив […]