Articles of html parsing

Странная ошибка с использованием PHP Simple HTML DOM parser

Я использую эту библиотеку (PHP Simple HTML DOM parser), чтобы разобрать ссылку, вот код: function getSemanticRelevantKeywords($keyword){ $results = array(); $html = file_get_html("http://www.semager.de/api/keyword.php?q=". urlencode($keyword) ."&lang=de&out=html&count=2&threshold="); foreach($html->find('span') as $e){ $results[] = $e->plaintext; } return $results; } но я получаю эту ошибку, когда выводю результаты: Неустранимая ошибка: вызов функции-члена функции () для не-объекта в /var/www/vhosts/efamous.de/subdomains/sandbox/httpdocs/getNewTrusts.php в строке 25 […]

PHP DOM: разбор HTML-списка в массив?

Я хочу превратить список html в массив, $string = ' <a href="#" class="something">1</a> <a href="#" class="something">2</a> <a href="#" class="something">3</a> <a href="#" class="something">4</a> '; Я работаю над методом DOM, $dom = new DOMDocument; $dom->loadHTML($string); foreach( $dom->getElementsByTagName('a') as $node) { $array[] = $node->nodeValue; } print_r($array); результат, Array ( [0] => 1 [1] => 2 [2] => 2 […]

php regex для получения строки внутри тега href

Мне нужно регулярное выражение, которое даст мне строку внутри тега href и внутри кавычек. Например, мне нужно извлечь theurltoget.com в следующем: <a href="theurltoget.com">URL</a> Кроме того, мне нужна только часть базового url. Т.е. из http://www.mydomain.com/page.html я только хочу http://www.mydomain.com/

Как следует анализировать фоновые изображения PHP (простой html dom parser) и другие изображения веб-страницы?

Как следует анализировать с PHP (простой html dom / etc ..) фон и другие изображения веб-страницы? case 1: inline css <div id="id100" style="background:url(/mycar1.jpg)"></div> case 2: css внутри html-страницы <div id="id100"></div> <style type="text/css"> #id100{ background:url(/mycar1.jpg); } </style> case 3: отдельный файл css <div id="id100" style="background:url(/mycar1.jpg);"></div> external.css #id100{ background:url(/mycar1.jpg); } Случай 4: изображение внутри тега img решение […]

Разбирайте таблицу html с помощью file_get_contents в php-массив

Я пытаюсь проанализировать приведенную здесь таблицу в многомерном массиве php. Я использую следующий код, но по какой-то причине возвращает пустой массив. После поиска в Интернете я нашел этот сайт, на котором я получил функцию parseTable (). От чтения комментариев на этом веб-сайте я вижу, что функция работает отлично. Поэтому я предполагаю, что что-то не так […]

как анализировать содержимое из html-файла с помощью CURL?

Я хочу проанализировать содержимое XHTML с помощью CURL. Как отменить номер транзакции, вес, высоту, ширину между тегами <table> . Как отменить только содержимое из этого документа HTML и получить его как массив с помощью CURL? transactions.php <table border=0 cellspacing=0 width=100%> <tr> <td colspan="2">&nbsp;</td> </tr> <tr> <td width="30%" class="Mellemrubrikker">Transaction Number::</td> <td width="70%">24752734576547IN</td> </tr> <tr> <td width="30%" […]

jQuery-подобный интерфейс для PHP?

Мне было любопытно, существует ли интерфейс / библиотека jQuery-стиля для PHP для обработки файлов HTML / XML, особенно с помощью селекторов стиля jQuery. Я хотел бы делать такие вещи (все гипотетические): foreach (j ("div> p> a") в качестве якоря) { // … } print j ("# some_id") -> html (); print j ("a") -> eq […]

Замените новые строки тегами BR, но только внутри тегов PRE

На складе PHP5, что является хорошим выражением preg_replace для создания этого преобразования: замените символы новой строки на <br /> , но только внутри <pre> блоков (Не стесняйтесь делать упрощающие предположения и игнорируйте угловые случаи. Например, мы можем предположить, что теги будут одной строкой, а не такими патологическими вещами, как) Текст ввода: <div><pre class='some class'>1 2 […]

CodeIgniter: класс / библиотека, чтобы помочь получить метатеги с веб-страницы?

Я использую codeigniter. Думаю, не имеет значения, какую инфраструктуру php я использую. Но прежде чем я напишу свой собственный класс, есть еще один, который уже написан, который позволяет пользователю получать заголовок страницы и метатеги (ключевые слова, описания) любого сидеть … если они есть. Любой класс PHP, который делает это, будет замечательным. Спасибо всем

Получить все элементы по имени класса с помощью DOMDocument

На этот вопрос, похоже, много раз отвечали, но я все еще не могу скомпоновать эти штуки. Я хотел бы получить значение узла для каждого класса по имени. например <td class="thename"><strong>32</strong></td> <td class="thename"><strong>12</strong></td> я хотел бы захватить 32 и 12. Я предполагаю, что это требуется для типа цикла, но точно не знает, как это реализовать. Вот […]

Intereting Posts
Создание массива без ключей в цикле Как найти первый неповторяющийся символ из строки? API Google: аутентифицировать запрос с помощью OAuth, но без окна согласия пользователя, затем запрашивать данные Google для определенного имени пользователя или идентификатора пользователя Как настроить ответ косой черты на весь канал? php 5.3 Недопустимые символы CLI Как сохранить PNG-изображение на стороне сервера, из базы данных base64 javascript MySQL. Как выбрать строки, где долгота и широта разделены запятой на основе long / lat? Как использовать Angular 2 в приложении PHP? Как заменить каждый другой экземпляр определенного символа в строке MySQL? Могу ли я иметь несколько $ _GET с одним и тем же ключом, разные значения? Как управлять одним сеансом PHP5 на нескольких серверах Apache? Проверка, является ли массив многомерным или нет? Функция как значение массива Не удается отправить сгенерированную форму Синтаксическая ошибка при возврате оператора