Articles of html parsing

Странная ошибка с использованием PHP Simple HTML DOM parser

Я использую эту библиотеку (PHP Simple HTML DOM parser), чтобы разобрать ссылку, вот код: function getSemanticRelevantKeywords($keyword){ $results = array(); $html = file_get_html("http://www.semager.de/api/keyword.php?q=". urlencode($keyword) ."&lang=de&out=html&count=2&threshold="); foreach($html->find('span') as $e){ $results[] = $e->plaintext; } return $results; } но я получаю эту ошибку, когда выводю результаты: Неустранимая ошибка: вызов функции-члена функции () для не-объекта в /var/www/vhosts/efamous.de/subdomains/sandbox/httpdocs/getNewTrusts.php в строке 25 […]

PHP DOM: разбор HTML-списка в массив?

Я хочу превратить список html в массив, $string = ' <a href="#" class="something">1</a> <a href="#" class="something">2</a> <a href="#" class="something">3</a> <a href="#" class="something">4</a> '; Я работаю над методом DOM, $dom = new DOMDocument; $dom->loadHTML($string); foreach( $dom->getElementsByTagName('a') as $node) { $array[] = $node->nodeValue; } print_r($array); результат, Array ( [0] => 1 [1] => 2 [2] => 2 […]

php regex для получения строки внутри тега href

Мне нужно регулярное выражение, которое даст мне строку внутри тега href и внутри кавычек. Например, мне нужно извлечь theurltoget.com в следующем: <a href="theurltoget.com">URL</a> Кроме того, мне нужна только часть базового url. Т.е. из http://www.mydomain.com/page.html я только хочу http://www.mydomain.com/

Как следует анализировать фоновые изображения PHP (простой html dom parser) и другие изображения веб-страницы?

Как следует анализировать с PHP (простой html dom / etc ..) фон и другие изображения веб-страницы? case 1: inline css <div id="id100" style="background:url(/mycar1.jpg)"></div> case 2: css внутри html-страницы <div id="id100"></div> <style type="text/css"> #id100{ background:url(/mycar1.jpg); } </style> case 3: отдельный файл css <div id="id100" style="background:url(/mycar1.jpg);"></div> external.css #id100{ background:url(/mycar1.jpg); } Случай 4: изображение внутри тега img решение […]

Разбирайте таблицу html с помощью file_get_contents в php-массив

Я пытаюсь проанализировать приведенную здесь таблицу в многомерном массиве php. Я использую следующий код, но по какой-то причине возвращает пустой массив. После поиска в Интернете я нашел этот сайт, на котором я получил функцию parseTable (). От чтения комментариев на этом веб-сайте я вижу, что функция работает отлично. Поэтому я предполагаю, что что-то не так […]

как анализировать содержимое из html-файла с помощью CURL?

Я хочу проанализировать содержимое XHTML с помощью CURL. Как отменить номер транзакции, вес, высоту, ширину между тегами <table> . Как отменить только содержимое из этого документа HTML и получить его как массив с помощью CURL? transactions.php <table border=0 cellspacing=0 width=100%> <tr> <td colspan="2">&nbsp;</td> </tr> <tr> <td width="30%" class="Mellemrubrikker">Transaction Number::</td> <td width="70%">24752734576547IN</td> </tr> <tr> <td width="30%" […]

jQuery-подобный интерфейс для PHP?

Мне было любопытно, существует ли интерфейс / библиотека jQuery-стиля для PHP для обработки файлов HTML / XML, особенно с помощью селекторов стиля jQuery. Я хотел бы делать такие вещи (все гипотетические): foreach (j ("div> p> a") в качестве якоря) { // … } print j ("# some_id") -> html (); print j ("a") -> eq […]

Замените новые строки тегами BR, но только внутри тегов PRE

На складе PHP5, что является хорошим выражением preg_replace для создания этого преобразования: замените символы новой строки на <br /> , но только внутри <pre> блоков (Не стесняйтесь делать упрощающие предположения и игнорируйте угловые случаи. Например, мы можем предположить, что теги будут одной строкой, а не такими патологическими вещами, как) Текст ввода: <div><pre class='some class'>1 2 […]

CodeIgniter: класс / библиотека, чтобы помочь получить метатеги с веб-страницы?

Я использую codeigniter. Думаю, не имеет значения, какую инфраструктуру php я использую. Но прежде чем я напишу свой собственный класс, есть еще один, который уже написан, который позволяет пользователю получать заголовок страницы и метатеги (ключевые слова, описания) любого сидеть … если они есть. Любой класс PHP, который делает это, будет замечательным. Спасибо всем

Получить все элементы по имени класса с помощью DOMDocument

На этот вопрос, похоже, много раз отвечали, но я все еще не могу скомпоновать эти штуки. Я хотел бы получить значение узла для каждого класса по имени. например <td class="thename"><strong>32</strong></td> <td class="thename"><strong>12</strong></td> я хотел бы захватить 32 и 12. Я предполагаю, что это требуется для типа цикла, но точно не знает, как это реализовать. Вот […]

Intereting Posts
Chrome просто не загружает файлы JS Как использовать WHERE IN с Doctrine 2 Как получить переменные системной среды в PHP при запуске CLI и Apache2Handler? Можем ли мы сохранить данные ckeditor в файл doc Получение файла на сервере, изменение размера с помощью PHP GD2, соображения безопасности Проверка формы Laravel 5.2 не показывает ошибок? Как преобразовать дату ISO8601 в другой формат в PHP? Подзапрос в doctrine2 notIN Функция Ошибка при использовании PHP cURL с сертификатами SSL Как заставить определенную версию TLS в контексте потока PHP для транспорта ssl: //? Хеширование пароля с использованием crypt не работает при входе в систему, на котором отображается неправильный пароль Выровнять десятичные данные в столбце таблицы на десятичную точку, HTML5, CSS3 PHP LDAP Получить атрибуты пользователя, включая ассоциированные группы Как добавить File \ MimeType Validator в Zend Framework 2 Model Declaration Как получить токен обновления и токен доступа в офисе 365 с помощью PHP