Articles of simple html dom

Файл не считывается с помощью file_get_html

Я использую curl для хранения веб-страницы в txt-файле, а затем чтения файла для анализа его содержимого. Для некоторых веб-сайтов он работает нормально, но для некоторых веб-сайтов он (file_get_html) возвращает null. Я проверил, что txt-файл генерируется с данными, но он не может прочитать содержимое. Для этого сайта, когда я использую прямую ссылку в file_get_html в то […]

Разбор html-страницы, которая имеет два разных формата для одних и тех же элементов

На одной и той же странице htmlТребуются два разных формата: первое: <div class="gs"><h3 class="gsr"><a href="http://www.example1.com/">title1</a> вторая: <div class="gs"><h3 class="gsr"><span class="gsc"></span><a href="http://www.example2.com/">title2</a> Как получить ссылки и заголовки в одном коде, который может обрабатывать этот два разных формата с помощью simple_html_dom? Я пробовал этот код, но он не работает: foreach($html->find('h3[class=gsr]') as $docLink){ $link = $docLink->first_child(); echo $link->plaintext; […]

Значение переменной PHP String to Int Conversion (с помощью simple_html_dom)

поэтому я использую simple_html_dom для анализа страницы для элементов с определенным классом. Я успешно извлекаю эти элементы, но не могу заставить их преобразовать их в используемые переменные (т. Е. Целое число, поэтому я могу сделать оператор «if»). Кажется, это какой-то объект, и я обыскал везде часами, но не повезло. Кажется, что нет простой поддержки simple_html_dom. […]

Простой HTML DOM, возвращающий false

Я столкнулся с чем-то странным при использовании Simple HTML DOM для анализа веб-страницы с определенной строкой запроса. Некоторые строки запросов работают при попытке проанализировать эту страницу подержанного автомобиля на веб-сайте дилера, однако другие нет. Кажется, что всякий раз, когда на странице появляется больше транспортных средств, оно не будет возвращать HTML-содержимое (это означает, что если мы […]

Извлечь doctype с помощью simple_html_dom

Я использую simple_html_dom для анализа веб-сайта. Есть ли способ извлечь doctype?

Как обмениваться PHP передовым преобразованием html dom?

Как я могу преобразовать advanced_html_dom.php str_get_html в преобразование HTML-объектов, не применяя htmlentities () для каждого содержимого элемента? Несмотря http://archive.is/YWKYp#selection-971.0-979.95 Целью этого проекта является замена Drop-in на базе DOM для простой библиотеки HTML html. … Если вы используете файл / str_get_html, вам ничего не нужно менять. Я нахожу include 'simple_html_dom.php'; $set = str_get_html('<html><title>&nbsp;</title></html>'); echo ($set->find('title',0)->innertext)."\n"; // […]

Авторизовать с помощью curl и parse с помощью простого html dom не работает

Я пытаюсь прочитать html-страницу, используя простой html dom, для которого требуется авторизация входа. например: http://example.com/login/ – страница входа в систему, а http://example.com/page/ – это где я должен разбирать html. Поэтому я использовал завиток, чтобы выполнить логин и простой html dom для разбора. Но я не знаю, зарегистрирована ли моя страница или нет, потому что когда […]

Простой HTML DOM str_replace в текстовом виде

Я пытаюсь создать что-то там, где он изменит весь текст на веб-странице и снова выведет его пользователю. Это будет изменение слов, предопределенных в базе данных. Я использую http://simplehtmldom.sourceforge.net как мой парсер HTML. То, что я хочу todo, – это изменить только тег внутри тегов, но не теги. Я думал, что это сработает. Если я откликнусь […]

Парсер Html Dom получает первый элемент

Привет, я использую библиотеку simple_html_dom php для получения содержимого с другого сайта. У меня ниже html-структуры, <h1 class="nik_product_title" style="color: #000;"> DSLR D7100 <span class="new_big_parent"> <span class="new_big_child"> <span class="new_big_child1">new</span> </span> </span> </h1> Используя это @$html->find ( 'div[class=nik_block_product_main_info_component_inner] h1',0)->plaintext; Но я получаю вывод как DSLR+D7100new Как получить только первый простой текст, т. Е. Нужно извлечь только DSLR […]

PHP простой HTML DOM Scrape Внешний URL

Я пытаюсь создать свой собственный проект, но я немного застрял при использовании класса Simple HTML DOM. То, что я хотел бы сделать, это очистить веб-сайт и получить все содержимое, а это внутренний html, который соответствует определенному классу. Мой код пока: <?php error_reporting(E_ALL); include_once("simple_html_dom.php"); //use curl to get html content $url = 'http://www.peopleperhour.com/freelance-seo-jobs'; $html = file_get_html($url); […]