Articles of simple html dom

Получить данные из первого td в каждом tr

Я очищаю страницу, содержащую таблицу с несколькими tr. Внутри каждого tr есть четыре td, и я хочу получить данные из первого из этих td. Ниже приведен код, который я пробовал до сих пор, но он захватывает все td's. Как я могу выполнить то, что хочу? … $html = new simple_html_dom(); $html = file_get_html($url); foreach($html->find('table tr') […]

file_get_html странный вывод

Я написал очень маленький фрагмент кода, как вы можете видеть ниже. <?php include_once 'simple_html_dom.php'; $url = "http://passenger.cm.be/nl/contactpoints/723?service-1057"; $html = file_get_html($url); echo $html; ?> Когда я запускаю этот код на моем домашнем сервере, он покажет веб-страницу так, как должен. Однако, когда я загружаю его на свой онлайн-сервер, я получаю результат ниже: {"contactpoint_address_id":723,"hq":null,"id":723,"language":2,"name":"CM-kantoor Aalst","zf":12,"address":{"bus":null,"contactpoint_municipality_id":631,"id":723,"lat":50.93767,"lng":4.037621,"municipality_name_de":"AALST","municipality_name_fr":"AALST","municipality_name_nl":"AALST","number":"10","street":"HOPMARKT","street_de":"HOPMARKT","street_fr":"HOPMARKT","street_nl":"HOPMARKT","zip":9300,"town":{"cm_id":1,"description_nl":"AALST","description_fr":"AALST","description_de":"AALST","id":9300,"nis":9300,"zip":9300}},"region":{"cm_region_id":120,"description_de":"CM Midden-Vlaanderen","description_fr":"CM Midden-Vlaanderen","description_nl":"CM Midden-Vlaanderen","id":12},"contactpoint_services":[{"contactpoint_id":723,"id":1057,"remark_closingdays":null,"remark_general":null,"remark_id":null,"remark_openinghours":"De […]

простая html dom возвращающая строка вместо массива

У меня есть следующий код $html3->find('TR[d=lt]',0); для следующего исходного кода <TR> <TH NOWRAP ALIGN=RIGHT VALIGN=TOP> Date:</TH> <TD d="lt"> 2011-05-31 </TD> </TR> <TR> <TH NOWRAP ALIGN=RIGHT VALIGN=TOP>Title:</TH> <TD d="lt"> NETWORKS</TD> </TR> <TR> <TH NOWRAP ALIGN=RIGHT VALIGN=TOP>Title:</TH> <TD d="lt"> Low NETWORKS</TD> </TR> <TR> <TH NOWRAP ALIGN=RIGHT VALIGN=TOP>Description:</TH> <TD d="lt"> CD</TD> </TR> однако код возвращается только как строка […]

PHP – простой HTML DOM Parser – проблема с таблицей

Я получаю некоторые данные из cURL и хочу получить информацию, чтобы сохранить в другой базе данных. Результатом cURL является html-страница с отверстиями, поэтому я использую простой HTML DOM Parser, чтобы получить то, что я хочу. Проблема в том, что я хочу значения таблицы, но я получаю только tittles. Вот страница: <div id="conteudo"> <body> <div id="tab"> […]

Получить текст вне элементов

Я использую Simple html dom для очистки веб-сайта. Проблема, с которой я столкнулся, заключается в том, что текст помещается вне любого конкретного элемента. Единственный элемент, который, кажется, внутри, – это <div id="content"> . <div id="content"> <div class="image-wrap"></div> <div class="gallery-container"></div> <h3 class="name">Here is the Heading</h3> All the text I want is located here !!! <p> </p> […]

PHP simplehtmldom добавления атрибутов

Для проекта мне нужно захватить страницу (ЛЮБОЙ страницы в Интернете) и манипулировать ею. Я использую simplehtmldom для этого ( найденного здесь ), так как это легко и работает как шарм .. в основном .. Мне нужно установить атрибут класса для определенных элементов, некоторые из которых уже имеют атрибут класса, некоторые из которых «т. Согласно этой […]

Как заменить все теги ul и li на div с помощью PHP Simple HTML DOM Parser?

Хорошо, я хочу создать «мобилизатор сайта» с помощью PHP Simple HTML DOM Parser. На нынешнем этапе я хочу – измените все теги 'ul' и 'li' на тег 'div' и измените все элементы таблицы (например, table, tr, td, th) на div. Я пробовал обходной путь для первой проблемы следующим образом: , $html=new new simple_html_dom(); $html>load_file($sourceurl); $div="div"; […]

Цитирование через таблицу с помощью Simple HTML DOM

Я использую Simple HTML DOM для извлечения данных из HTML-документа, и у меня есть несколько проблем, с которыми мне нужна помощь. В строке, начинающейся с if ($td->find('a')) я хочу разделить href и содержимое узла привязки отдельно и поместить их в отдельные переменные. Код, однако, не работает (см. Вывод эха в коде ниже). Каков наилучший способ […]

Дата фильтрации в PHP DOM

Я хочу заменить всю дату пробелом из загруженного содержимого, используя SIMPLE HTML PHP DOM PARSER (simplehtmldom.sourceforge.net). Вот код: include("simple_html_php_dom.php"); $html = file_get_html("http://freebacklinks.prijm.com"); //example.com $result = "$html"; $result = preg_replace("/([1-9]|[0-2][0-9]|3[0-1]) (Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec) [0-9]{4}/", " ", $result); $result = preg_replace("/(Jan|Feb|Mar|Apr|May|Jun|Jul|Aug|Sep|Oct|Nov|Dec) ([1-9]|[0-2][0-9]|3[0-1]) [0-9]{4}/", " ", $result); echo $result; Итак, здесь все данные о дате, такие как: 01 Jan 2004 […]

PHP: простой HTML DOM Parser – несколько атрибутов в find ()?

Я использую простой HTML DOM Parser, но не могу понять, как получить элементы с двумя или более подходящими атрибутами. К сожалению, чтобы получить первые 2 div, это не сработает: $html = "<div title='test a' class='a' >test a</div> <div title='test b' class='b' >test b</div> <div title='test c' class='c' >test c</div>"; $htmldom = str_get_html($html); $ab = $htmldom->find("div[class=a][class=b]"); […]