Articles of parsing

Удалите все теги HTML + содержимое из текста

Хорошо, так, как это может показаться, я все еще не в состоянии сделать правильно. Я попытался с RegEx, я даже попытался разбор DOM, но все еще не смог понять это правильно. Основываясь на ответе в моем предыдущем вопросе ( Попытка удалить HTML-теги (+ контент) из String ), вот что я получил: public static function removeHtmlTags($str) […]

PHP-HTML-парсинг :: Как можно взять значение кодировки веб-страницы с помощью простого анализатора html dom?

PHP :: Как можно взять значение кодировки веб-страницы с помощью простого анализатора html dom (utf-8, windows-255 и т. Д.)? замечание: его нужно сделать с помощью html dom parser http://simplehtmldom.sourceforge.net Пример 1: ввод в кодировку веб-страницы: <meta content="text/html; charset=utf-8" http-equiv="Content-Type"> Результат: UTF-8 Пример2: ввод символа веб-страницы: <meta content="text/html; charset=windows-255" http-equiv="Content-Type"> Результат: окна-255 Редактировать: Я пробую это […]

PHP Простой HTML DOM Parser Dies

Я экранирую страницу с кучей подстраниц, используя Simple HTML DOM Parser. По какой-то причине он анализирует первые 40 подстраниц только отлично, но когда дело доходит до номера 41, он умирает без ошибок. Я сделал эту тестовую страницу и попытался зарегистрировать все, что я делаю в своем скрипте, а также некоторые из вложений в Simple DOM […]

Instagram API – получение только видео

Мне нужно получить ТОЛЬКО видео, помеченные определенным хэштегом. Я понимаю, что нет никакого способа получить только видеоролики, но как я могу разобрать через объект JSON, который я получаю, и использовать видео? Я изучал массив, и я не вижу поля, которое я мог бы надежно использовать, чтобы определить, был ли результат видео или фото (например, что-то […]

parse_url () возвращает ошибку, когда example.com передается

Согласно следующему коду, если $host_name что-то вроде example.com PHP возвращает уведомление: Message: Undefined index: host но на полные URL-адреса, такие как http://example.com PHP возвращает example.com . Я пробовал, если заявления с FALSE и NULL, но не работают. $host_name = $this->input->post('host_name'); $parse = parse_url($host_name); $parse_url = $parse['host']; Как я могу изменить скрипт, чтобы принять example.com и […]

PHP-анализ xml-файла

Я пытаюсь использовать simpleXML для получения данных из http://rates.fxcm.com/RatesXML. С помощью simplexml_load_file() меня были ошибки время от времени, так как этот сайт всегда имеет странные строки / номера до и после файла xml. Пример: 2000<?xml version="1.0" encoding="UTF-8"?> <Rates> <Rate Symbol="EURUSD"> <Bid>1.27595</Bid> <Ask>1.2762</Ask> <High>1.27748</High> <Low>1.27385</Low> <Direction>-1</Direction> <Last>23:29:11</Last> </Rate> </Rates> 0 Затем я решил использовать file_get_contents и […]

Отображение статей с сайта wordpress на сайте, отличном от WordPress.

Самый простой способ отображать записи статей, размещенные на сайте wordpress (из определенной категории), на другой сайт, не принадлежащий к WordPress, который построен в PHP / MySQL. Я понимаю, что wordpress использует MySQL, поэтому теоретически я могу подключиться через PHP к базе данных и напрямую вытащить содержимое, если я смогу вычислить используемую схему Я знаю, что […]

Лучший способ реализовать метаязык, скомпилированный до PHP

Я работал над спецификацией / kitchensink для метаязыка, который может скомпилироваться до PHP уже некоторое время. Теперь я хочу начать строить вещь. Прежде чем я применил крошечные DSL, используя PHP_Lexergenerator и PHP_Parsergenerator, и они отлично поработали, но я никогда не строил ничего такого масштаба раньше. Я был бы признателен за любые отзывы / предложения / […]

Загрузка XML с помощью SimpleXML не возвращает атрибуты для некоторых элементов

Я загрузил XML-файл, используя simplexml_load_file($filePath,'SimpleXMLElement', LIBXML_NOCDATA); И для большей части XML при условии, что он работает нормально. Однако для некоторых элементов в XML атрибуты не преобразуются в массив «@attributes», а вместо этого пропускают выходные данные. Вот пример: <UI_DEFINITION> <EDIT_PERMISSION>testPermission</EDIT_PERMISSION> <DEFAULT_VALUES> <display>hidden</display> <css_class>generic_css_class</css_class> <title>{tag}</title> <type>string</type> <wrapper_format>{value}</wrapper_format> <full_path>false</full_path> <mandatory>false</mandatory> <edit_permission>testPermission</edit_permission> <max_length>0</max_length> </DEFAULT_VALUES> <LOOKUPS> <DB_LOOKUP name="test3"> <VIEW>???</VIEW> <ID_FIELD>???</ID_FIELD> […]

cURL запрашивающий URL с пробелами в URL-адресе. Что делать

Поэтому я пытаюсь скрутить этот URL: http://images.fastcompany.com/upload/Screen shot 2011-04-28 в 8.13.21 PM.png URL-код, который кодируется, читается как: http%3A%2F%2Fimages.fastcompany.com%2Fupload%2FScreen+shot+2011-04-28+at+8.13.21+PM.png Однако завиток требует, чтобы он был правильно декодирован в правильный URL. Как мне обойти эту проблему? cURL сбрасывает остальную часть строки, как только она достигает любого пробела … 🙁 Я должен упомянуть, что я не могу обернуть […]