Articles of parsing

DOMDocument для разбора HTML (вместо регулярного выражения)

Я пытаюсь изучить DOMDocument для анализа HTML-кода. Я просто делаю простую работу, мне уже понравился ответ Гордона на данные об утилизации с использованием regex и simplehtmldom и основал мой код на его работе. Я нашел документацию на PHP.net не так хорошо из-за ограниченной информации, почти нет примеров, и большинство особенностей были основаны на анализе XML. […]

Как решить ошибку JSON_ERROR_UTF8 в php json_decode?

Я пробую этот код $json = file_get_contents("http://www.google.com/alerts/preview?q=test&t=7&f=1&l=0&e"); print_r(json_decode(utf8_encode($json), true)); ////////////// // Define the errors. $constants = get_defined_constants(true); $json_errors = array(); foreach ($constants["json"] as $name => $value) { if (!strncmp($name, "JSON_ERROR_", 11)) { $json_errors[$value] = $name; } } // Show the errors for different depths. foreach (range(4, 3, -1) as $depth) { var_dump(json_decode($json, true, $depth)); echo […]

PHP найти и получить значение на основе другого из HTML-файла проанализированного файла

Я использую PHP Simple HTML DOM Parser для своего проекта. Я пытаюсь найти конкретные данные и повторить их после того, как я проанализирую мой .php-файл с веб-сайта URL, который содержит данные внутри элемента таблицы HTML, например: <table class="example"> <tbody> <tr> <td> Heading #1 <p>Description of heading #1 here …</p> </td> <td>Example of data #1</td> </tr> […]

Ручной анализ сырых данных multipart / form-data с помощью PHP

Кажется, я не могу найти реального ответа на эту проблему, поэтому я иду: Как вы анализируете необработанные данные запроса HTTP в формате multipart/form-data в PHP? Я знаю, что raw POST автоматически анализируется, если отформатирован правильно, но данные, которые я имею в виду, поступают из запроса PUT, который автоматически не обрабатывается PHP. Данные многочастны и выглядят […]

simplexml_load_file parse => Массив

Я пытаюсь разобрать этот XML-файл [0] => SimpleXMLElement Object ( [title] => Johannesburg in November [link] => SimpleXMLElement Object ( [@attributes] => Array ( [rel] => alternate [type] => text/html [href] => http://www.tompeters.com/dispatches/012120.php?rss=1 ) ) [id] => tag:www.tompeters.com,2011://2.12120 [published] => 2011-09-08T14:03:23Z [updated] => 2011-09-08T14:11:49Z [summary] => Tom will be giving a day-long presentation in November […]

Предварительный текст соответствия в php между html-тегами

Здравствуйте, я хотел бы использовать preg_match в PHP для анализа «желаемого текста» из следующего из html-документа <p class="review"> Desired text </p> Обычно я использовал simple_html_dom для таких вещей, но в этом случае он не может быть использован (этот элемент не отображается в каждом желаемом теге div, поэтому я вынужден использовать этот подход, чтобы отслеживать, когда […]

Анализ и создание файлов Microsoft Office 2007 (.docx, .xlsx, .pptx)

У меня есть веб-проект, где я должен импортировать текст и изображения из предоставленного пользователем документа, а одним из возможных форматов является Microsoft Office 2007. Также необходимо создавать документы в этом формате. Сервер запускает CentOS 5.2 и имеет установленный PHP / Perl / Python. Я могу выполнить локальные двоичные файлы и сценарии оболочки, если нужно. Мы […]

PHP YAML Parsers

Кто-нибудь знает хороший YAML Parser для PHP? Если да, каковы плюсы и минусы этой библиотеки?

Разбор строки в логическое значение в PHP

Сегодня я играл с PHP, и я обнаружил, что строковые значения «true» и «false» неправильно обрабатываются в boolean в условии, например, рассматривая следующую функцию: function isBoolean($value) { if ($value) { return true; } else { return false; } } Если я выполню: isBoolean("true") // Returns true isBoolean("") // Returns false isBoolean("false") // Returns true, instead […]

Какой RSS-парсер следует использовать в PHP?

Я ищу анализатор RSS, написанный на PHP. Проблема не в том, что я не могу ее найти. Проблема в том, что их слишком много, и трудно решить, какой из них использовать (особенно когда у меня нет опыта с ними, и попробовать их слишком много времени). Может ли кто-нибудь порекомендовать мне «хороший» RSS-парсер? Для меня важны […]