Articles of domdocument

Проблема php с русским языком

Я получаю страницу в utf-8 с русским языком, используя curl. если я эхо текст, это хорошо. то я использую такой код $dom = new domDocument; /*** load the html into the object ***/ @$dom->loadHTML($html); /*** discard white space ***/ $dom->preserveWhiteSpace = false; /*** the table by its tag name ***/ $tables = $dom->getElementsByTagName('table'); /*** get […]

PHP DOMXPath удаляет мои теги внутри согласованного текста

Я задал этот вопрос вчера, и в то время это было именно то, что мне было нужно, но, работая с некоторыми живыми данными, я обнаружил, что это не совсем то, что я ожидал. Разбор HTML с HTML-кодом HTML DOMDocument Он получает данные со страницы HTML, но затем также удаляет все теги HTML внутри захваченного блока […]

PHP-скрипты командной строки игнорируют директивы php.ini и ini_set ('memory_limit', …)

Я столкнулся с общей «Неустранимая ошибка: вне памяти (выделено 30408704) (попытался выделить 24 байта) …» PHP Fatal error. Страницы, обслуживаемые через Apache, не демонстрируют такого поведения. Я пробовал следующее: Увеличьте memory_limit в php.ini до гораздо большего значения. Увеличение memory_limit внутри самого скрипта посредством вызовов ini_set('memory_limit', -1) , ini_set('memory_limit', '-1') , ini_set('memory_limit', 100000000) , ini_set('memory_limit', '128M') […]

loadHTML LIBXML_HTML_NOIMPLIED на фрагменте html генерирует неправильные теги

Использование флага LIBXML_HTML_NOIMPLIED с фрагментом html генерирует неправильные теги: $str = '<p>Lorem ipsum dolor sit amet.</p><p>Nunc vel vehicula ante.</p>'; $doc = new DOMDocument(); $doc->loadHTML($str, LIBXML_HTML_NOIMPLIED | LIBXML_HTML_NODEFDTD); echo $doc->saveHTML(); Выходы: <p>Lorem ipsum dolor sit amet.<p>Nunc vel vehicula ante.</p></p> Я нашел хаки, чтобы обойти это с помощью регулярных выражений, но это побеждает цель использования DOM. Я […]

Удалить родительский элемент, сохранить все внутренние дочерние элементы в DOMDocument с помощью saveHTML

Я манипулирую небольшим фрагментом HTML с XPath; когда я возвращаю измененный фрагмент обратно с помощью $ doc-> saveHTML (), добавляется DOCTYPE , а теги HTML / BODY обертывают вывод. Я хочу удалить их, но оставлю все дети внутри, используя только функции DOMDocument. Например: $doc = new DOMDocument(); $doc->loadHTML('<p><strong>Title…</strong></p> <a href="http://www….."><img src="http://" alt=""></a> <p>…to be one […]

Получение ценности брата / сестринского узла

Скажем, на странице у меня есть много повторений: <div class="entry"> <h4>Magic:</h4> <a>Edit</a> <a>Delete</a> </div> Но nodeValue h4 не повторяется. Как получить nodeValue a основе nodeValue тега h4 ? Получите содержание сестры узлов h4, где h4-контент – Magic:

PHP DomDocument, повторное использование XSLTProcessor, стабильно / безопасно?

Я использую функцию ниже, но не уверен, что она всегда безопасна … Разве? Нет DOM-памяти или «остаточного XSLT»? function XSLproc_reuse($domXsl) { static $XSLproc=NULL; if (!$XSLproc) $XSLproc = new XSLTProcessor(); return $XSLproc->importStylesheet($domXsl); // STABLE? } На нем нет будущих «неожиданных побочных эффектов»? PS: У меня есть некоторые странные ошибки с моей обработкой XSLT … Итак, отправляя […]

Производительность SimpleXML и DOMDocument

Я создаю синтаксический анализатор RSS, используя класс SimpleXML, и мне было интересно, будет ли использование класса DOMDocument улучшать скорость анализатора. Я разбираю rss-документ, который составляет не менее 1000 строк, и я использую почти все данные из этих 1000 строк. Я ищу метод, который займет минимум времени.

PHP GMAIL Контакты XML-анализ с помощью DOMDocument и cURL

То, что я пытаюсь получить в настоящее время, – это всего лишь атрибут gd: email, который является «адресом =» только с момента появления. Который я могу получить в xml-части, черт возьми, я могу даже получить любое заданное мнение, если оно будет указано, если оно есть внутри тегов, но, чтобы получить атрибут любого данного, как в […]

Как получить первый уровень элементов dom Domodocument PHP?

Как получить первый уровень элементов dom Domodocument PHP? Пример с кодом, который не работает – взят из Q & A: http: //stackoverflow.com/questions/1540302/how-to-get-nodes-in-first-level-using-php–domdocument <?php $str=<<< EOD <div id="header"> </div> <div id="content"> <div id="sidebar"> </div> <div id="info"> </div> </div> <div id="footer"> </div> EOD; $doc = new DOMDocument(); $doc->loadHTML($str); $xpath = new DOMXpath($doc); $entries = $xpath->query("/"); foreach ($entries […]