В дополнение к моему предыдущему вопросу о разборе изображений и текста из сложного xml , проблема только в том, что я не получаю правильную кодировку. Текст находится в греческом языке, файл xml
имеет кодировку utf-8
. Это код для разбора xml:
$xml = simplexml_load_file('myfile.xml'); $descriptions = $xml->xpath('//item/description'); foreach ( $descriptions as $description_node ) { $description_dom = new DOMDocument(); $description_dom->loadHTML( (string)$description_node ); $description_sxml = simplexml_import_dom( $description_dom ); $imgs = $description_sxml->xpath('//img'); $text = $description_sxml->xpath('//div'); foreach($imgs as $image){ echo (string)$image['src']; } foreach($text as $t){ echo (string)$t; } }
Если i echo $description_node
, текст выглядит хорошо, но после того, как я получаю $description_dom
с simplexml_import_dom
он выглядит так: Ïε ιÏλαμικÎÏ ÎºÎ¿Î¹Î½ÏÏηÏεÏ.
Использование mb_convert_encoding
превращает его в: ýÃÂñù" ÃÂ
. Что я делаю неправильно?