Какова наилучшая практика для восстановления некорректных XML-файлов с помощью PHP? Например, часть CDATA содержит незаконные символы. С регулярными выражениями? Или выполнить некоторые инструменты командной строки Linux?
Аккуратный
Tidy является связующим звеном для утилиты очистки и восстановления Tidy HTML, которая позволяет не только очищать и иным образом манипулировать HTML-документами, но также перемещаться по дереву документов.
// Specify configuration $config = array( 'indent' => true, 'input-xml' => true, 'output-xml' => true, 'wrap' => false); // Tidy $tidy = new tidy; $tidy->parseFile('sample.xml', $config); $tidy->cleanRepair(); // Output echo $tidy;