Мне нужно преобразовать вход HTML4 в действительный XHTML (строгий) в PHP5 для дальнейшей обработки (например, SAX). Какие-либо предложения?
Расширение PHP Tidy должно быть в состоянии выполнить эту работу.
Вот хорошая статья об этом: Уборка вашего HTML с помощью PHP 5 .