Articles of sax

Android SAX Parser с образцом символов новой строки?

У меня есть веб-служба PHP, которая возвращает вывод XML, а один из тегов содержит многострочные данные «\ n» String. Моя проблема: все «\ n» удаляются после передачи данных XML через SAX-анализатор по умолчанию, но я действительно не хочу, чтобы это произошло! Я хочу сохранить все символы «\ n» новой строки в теге, чтобы я мог […]

Как разбирать чрезвычайно большой XML-файл в java или php и вставлять в DB mysql

Я пытаюсь проанализировать массивный XML-файл в моей базе данных MySQL. файл равен 4.7gb. Я знаю, его безумный. Данные поступают отсюда: http://www.discogs.com/data/ (самый новый альбом xml – 700mb zipped и 4.7gb unzipped) Я могу использовать java или php для анализа и обновления базы данных. Я предполагаю, что java – это более умная идея. Мне нужно найти […]

Разбор плохо форматированного HTML в PHP

В моем коде я конвертирую некоторый стиль xls document в html с помощью openoffice. Затем я разбираю таблицы с помощью xml_parser_create . Проблема в том, что openoffice создает oldschool html с незакрытыми тегами <BR> и <HR> , он не создает doctypes и не цитирует атрибуты <TABLE WIDTH=4> . Анализаторы php, которых я знаю, не нравятся, […]

Является ли XMLReader синтаксическим анализатором SAX, парсером DOM или нет?

Я тестирую различные методы для чтения (возможно, большого, с очень часто читаемыми) файлов конфигурации XML в PHP. Никакой письменности никогда не требуется. У меня есть две успешные реализации, одна из которых использует SimpleXML (который я знаю – DOM-парсер), а другой – с помощью XMLReader . Я знаю, что читатель DOM должен читать все дерево и […]