Форум Flasher.ru

Форум Flasher.ru (http://www.flasher.ru/forum/index.php)
-   ActionScript 3.0 (http://www.flasher.ru/forum/forumdisplay.php?f=83)
-   -   НЕ валидная XML (http://www.flasher.ru/forum/showthread.php?t=206144)

Srednas 15.01.2014 14:22

НЕ валидная XML
 
Здравствуйте.

Ситуация такая: есть большущая HTML, её нужно распарсить, пытаюсь это сделать представив её XML-кой, но проблема в том, что она получается НЕ валидная, т.е. при обработка постоянно прерывается
Код:

Ошибка интерпретатора XML: элемент имеет неверный формат.
или другими ошибками, но при этом браузер нормально её открывает.

Подскажите, как можно распарсить? Может есть кой-нить не такой строгий режим для XML или еще что-нибудь?

Korchy 15.01.2014 14:25

У XML-ки должен быть заголовок. Что-то вроде
Код:

<?xml version="1.0" encoding="utf-8" ?>
может проблема в отсутствии заголовка?

Koopa 15.01.2014 14:29

Скорее всего вне тегов что-то есть или теги не парные.

Srednas 15.01.2014 14:30

Нет, проблема неправильном написании некоторых элементов, где-то, допустим, тег не закрыт, или символ пропущен. Браузер это пережевывает без проблем, а вот XML относится более строго.

Gaen 15.01.2014 14:51

Html (в т.ч. html5) не является подмножеством xml, т.е. html-документ в общем случае не является валидным xml-документом.
Есть xhtml, но это частный случай, на который не стоит полагаться, если вам необходимо уметь парсить любые сторонние html-страницы.

Добавлено через 4 минуты
Если вы парсите какой-то отчет со строго определенной структурой, то можно попробовать тупо распарсить его регулярками.

GBee 15.01.2014 15:05

в html даже тег <br> не валиден для хмл.
писал когда маленький парсер все бр закрывал - <br/>


Часовой пояс GMT +4, время: 00:29.

Copyright © 1999-2008 Flasher.ru. All rights reserved.
Работает на vBulletin®. Copyright ©2000 - 2024, Jelsoft Enterprises Ltd. Перевод: zCarot
Администрация сайта не несёт ответственности за любую предоставленную посетителями информацию. Подробнее см. Правила.