|
|
|||||
Регистрация: Nov 2010
Сообщений: 430
|
НЕ валидная XML
Здравствуйте.
Ситуация такая: есть большущая HTML, её нужно распарсить, пытаюсь это сделать представив её XML-кой, но проблема в том, что она получается НЕ валидная, т.е. при обработка постоянно прерывается или другими ошибками, но при этом браузер нормально её открывает. Подскажите, как можно распарсить? Может есть кой-нить не такой строгий режим для XML или еще что-нибудь?
__________________
Лучше спросить и выставить себя дураком на пять минут, чем не спросить и остаться дураком на всю жизнь. |
|
|||||
У XML-ки должен быть заголовок. Что-то вроде
может проблема в отсутствии заголовка?
__________________
interplanety |
|
|||||
Banned
[+1 30.08.14]
[+1 26.02.14] Регистрация: Apr 2012
Сообщений: 162
|
Скорее всего вне тегов что-то есть или теги не парные.
|
|
|||||
Регистрация: Nov 2010
Сообщений: 430
|
Нет, проблема неправильном написании некоторых элементов, где-то, допустим, тег не закрыт, или символ пропущен. Браузер это пережевывает без проблем, а вот XML относится более строго.
__________________
Лучше спросить и выставить себя дураком на пять минут, чем не спросить и остаться дураком на всю жизнь. |
|
|||||
strange mood
|
Html (в т.ч. html5) не является подмножеством xml, т.е. html-документ в общем случае не является валидным xml-документом.
Есть xhtml, но это частный случай, на который не стоит полагаться, если вам необходимо уметь парсить любые сторонние html-страницы. Добавлено через 4 минуты Если вы парсите какой-то отчет со строго определенной структурой, то можно попробовать тупо распарсить его регулярками.
__________________
тонкий тролль, осеянный благодатью |
Часовой пояс GMT +4, время: 17:56. |
|
« Предыдущая тема | Следующая тема » |
Теги |
xml , парсинг |
|
|