HTML парсер

Программирование на Visual Basic, главный форум. Обсуждение тем программирования на VB 1—6.
Даже если вы плохо разбираетесь в VB и программировании вообще — тут вам помогут. В разумных пределах, конечно.
Правила форума
Темы, в которых будет сначала написано «что нужно сделать», а затем просьба «помогите», будут закрыты.
Читайте требования к создаваемым темам.
Cellard
Новичок
Новичок
 
Сообщения: 49
Зарегистрирован: 15.10.2002 (Вт) 22:10
Откуда: Russia

HTML парсер

Сообщение Cellard » 18.02.2005 (Пт) 21:58

Некоторые сайты (а конкретно www.gismeteo.ru) продают информацию в xml формате. Эту инфу, понятно, можно разобрать и использовать по своему усмотрению. Проблем с разбором нет - в xml все структурировано по тегам и прочая и прочая...
А вот если денег не платить? Можно ли толково разбирать html страницу? Там мешанина из тегов... Вообще говоря, я, глядя на отформатированную страницу, могу "прочитать" информацию, значит и программу обучить можно. Может кто думал над подобной проблемой? Есть идеи?
Cellard

GSerg
Шаман
Шаман
 
Сообщения: 14286
Зарегистрирован: 14.12.2002 (Сб) 5:25
Откуда: Магадан

Сообщение GSerg » 19.02.2005 (Сб) 6:39

Ну вот, опять :)

Подключаем MS HTML Object Library и спокойно всё притыриваем :)
Как только вы переберёте все варианты решения и не найдёте нужного, тут же обнаружится решение, простое и очевидное для всех, кроме вас

DDK
Обычный пользователь
Обычный пользователь
 
Сообщения: 80
Зарегистрирован: 10.11.2004 (Ср) 17:55
Откуда: Moscow ct.

Сообщение DDK » 19.02.2005 (Сб) 12:26

Яндекс - найдётся всё. Google - найдёт всё, что не нашёл яндекс.

Cellard
Новичок
Новичок
 
Сообщения: 49
Зарегистрирован: 15.10.2002 (Вт) 22:10
Откуда: Russia

Сообщение Cellard » 20.02.2005 (Вс) 0:33

Ага, я наконец то понял, что меня не поняли... ;)
Мне не нужно объяснять, как получить файл из сети. Я интересуюсь существованием эффективного алгоритма поиска нужной информации в хаосе html кода.
Cellard

uhm
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1597
Зарегистрирован: 02.12.2004 (Чт) 15:21

Сообщение uhm » 20.02.2005 (Вс) 2:49

Хаос, хаос... HTML - вполне себе структурированный язык. Найти в нем что-то ничуть не более сложно, чем найти что-то, скажем, в текстовом файле. Поскольку ты не объясняешь, что конкретно тебе нужно, не могу дать никаких конкретных алгоритмов поиска, но, честно говоря, не вижу никаких особых проблем в том, чтобы что-то найти в HTML-файле.
Быть... или не быть. Вот. В чём вопрос?

Cellard
Новичок
Новичок
 
Сообщения: 49
Зарегистрирован: 15.10.2002 (Вт) 22:10
Откуда: Russia

Сообщение Cellard » 20.02.2005 (Вс) 9:07

Вот эти две страницы (1 и 2) вызывают у меня тоску...
Cellard

DDK
Обычный пользователь
Обычный пользователь
 
Сообщения: 80
Зарегистрирован: 10.11.2004 (Ср) 17:55
Откуда: Moscow ct.

Сообщение DDK » 20.02.2005 (Вс) 12:32

Cellard
В той теме, ссылку на которую я те дал, ты всё найдёшь... почитай повнимательнее.
Яндекс - найдётся всё. Google - найдёт всё, что не нашёл яндекс.

Cellard
Новичок
Новичок
 
Сообщения: 49
Зарегистрирован: 15.10.2002 (Вт) 22:10
Откуда: Russia

Сообщение Cellard » 21.02.2005 (Пн) 10:03

Прочитал тему до конца. Получается, что ты ищешь нужную тебе информацию зная номер строки... Значит, если на сайте слегка меняется код страниц такая программа перестает работать. А где гарантии, что код на сайте маняться не будет?

А XML хорош тем, что информацию ты ищешь в обрамлении тега. Это развращает :)
Cellard

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Сообщение alibek » 21.02.2005 (Пн) 10:14

Cellard, а ты не ищи по номеру строки.
Ты ищи нужный TABLE, а в нем нужную строку и столбец.
Lasciate ogni speranza, voi ch'entrate.


Вернуться в Visual Basic 1–6

Кто сейчас на конференции

Сейчас этот форум просматривают: AhrefsBot, Majestic-12 [Bot], Yandex-бот и гости: 33

    TopList