Парсинг таблиц в html

Программирование на Visual Basic, главный форум. Обсуждение тем программирования на VB 1—6.
Даже если вы плохо разбираетесь в VB и программировании вообще — тут вам помогут. В разумных пределах, конечно.
Правила форума
Темы, в которых будет сначала написано «что нужно сделать», а затем просьба «помогите», будут закрыты.
Читайте требования к создаваемым темам.
Amed
Алфизик
Алфизик
 
Сообщения: 5346
Зарегистрирован: 09.03.2003 (Вс) 9:26

Парсинг таблиц в html

Сообщение Amed » 13.04.2005 (Ср) 21:22

Сабж. Есть страница (предположим, такого вида :)).

Надо достать значения ячеек из указанной (по порядковому номеру) таблицы в документе. Желательно функцией вида strCell = GetCellValue (1,1).

Изыскания приводят в такую сторону:
Код: Выделить всё
Private hBrowser As New InternetExplorer
Private hCode As New MSHTML.HTMLDocument
Private hTable As New MSHTML.HTMLTable
Private e As MSHTML.HTMLGenericElement

'...

hBrowser.navigate "www.ya.ru"
Do While hBrowser.Busy = True
    DoEvents
Loop

For Each e In hBrowser.document.All
    If e.tagName = "TABLE" Then
        Set hTable = e
    End If
Next


Потом, по методике с http://am.rusimport.ru/MsAccess/f2.aspx?type=1&id=17158, нужно руками перебирать все теги <tr> и <td>, что не очень-то хочется. В объектной модели IHTMLTable отсутствует конструкция вида Cell(RowIndex, ColIndex).

Перебирать теги ручками или есть альтернатива?

FaKk2
El rebelde gur&#250;
El rebelde gur&#250;
Аватара пользователя
 
Сообщения: 2031
Зарегистрирован: 09.03.2003 (Вс) 22:10
Откуда: Los Angeles

Сообщение FaKk2 » 13.04.2005 (Ср) 22:03

Для получения ответа надо продемонстрировать качества, позволяющие стать компетентным — внимательность, вдумчивость, наблюдательность, желание активно участвовать в выработке решения.


Вернуться в Visual Basic 1–6

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 95

    TopList  
cron