mshtml & VB 2005 .NET

Язык Visual Basic на платформе .NET.

Модераторы: Ramzes, Sebas

Грандж
Продвинутый пользователь
Продвинутый пользователь
 
Сообщения: 150
Зарегистрирован: 29.10.2002 (Вт) 14:10
Откуда: Москва

mshtml & VB 2005 .NET

Сообщение Грандж » 30.01.2006 (Пн) 11:50

использую Express Edition 2005, отсутствуем Microsoft.mshtml сборка. причём в .NET 2003 я вижу версии 1.1, а из 2005 эту же сборку не вижу.

короче задача. вэб-граббер.
использовать контролы WebBrowser не хочу.
использовать regexp'ы для получения текста из HTMLа не хочу.

нужно получить InnerText со страницы.
и между ног затеплилась надежда
(%

http://grunger.net.ru

Krasavica
Небожительница
Небожительница
Аватара пользователя
 
Сообщения: 1378
Зарегистрирован: 04.11.2003 (Вт) 17:51
Откуда: Россия, город-герой Москва ;-)

Сообщение Krasavica » 01.02.2006 (Ср) 16:43

А в чем чем проблема с регекспами? Я недавно правила подобный проект.
Всё построено именно на регекспах:
- исправляются все ссылки типа "papka/stranica.html" на "www.мой-сайт.ru/papka/stranica.html";
- все имейлы заменяются на спамо-безопасные ссылки;
- убирается всё цветовое оформление страницы.

Это, по-моему, самый удобный путь.

Другой вариант: ты скачиваешь целиком поток System.Net.HttpWebRequest и отправляешь его целиком юзеру. Тут вариант не безглючный, ссылки начинают криво работать, но рисунки и всё остальное, что отправляется сервером - грузится.

По поводу студий не знаю :) у меня 2003 и мне её возможностей хватает выше крыши :) а в 2005 по отзывам много проблем возникает и я пока не стала ее ставить. Но, скорее всего, надо просто перенести все тексты сборки - хотя бы копипастом, кроме того наверняка файлы проектов по умолчанию живут там в разных папках.
я - ангел!!! ...просто крылья в стирке, а нимб на подзарядке!
Меня трудно найти, легко потерять и невозможно забыть.Изображение

Грандж
Продвинутый пользователь
Продвинутый пользователь
 
Сообщения: 150
Зарегистрирован: 29.10.2002 (Вт) 14:10
Откуда: Москва

Сообщение Грандж » 02.02.2006 (Чт) 21:40

обычно я писал как:

Брал HttpWebResponse, отдавал его mshtml, получал raw text, а дальше регекспами забирал инфу, которая нужна.

ну я вроде mshtml прикрутил 1.1., так что проблем не должно возникнуть..

кстати я проапгрейдился на профешнл. рулез!
и между ног затеплилась надежда
(%

http://grunger.net.ru


Вернуться в Visual Basic .NET

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 43

    TopList