html-код страницы считывается со знаками вопроса

Программирование на Visual Basic for Applications
milla
Начинающий
Начинающий
 
Сообщения: 20
Зарегистрирован: 17.04.2012 (Вт) 15:26

html-код страницы считывается со знаками вопроса

Сообщение milla » 11.04.2014 (Пт) 17:37

Доброго дня! Может кто сможет объяснить, как так получается, что при считывании html-кода 2-х разных интернет страниц, одна страница читается нормально, а во второй русские буквы заменяются знаками вопроса? Кодировка у страниц одинаковая - windows-1251, со страницы http://lrnews.ru все считывается, как надо, а вот со страницы http://lipetsknews.ru все русские буквы читаются как "?". Вот код, каким считываю

Код: Выделить всё
Function GetText(ByVal URLadres As String) As String
Dim oHttp As Object

  On Error Resume Next
  Set oHttp = CreateObject("MSXML2.XMLHTTP")
  If Err.Number <> 0 Then
        Set oHttp = CreateObject("MSXML.XMLHTTPRequest")
  End If

  If oHttp Is Nothing Then
     GetText = ""
     Exit Function
  End If
  With oHttp
    .Open "GET", URLadres, False
    .Send
    GetText = .ResponseText
  End With
  On Error GoTo 0
  Set oHttp = Nothing

End Function

Qwertiy
Доктор VB наук
Доктор VB наук
 
Сообщения: 2753
Зарегистрирован: 26.06.2011 (Вс) 21:26

Сообщение Qwertiy » 11.04.2014 (Пт) 17:42

У первой кодировка utf-8, по крайней мере, если посылать запрос fiddler'ом.

milla
Начинающий
Начинающий
 
Сообщения: 20
Зарегистрирован: 17.04.2012 (Вт) 15:26

Re: html-код страницы считывается со знаками вопроса

Сообщение milla » 11.04.2014 (Пт) 17:55

у меня было такое подозрение, так как считываю не только эти 2 страницы, но и еще ряд других (у тех в meta-теге как раз стоит utf-8), пусть так. но проблема с http://lipetsknews.ru остается. как эти вопросики в нормальные буквы перевести? много гуглила по этому поводу, пробовала, вопросы исчезают, но появляются другие нечитаемые русским человеком символы. А мне нужно именно по русским фразам потом в файле поиск вести.


Вернуться в VBA

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 65

    TopList  
cron