Страница 1 из 1

Алгоритм Бойера-Мура

СообщениеДобавлено: 21.03.2008 (Пт) 18:44
Magok
Нет ли у кого алгоритма Бойера-мура (ну или ему подобных), для поиска строки в тексте?Желательно что бы в нем была возможность использования масок (регулярных выражений).
Реализация лучше всего на Visual Basic.

СообщениеДобавлено: 24.03.2008 (Пн) 4:51
Matew

СообщениеДобавлено: 24.03.2008 (Пн) 12:16
Magok
Matew, спасибо за ссылку. Но только это не совсем мне надо. На том языке, на котором я пишу всё это дело не поддерживает Microsoft VBScript Regular expressions 5.5. Он просто очень похож на бэйсик (перевести я сам смогу).

СообщениеДобавлено: 24.03.2008 (Пн) 15:41
Хакер
Я не понял, ты что-ли хочешь исходник движка регэкспов?

СообщениеДобавлено: 24.03.2008 (Пн) 17:34
Magok
Хакер, нет, хотя если он есть, то не откажусь :)
Вообщем, я нашёл на делфях этот алгоритм, но мне не понятны вот такие записи BMT^ (с ^) (я так понимаю, что это работа с динамической структурой, хотя может я неправельно понимаю). Дак вот, суть теперь всего вопроса: как это реализовать на VB без динамики (без ListBox и т.д).
Код: Выделить всё
function WCBeginsWith( const P, S : String) : Boolean;
var
  i, lp : Integer;
begin
  Result := False;
  lp := Length(P);
  if lp > Length(S) then Exit;
  for i := 1 to lp do
  if (P[i]<>S[i]) and (P[i]<>'?') and (S[i]<>'?') then Exit;
  Result := True;
end;
function WCFindRightmost( const S, P : String;
  l : Integer) : Integer;
var
  i, j, lp : Integer;
begin
  Result := 0;
  lp := Length(P);
  if lp > l then Exit;
  for i := l - lp + 1 downto 1 do
  for j := 1 to lp do
  if (P[j]<>S[i+j-1]) and (P[j]<>'?') and (S[i+j-1]<>'?')
  then Break
  else if j = lp then
  begin
    Result := i;
    Exit;
  end;
end;
procedure WCMakeBMTable( var BMT : PBMTable;
  const P : String);
var
  i, j, lp, MaxShift, CurShift, SufPos : Integer;
  Suffix : String;
begin
  lp := Length(P);
  GetMem(BMT, SizeOf(TIntVect)*lp);
  if P[lp] = '?' then
  for i := 0 to 255 do BMT^[lp-1][i] := 0
  else
  begin
    for i := 0 to 255 do BMT^[lp-1][i] := lp;
    for i := lp downto 1 do
    if BMT^[lp-1][Byte(P[i])] = lp then
    BMT^[lp-1][Byte(P[i])] := lp - i;
  end;
  MaxShift := lp;
  for i := lp - 1 downto 1 do
  begin
    SetLength(Suffix, lp - i);
    Move(P[i+1], Suffix[1], lp - i);
    if WCBeginsWith(Suffix, P) then MaxShift := i;
    if P[i] = '?' then for j := 0 to 255 do BMT^[i-1][j] := 0
    else for j := 0 to 255 do
    begin
      CurShift := MaxShift;
      SetLength(Suffix, lp - i + 1);
      Suffix[1] := Char(j);
      Move(P[i + 1], Suffix[2], lp - i );
      SufPos := WCFindRightmost(P, Suffix, lp - 1);
      if SufPos <> 0 then
      CurShift := i - SufPos;
      BMT^[i-1][j] := CurShift;
    end;
    BMT^[i-1][Byte(P[i])] := 0;
  end;
end;