Темыч, Зенитчик и все остальные Help!!!

Разговоры на любые темы: вы можете обсудить здесь какой-либо сайт, найти единомышленников или просто пообщаться...
SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 20.02.2009 (Пт) 17:08

Так как я очень плохо воспринимаю абстрактые данные прошу помощи показать на практике (по-шагово если можно на реальной грамматике)
1. Устранение неоднозначностей грамматики. Для примера возьмем грамматику
exp-->exp op exp
exp-->id
op-->+
op-->*


Задача переделать такую грамматику на однозначную. Зная при этом возможность неоднозначности разбора предложения id+id*id.
В итоге получаем два дерева разбора....ну ту я думаю ясно

2.Принцип устранения левой рекурсии, но вот здесь мне бы интересно увидеть реальную грамматику (ну более менее реальную)
Здесь есть пара подпунктов
2.1. Устранение непосредственной левой рекурсии, например при грамматике
S-->Sa
2.2.Устранение рекурсии при выводе за два и более шага
S-->Aa|b
A--Ac|Sd|e

когда получаем вывод
S=>Aa=>Sda

Теория то есть, но вот не могу понять как это в реале происходит
Пишите жизнь на чистовик.....переписать не удастся.....

Ramzes
Скромный человек
Скромный человек
Аватара пользователя
 
Сообщения: 5004
Зарегистрирован: 12.04.2003 (Сб) 11:59
Откуда: Из гробницы :)

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Ramzes » 20.02.2009 (Пт) 18:06

SLIM, где твоя совесть? пятница! вечер! Только позитифф :drunken:

SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 20.02.2009 (Пт) 18:17

Ramzes писал(а):SLIM, где твоя совесть? пятница! вечер! Только позитифф :drunken:

Так я че я ниче....я так..побаловаться

З.Ы. С отлучкой Хакера и редкими приходами Рэя и незахода Гайдара с редкими встречами Алибека тут развелось нереально много флууудддааа
Ну да ладно. Мож кто че по теме скажет
Пишите жизнь на чистовик.....переписать не удастся.....

Ramzes
Скромный человек
Скромный человек
Аватара пользователя
 
Сообщения: 5004
Зарегистрирован: 12.04.2003 (Сб) 11:59
Откуда: Из гробницы :)

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Ramzes » 20.02.2009 (Пт) 18:18

а где флуд? флуд мы в миг прекратим, если он в тематических разделах :wink:

SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 20.02.2009 (Пт) 18:25

Ramzes писал(а):а где флуд? флуд мы в миг прекратим, если он в тематических разделах :wink:

Отмазался....мы тут за два дня ( и я в том числе) зафлудили две темы...нереальный парадокс - зафлудить темы нетематического раздела - нонсонс.
Но тем не менее...кто-то тут про смену профессии говорил а мы туда фотки свои стали выкладывать, я тут про синтаксический анализ, а ты ту про пазитифко....

Вот мы все гады (ну ладно,накинешся щас...только я гад) :lol:

UPD
Мама, сообщение за номером 666...пипец, что-то будет
Пишите жизнь на чистовик.....переписать не удастся.....

Viper
Артефакт VBStreets
Артефакт VBStreets
Аватара пользователя
 
Сообщения: 4394
Зарегистрирован: 12.04.2005 (Вт) 17:50
Откуда: Н.Новгород

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Viper » 21.02.2009 (Сб) 7:40

SLIM писал(а):Мама, сообщение за номером 666...пипец, что-то будет
Ну че будет, че будет, забаним! :mrgreen: :mrgreen: :mrgreen:
Весь мир матрица, а мы в нем потоки байтов!

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 21.02.2009 (Сб) 8:10

1. Букварный пример же.
exp-->exp + exp
exp-->term
term-->term * term
term-->id

2.1. очевидно, S-->aS

2.2. Эквивалентное определение: A-->Ac|Aad|bd|e
а теперь
A1-->cA1|adA1|
A-->bdA1|eA1
Изображение

SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 21.02.2009 (Сб) 12:29

tyomitch писал(а):1. Букварный пример же.
exp-->exp + exp
exp-->term
term-->term * term
term-->id

Ты меня не понял, по какому правилу это делается, вот что я хотел узнать :drunken:
tyomitch писал(а):2.1. очевидно, S-->aS

Это очень не очевидно.
Например как ты поступишь при
E-->E+T|T

Ну и опять таки какое правило то
Пишите жизнь на чистовик.....переписать не удастся.....

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 21.02.2009 (Сб) 14:14

1. Для каждого приоритета создаётся новый нетерминал.
2. Очевидно, E-->T+E|T
Ну видно же, что язык T(+T)* равен (T+)*T
Изображение

SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 21.02.2009 (Сб) 15:14

ммм, таки да....теперь понял
Пишите жизнь на чистовик.....переписать не удастся.....

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 21.02.2009 (Сб) 17:57

SLIM, нафиг ты залез сюда, мой способ задания правил разбора круче 8)

P.S. Выходи в mail.ru-агент.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 21.02.2009 (Сб) 22:48

Так поделись же своим мега-способом с общественностью!
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 22.02.2009 (Вс) 7:40

НУ, идею я уже раскрыл, хотя изначально не хотел.
А реализацию (т.е. dll-шки с функциями) --- боюсь что общественность в ней не разберётся без доки, а доку я писать не буду.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 22.02.2009 (Вс) 14:31

Так твоя идея распознаёт только регулярные языки?
Слабовато.
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 22.02.2009 (Вс) 14:37

Моя идея универсальна. Она ничего не знает о тех данных, которые она распознаёт (будь то исполняемый код или скрипт на PHP), и в принципе может обрабатывать всё, что угодно.

Это DFA. На базе DFA построен и декомпилятор x86-кода, и мега-быстрый словарь и парсер.

Над DFA построен TKN, упрощающий построение обработчика для текстовых типов данных (парсеров для xml, ini, языков программирования и т.п.).
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 22.02.2009 (Вс) 14:43

Что такое TKN, я не знаю, но при помощи DFA ты даже правильность расстановки скобок не проверишь, не то чтобы распознавать ЯП.
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 22.02.2009 (Вс) 15:06

Правильность расстановкее скобок я при помощи DFA проверю (с чего ты взял, что не проверю? :| ). Правда не на этапе токенизации, а на этапе обработки токенизированных данных.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 22.02.2009 (Вс) 16:37

О чём и речь ;)
Настоящие грамматики затем и нужны, чтобы "обработка токенизированных данных" тоже шла автоматически.
У тебя, в случае разбора текстовых языков, очень маленькая разница между входным потоком байтов и выходным потоком токенов; в чём же выигрыш?
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 22.02.2009 (Вс) 17:17

Что значит "тоже шла автоматически"? Она и у меня идёт автоматически (а не вручную). Или ты имеешь в виду, что классический парсер схавает в качестве входящих данных описание грамматики и сам код, и на выходе сразу же даст готовое дерево? Т.е. одним махом, за один этап, а не за несколько, как у меня?
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 22.02.2009 (Вс) 17:46

За несколько, как у тебя.
Но дерево построится по описанию грамматики само, без рукотворного кода.
А у тебя откуда берётся разборщик второго этапа? Пишешь руками впридачу к описанию языка?
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 22.02.2009 (Вс) 19:21

Что значит без рукотворного кода? Анализатор описания грамматики сам по себе зарождается?

А TokenSequence можно обработать руками, можно скормить куда-то, можно превратить в дерево используя тот же DFA.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 22.02.2009 (Вс) 20:42

Хакер писал(а):Что значит без рукотворного кода? Анализатор описания грамматики сам по себе зарождается?

Анализатор описания грамматики (произвольной) != анализатор потока токенов для конкретной грамматики

Хакер писал(а):А TokenSequence можно обработать руками, можно скормить куда-то, можно превратить в дерево используя тот же DFA.

Вот не сделаешь ты дерево из DFA, говорю же.
Я всё это учил и сдавал ;)
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 23.02.2009 (Пн) 8:24

Анализатор описания грамматики (произвольной) != анализатор потока токенов для конкретной грамматики

(Никто и не спорил) Но он же не зарождается сам собой, его же всё равно нужно написать (в данном случае писать его придётся SLIM-у).


Вот не сделаешь ты дерево из DFA, говорю же.

Ну обоснуй это заявление.
DFA — не более чем технология построения программы в рантайме. Можно вообще всю программу сделать через DFA. При таком раскладе, программная структура, созданная с помощью DFA, в принципе, может сделать то же самое, что и обычный код. Почему, при этом, ты заявляешь, что программа, построенная с помощью DFA чего-то не может — мне непонятно.


tyomitch писал(а):Я всё это учил и сдавал

Ты учил и сдавал классику, но не то, что придумал я. Ты пытаешься смотреть на мой принцип разбора через призму классики, но этого делать нельзя.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 23.02.2009 (Пн) 11:21

Хакер писал(а):
Вот не сделаешь ты дерево из DFA, говорю же.

Ну обоснуй это заявление.
DFA — не более чем технология построения программы в рантайме. Можно вообще всю программу сделать через DFA.
...

tyomitch писал(а):Я всё это учил и сдавал

Ты учил и сдавал классику, но не то, что придумал я. Ты пытаешься смотреть на мой принцип разбора через призму классики, но этого делать нельзя.

Если ты в классическое понятие "DFA" вместо классического смысла вкладываешь какой-то свой, тогда -- да, конечно.
Не важно.

Построй мне дерево для языка правильных расстановок скобок (т.е. в алфавите только два символа "()")
Тогда наверное пойму, что ты имеешь в виду.
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 23.02.2009 (Пн) 11:35

DFA --- не классическое понятие, а библиотека, функции которые имеют префикс "Dfa" и отвечают за построение того, что я описал в топике "Second hand (Хакерское abandonware)".
А ты думал это Determinated Finite Automat? :)

Про дерево не понял.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 23.02.2009 (Пн) 12:46

Хакер писал(а):DFA --- не классическое понятие, а библиотека, функции которые имеют префикс "Dfa" и отвечают за построение того, что я описал в топике "Second hand (Хакерское abandonware)".

Обвёл меня вокруг пальца!
Теперь тебе ещё надо написать библиотеку с префиксом VB6, для полной неразберихи.

Хакер писал(а):А ты думал это Determinated Finite Automat? :)

Deterministic Finite Automaton
(урок правописания)

Хакер писал(а):Про дерево не понял.

Вход: строка. Выход: либо дерево (в любом виде), либо ошибка (если в строке есть нескобки, или скобки расставлены неправильно).
Изображение

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 23.02.2009 (Пн) 12:57

Хочу хороший пример входных данных и выходного дерева.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

tyomitch
Пользователь #1352
Пользователь #1352
Аватара пользователя
 
Сообщения: 12822
Зарегистрирован: 20.10.2002 (Вс) 17:02
Откуда: חיפה

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение tyomitch » 23.02.2009 (Пн) 13:45

Код: Выделить всё
()((()(()))(())())
1 234 56   78  9

   0
  / \
1   2
    /|\
   3 9 7
  / \   \
4   5   8
     |
     6
Изображение

SLIM
Продвинутый гуру
Продвинутый гуру
Аватара пользователя
 
Сообщения: 1840
Зарегистрирован: 04.04.2008 (Пт) 18:21
Откуда: Краснодар

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение SLIM » 23.02.2009 (Пн) 14:05

Хакер, мы все видели только описание супербыстрого поиска по словарю
Никто не видел основной идеи той самой разработки, но ИМХО она действительно идет в разрез с классическими понятиями.
Поэтому нужно друг другу объяснить свои идеи, а уж потом спорить...
У темыча есть своя доля правды...
Задача любого синтаксического анализатора состоит в нескольких вещах
1. Принять поток данных и определить относится ли он к данному языку и грамматике (больше грамматики конечно)
2. Обработав все это нужно вывести дерево разбора, или ошибку в разборе если таковая имеется.

Деревья разбора строятся по-разному, и тут все очень друг на друге завязано.

Просто я к чему все это. Грамматика описывает некую структуру в целом а не по отдельности. Понятие токен без грамматики то же самое что и атом - самостоятельно они бесполезны. Поэтому скармливать любой поток данных - где-то да не сработает.

Ну а если задаться заданием структуры грамматики, тут вступает уже придуманные учеными методы. Я если честно сам пытался, но в итоге все стекается к уже придуманному...Т.е. задавать грамматику именно так как это делал например я в первом топике. Разбирать...вот тут самые большие проблемы. Для того чтобы разборщик работал быстрее и оптимизируют правила разбора и т.д.

Я бы поставил тебе памятник если бы была такая ситуация
1. Получаем строку неизвестно чего
2. Находим в нем структуру
3. В следующий раз при получении строки такой же структуры уже не переструктурируем, а используем старую структуру
4. При возникновении неправильности первой изночальной структуру, переструктурируем ее по-новой

Т.е. тогда не нужны ни грамматики ни что-то еще. Получив входную строку, программа сама анализирует что там и как, и потом будет это использовать. Тогда человек, желающий создать парсер под например ini будет просто посылать строку из любого готового ini, составится структура синтаксиса и сможешь работать с любым ini....и так везде, включая естествнные языки
Пишите жизнь на чистовик.....переписать не удастся.....

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Темыч, Зенитчик и все остальные Help!!!

Сообщение Хакер » 23.02.2009 (Пн) 14:58

Задача любого синтаксического анализатора состоит в нескольких вещах
1. Принять поток данных и определить относится ли он к данному языку и грамматике (больше грамматики конечно)
2. Обработав все это нужно вывести дерево разбора, или ошибку в разборе если таковая имеется.

Вообще говоря, нельзя так громко кричать "нужно". "Нужно" у каждого своё. Мне, например, может оказаться, что дерево разбора и не нужно.

То, что действительно нужно, это данные одного вида (который менее удобен для оперирования ими), перевести в данные другого вида (более удобного).

Каким будет этот "другой вид" — будет ли это дерево, связанный список или массив зависит от тебя и твоей задачи. Так что заявлять, что какой-то там анализатор должен код превратить всенепременно в дерево, — неправильно. Можно конечно насильно заставлять себя делать именно так, как кто-то сделал кто-то раньше. Но ты же не называешь свои функции foo и bar?

Понятие токен без грамматики то же самое что и атом - самостоятельно они бесполезны.

Здравсьте.
У меня имеется реализованный не до конца CodeBox (текст бокс для отображения кода со всеми соотв. фукнциями). Этот кодебокс используется TOKENSEQUENCE для отрисовки и для подсветки синтаксиса. Вот наглядный пример того, чем полезен поэтапный подход. Если я пишу просьенький текстовый редактор с подсветкой синтаксиса, то мне хватит токенайзера. Если я пишу не просто текстовый редактор, а среду разработки с компилятором, то я подвергну токенизированные данные следующей обработке с помощью DFA-автомата. Сначала последовательность символов превратилась в последовательность токенов, а в этот раз последовательность токенов превратится в какую-то другую последовательность. Сколько будет таких этапов и что в конечном счёте получится зависит от меня, от моей фантазии и моей задачи.

Ну а если задаться заданием структуры грамматики, тут вступает уже придуманные учеными методы. Я если честно сам пытался, но в итоге все стекается к уже придуманному...

Чем хорошо программирование — здесь можно крутиться и придумывать свои методы. Я изначально отвернулся от методов, придуманных учёными и с тех пор ни разу не пожалел.

Я бы поставил тебе памятник если бы была такая ситуация
1. Получаем строку неизвестно чего
2. Находим в нем структуру
3. В следующий раз при получении строки такой же структуры уже не переструктурируем, а используем старую структуру
4. При возникновении неправильности первой изночальной структуру, переструктурируем ее по-новой

Т.е. тогда не нужны ни грамматики ни что-то еще. Получив входную строку, программа сама анализирует что там и как, и потом будет это использовать. Тогда человек, желающий создать парсер под например ini будет просто посылать строку из любого готового ini, составится структура синтаксиса и сможешь работать с любым ini....и так везде, включая естествнные языки

Это глупость. Т.е. это невозможная в принципе вещь, даже если реализующий будет неимоверно умён. Что же касается естественных языков: "косил косой косой косой". Последнии три слова одинаковые, но тем не менее, одно из них обозначает зайца, другое инструмент, а третье является прилагальнрым. Которое — какое, не ответишь даже ты, не то что программа.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

След.

Вернуться в Народный треп

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 41

    TopList