Конференция VBStreets

**tyomitch** » 13.04.2006 (Чт) 18:22

Несмотря на высокопарный заголовок, служащий единственно для привлечения вашего внимания к этому посту, здесь не будет заезженных сравнений прошлого и теперешнего. Речь пойдёт отдельно -- о временах, и отдельно -- о нравах :-)

* Считается, что регулярные выражения, о которых писал статью ANDLL, -- это самый быстрый способ разбора строки. Вполне может быть, что так оно и есть; но это означало бы только, что остальные способы ещё медленнее, а не то, что регулярные выражения работают быстро. Собственно, о времени работы регулярных выражений речь и пойдёт.

Если регулярное выражение -- действительно регулярное, т.е. описывает регулярный язык, то по такому выражению можно построить ДКА, который будет работать линейное время по длине строки. И всё же возможности тех "регулярных выражений", которые поддерживаются современными инструментами, не ограничиваются лишь регулярными языками. Так, man-страница grep(1) заканчивается секцией BUGS следующего содержания:

Large repetition counts in the {m,n} construct may cause grep to use
lots of memory. In addition, certain other obscure regular expressions
require exponential time and space, and may cause grep to run out of
memory.

Backreferences are very slow, and may require exponential time.

Другими словами, использование ссылок назад сразу же выводит алгоритм из линейного времени работы в неполиномиальное. То, насколько это плохо -- неполиномиальное время работы, можно проиллюстрировать следующим примером:

Код: Выделить всё: bash-2.05b$ time perl -e '$_="123454895:4890182361"; /((\d+)|\:|\2)*(\1|\2)$/' real 1m32.795s user 1m31.482s sys 0m0.079s

Входная строка случайная; от конкретных символов время работы не зависит. Важно только то, что для входной строки из 20 символов этот 22-символьный регэксп работает полторы минуты, и добавление нового символа во входную строку увеличивает время работы примерно втрое.

Можно, однако наращивать не длину входной строки, а количество ссылок назад в регэкспе:

Код: Выделить всё: bash-2.05b$ time perl -e '$_="123454895:4890182361"; /((\d+)|\:|\2)*(\1|\2)+\3/' real 1m44.623s user 1m44.078s sys 0m0.095s

На той же 20-символьной строке получаем лишние 13 секунд работы; рост втрое при добавлении символа сохраняется.

Здесь по задумке должен был идти вывод о проделанной работе; может быть, я его ещё сочиню и допишу сюда.

* Не знаю как остальных, но нас с начальной школы и до сих пор учителя пугают неимоверным количеством времён в английском языке, насчитывая всякий раз не по одному десятку.

Поэтому естественно, что я не мог не обратить внимания на этот топик. По нему выходит, что времён всего два: прошедшее и непрошедшее. Тогда, кроме времён, формы глагола разделяются по "аспектам" (по-русски это, наверное, виды) и залогам. И действительно, сразу же получается ясная и многомерная картина форм английского глагола, вместо этого жуткого списка всех "времён" вперемешку, занимавшего в учебнике целую страницу.

Кроме этого факта, в привлекшем моё внимание топике описывается "давнопрошедшее" время ([url=http://ru.wikipedia.org/wiki/Плюсквамперфект]плюсквамперфект[/url]), сохранившееся по словам автора в южнорусских говорах. Если носители этих говоров читают мой блог, прошу их оставить комментарии по этому поводу :-)

* Теперь, наконец, про нравы. О вреде злоупотребления алкоголем написано и нарисовано очень много, но интересно сравнить эти два схожих по своему сюжету плаката -- советский и китайский. Вот один из комментариев в их отношении:

GSerg писал(а):А плакаты в целом одинаковы, ведь у нас одна рюмка и одно маленькое "нет", а там две бутылки и куча текста - пропорции соблюдены

+Молния: СГУ и АлтГТУ респект!!

**VVitafresh** » 13.04.2006 (Чт) 19:33

Кроме этого факта, в привлекшем моё внимание топике описывается "давнопрошедшее" время (плюсквамперфект), сохранившееся по словам автора в южнорусских говорах. Если носители этих говоров читают мой блог, прошу их оставить комментарии по этому поводу

А какие говоры считаются "южнорусскими"? Я живу на юге (правда Украины) и разговариваю на русском: про "давнопрошедшее" время слышу впервые.

**Tuco** » 14.04.2006 (Пт) 12:27

Не знаю как остальных, но нас с начальной школы и до сих пор учителя пугают неимоверным количеством времён в английском языке, насчитывая всякий раз не по одному десятку.
Поэтому естественно, что я не мог не обратить внимания на этот топик. По нему выходит, что времён всего два: прошедшее и непрошедшее. Тогда, кроме времён, формы глагола разделяются по "аспектам" (по-русски это, наверное, виды) и залогам. И действительно, сразу же получается ясная и многомерная картина форм английского глагола, вместо этого жуткого списка всех "времён" вперемешку, занимавшего в учебнике целую страницу.
Кроме этого факта, в привлекшем моё внимание топике описывается "давнопрошедшее" время (плюсквамперфект), сохранившееся по словам автора в южнорусских говорах. Если носители этих говоров читают мой блог, прошу их оставить комментарии по этому поводу

На юго-востоке Украины никто и никогда не упоминал ни о каком давнопрошедшем времени. Хотя сейчас, говорят, выдумывают новую грамматику, так что всё могло измениться за 10 лет. В армии видел укринцев из разных регионов и отмечу, что выражения типа "був бачыв" и "був чув" отмечались только у тех, кто русским языком не владел совершенно. Есть ли здесь какая-то зависимость - не знаю. Скорее всего это проявления диалектов или архаизмов...
В английском языке, на сколько мне известно, времён четыре - настоящее, прошедшее, будущее и прошедшее в будущем (past in future), остальное же изобилие - залоги, перфектность, длительность...

**tyomitch** » 14.04.2006 (Пт) 14:19

Подозреваю, что новую (?) украинскую грамматику не выдумывают, а уже выдумали.
http://uk.wikipedia.org/wiki/Давноминулий_час

**Tuco** » 14.04.2006 (Пт) 14:26

все приведённые там примеры можно перевести с русскими "было" и "бывало", это ведь в русском не давнопрошедшее время, правда? Вот так они и "притягивают за уши" то, что им хочется притянуть. Потому и уехал я оттуда и отказался от их гражданства. Я русский уже! Кстати, можете меня поздравить с этим фактом.

**VVitafresh** » 14.04.2006 (Пт) 16:46

tyomitch писал(а):Подозреваю, что новую (?) украинскую грамматику не выдумывают, а уже выдумали.
http://uk.wikipedia.org/wiki/Давноминулий_час

Я, конечно, не мовознавець (языковед), но что-то мне подсказывает, по приведенной ссылке рассмотрен какой-то диалект (возможно, захiдноукраiнський), а никак не официальная трактовка грамматически правильного построения предложения.

**Tuco** » 14.04.2006 (Пт) 16:58

А они там, на западной Украине вообще считают себя единственными настоящими украинцами и забывают, что там от украинских корней вообще ничего не осталось - только польские, венгерские, румынские и прочие традиции, ритуалы, язык - всё вообще.

**tyomitch** » 14.04.2006 (Пт) 17:29

Вон какую ссылку нашёл: http://www.mfa.gov.ua/mfa/ua/publicatio ... nt/392.htm

Сайт МЗС України писал(а):Дієслово української мови існує в чотирьох часах: окрім минулого, теперішнього та майбутнього, використовується давноминулий час (для вираження дії, яка відбулася в минулому, але раніше від дії, вираженої звичайним минулим часом).

И, с другой стороны, вот эту дискуссию на английской Википедии:

* This tense (давноминулий час) is formed by the verb 'бути' in a personal form and a main verb in past, and means an action taking place before another one. Pre-past is now used rarely in mass media and business, rather in literature and in spoken language (however, it has been used in the text of the Act of Independance, 1991).

* I am a native Ukrainian speaker and I've never heard of such a tense (pre-past: був читав) or its usage. Can you please give concrete references from Ukrainian literature or other accessible sources where this tense is used?

* Also, "pre-past" it passingly introduces as if it is a common tense, is archaic and currently used only in dialects or coloquical language.

**Faust** » 14.04.2006 (Пт) 21:46

Не стоит обижать жителей западной Украины. "Новий український правопис" разрабатывался вполне таки серьезными дядями и тетями в Киеве. Насколько я понимаю, разработчики хотели систематизировать знания по украинскому языку, определить, что есть "истинные" грамматические формы языка, а что - русизмы. Насколько мне известно, никто не принимает получившийся в результате изврат всерьез. Детям подобными, мягко говоря, странными правилами психику не травмируют - в школе все учат обычный украинский язык.

**Денис Победря** » 14.04.2006 (Пт) 22:02

tyomitch
Ну уж не знаю. От того, если считать, что в английском 3 или 2 времени, изучать его проще не станет.

**VVitafresh** » 15.04.2006 (Сб) 11:45

Сайт МЗС України писал(а):
Дієслово української мови існує в чотирьох часах: окрім минулого, теперішнього та майбутнього, використовується давноминулий час (для вираження дії, яка відбулася в минулому, але раніше від дії, вираженої звичайним минулим часом).

Дааа... Когда я учился в школе обучение у нас велось на украинском и английском языках (за исключением русского языка и литературы, естественно) ни о каких "давноминулих часах" и упоминания не было.
А сейчас создается впечатление, что правопис переписывается под отдельный диалект с попыткой представить его единственно правильным и исторически обоснованным вариантом украинского языка. Лично мне выражения типа: "Я був ходив до магазину" режут слух и создают впечатление безграмотной украинской речи.

**tyomitch** » 16.04.2006 (Вс) 11:35

Tuco писал(а):
Не знаю как остальных, но нас с начальной школы и до сих пор учителя пугают неимоверным количеством времён в английском языке, насчитывая всякий раз не по одному десятку.
Поэтому естественно, что я не мог не обратить внимания на этот топик. По нему выходит, что времён всего два: прошедшее и непрошедшее.

В английском языке, на сколько мне известно, времён четыре - настоящее, прошедшее, будущее и прошедшее в будущем (past in future), остальное же изобилие - залоги, перфектность, длительность...

А почему бы тогда конструкции со словом must не выделить в отдельное время?
Грамматически они ничем не отличаются от "будущего" и "будущего в прошедшем" времён.

(Про "прошедшее в будущем" слышу впервые.)

**Kovu** » 16.04.2006 (Вс) 16:05

Просто это не прошедшее в будущем, а будущее в прошедшем (future in the past)

**Tuco** » 18.04.2006 (Вт) 11:07

тысяча извинений, действительно я ошибси. "будущее в прошедшем (future in the past)" - конечно же так должно быть! Выделяют его, вероятно, аналитически... А зачем выводить модальный глагол must и конструкции с ним в отдельное время? Тогда для каждого глагола можно придумывать свои времена...

А на Украине сейчас одна политика - максимально отдалиться от России во всём, в том числе и в языке. Пример: раньше было слово "карта" и означало оно то же, что и в русском языке - "карта". Сейчас появилось слово "мапа" с тем же значением. Кто-нибудь слышал такое слово раньше? И таких примеров можно найти массу!

**ZHN** » 30.04.2006 (Вс) 20:16

Интересно, но заметку о регэкспах никто не прокомментировал.

Другими словами, использование ссылок назад сразу же выводит алгоритм из линейного времени работы в неполиномиальное.

Не совсем так. Например, регулярное выражение ^(.+)\1$ вполне себе линейное, а ^(.+)(.+)(.+)(.+)\1\2\3\4$ -- полиномиальное. Т.е. далеко не все регулярные выражения с backrefferences экспоненциальные.

man grep писал(а):Backreferences are very slow, and may require exponential time.

У меня есть некоторое исследование на тему, как по виду регэкспа понимать экспоненциальное оно или нет. Статья сейчас в стадии редактирования. Если она будет опубликована (тьфутьфутьфу), то могу пообещать ссылку, если интересно.

Кстати, статья ANDLL не затрагивает backrefferences совсем. Все регэкспы там линейные. Правда, и возможности их ограничены регулярными языками.

Конференция VBStreets

Времена и нравы

Времена и нравы

Кто сейчас на конференции