Страница 1 из 1

Алгоритм (принцип) дробления русского слова на слоги.

СообщениеДобавлено: 03.02.2008 (Вс) 0:46
Хакер
Он есть в принципе? Человек ведь в общем случае безошибочно совершает эту операцию?

СообщениеДобавлено: 03.02.2008 (Вс) 8:41
Antonariy
Смотря что считать "алгоритмом". Есть куча правил и масса исключений. Например, с виду можно записать и так и эдак: "дроб-ле-ния" и "дро-бле-ния". На самом деле правильный вариант - первый. "Дроб" - односложный корень, его делить не стоит. То есть еще нужна база корней. Однако ворд худо-бедно переносы расставляет, значит эти правила загнать в функцию можно, и словари у него имеются...

А вообще человек безошибочно выполняет кучу операций, в которых компьютер сел бы в лужу. :) Однажды в компьютерре была очень грамотная статья о принципах работы человеческого мозга, если интересно, могу поискать ссылку. Самое главное - человек способен выдавать правильное решение при недостатке данных, компьютер как ни крути - нет.

СообщениеДобавлено: 03.02.2008 (Вс) 23:31
Денис
В СПС Гарант новых версий в поиске используется подбор всех граматических форм любого слова. судя по всему, там отрезаются окончания и подставляются все возможные. Упрощенная задача разбиения на слоги. Не так ли?

СообщениеДобавлено: 03.02.2008 (Вс) 23:40
Хакер
Денис
Дробление на слоге не совпадает с дроблением на морфемы.

СообщениеДобавлено: 03.02.2008 (Вс) 23:43
Денис
Хакер
И это еще болше усложняет задачу.
Разбивку делать скорее всего придется по словарю. Слижком уж много исключений в нашем великом и могучем. Гораздо больше чем правил. Плюс неологизмы и (как это правильно) "иностранизмы"

СообщениеДобавлено: 03.02.2008 (Вс) 23:56
Хакер
Мне кажется принцип есть. Завтра попробую поэкспериментировать. Принцип, кажущийся мне действенным, чем то похож на ОВР.

Re: Алгоритм (принцип) дробления русского слова на слоги.

СообщениеДобавлено: 04.02.2008 (Пн) 9:32
alibek
Хакер писал(а):Человек ведь в общем случае безошибочно совершает эту операцию?

Нет.
Разложи "ландскнехт".

СообщениеДобавлено: 04.02.2008 (Пн) 10:10
Antonariy
Ландс-кнехт. Чего тут сложного? Два четко обозначенных германских корня.

СообщениеДобавлено: 04.02.2008 (Пн) 11:19
alibek
Но не зная происхождения, как ты вычислишь, что корней два и где именно проходит граница?
Без словаря, одним алгоритмом не обойтись.
У человека очень большой словарь, поэтому для него расстановка слогов обычно трудностей не представляет. Но если ему попадется незнакомое сложное слово, он не сможет расставить слоги.

СообщениеДобавлено: 04.02.2008 (Пн) 12:40
Antonariy
Без словаря, одним алгоритмом не обойтись.
Об том и речь. "Общий случай" в моем понимании подразумевает использование словаря, на то он и "общий", а не какой-то "конкретный".

СообщениеДобавлено: 04.02.2008 (Пн) 13:17
Хакер
alibek
Сабж гласит "Алгоритм деления русского слова на слоги." По моему, слово "ландскнехт" немного нерусское.

СообщениеДобавлено: 04.02.2008 (Пн) 13:28
Antonariy
В рамках правил переноса любое слово, записанное русскими буквами, считается русским. :)
Ви-жу-ал бей-сик, например. Что ж теперь, не переносить его что ли?
Правила корней и прочие смысловые - вспомогательные, когда правила деления по фонемам не могут дать однозначного результата или он противоречит здравому смыслу.

Кстати существуют случаи, когда разные варианты переноса равнозначны с точки зрения всех правил.

СообщениеДобавлено: 04.02.2008 (Пн) 13:37
Хакер
Я имею ввиду то, что в некоторых языках не соблюдается правило "не более трёх идущих подряд букв (звуков)". (Хотя и в русском есть исключения).

А так - да, любое слово можно разделить на слоге.

Ги-ду-ля-тив-ный
Ка-ла-мыз-дра
ку-зяв-ка
ух-мыр-ка
(любимые слова создателей тестов, где важно полностью отвлечься от реальных вещей/понятий)

СообщениеДобавлено: 04.02.2008 (Пн) 13:42
Antonariy
Я имею ввиду то, что в некоторых языках не соблюдается правило "не более трёх идущих подряд букв (звуков)". (Хотя и в русском есть исключения).
Во-первых, "некоторые языки" идут лесом, мы ведь про русский, или где? Чужие правила переноса нас не касаются. Во-вторых, что это за правило "трех букв"? Насчет количеств помню только одно - нельзя оставлять одну букву и переносить одну букву.

СообщениеДобавлено: 04.02.2008 (Пн) 19:46
Lumen
Antonariy
Это в школе было такое правило. На самом деле их больше. Взять хотя бы деловое письмо. Или правила публикации печатных изданий.

СообщениеДобавлено: 05.02.2008 (Вт) 8:09
Viper
Так все же, что за правило трех букв то такое? Что оно из себя представляет?

СообщениеДобавлено: 16.02.2008 (Сб) 13:16
GAGArin
Кхм... Деление на слоги никак не связано со словообразованием. Это фонетика и связано деление только с произношением. "дро-бле-ни-я" делится только так и никак не "дроб-ле-ния"

А вообще вот например: покурить этот материал и алгоритм станет довольно очевиден.
http://traktat.com/language/book/fonetic/slogex.php

СообщениеДобавлено: 17.02.2008 (Вс) 7:55
Antonariy
GAGArin
Сам-то курил этот материал?
Слогораздел не следует смешивать с переносом слова. на слоги — это характеристика звучащей речи, а перенос — условные правила, принятые на письме. Ср., например: идея — 3 слога, а перенести это слово нельзя, т.к. нельзя одну букву оставить в строке или перенести в следующую; слово пёстрый можно перенести тремя способами (пё-стрый, пёс-трый, пёстрый), а на слоги оно делится только одним: [п'o-стрыи].

СообщениеДобавлено: 17.02.2008 (Вс) 10:19
GAGArin
Antonariy
Я не понял к чему эта выдержка? При чем тут вообще перенос? Спрошено было про деление на слоги. Деление на слоги идет одним единственным вполне алгоритмизирующимся способом. В статье всё конкретно описано, мне просто лениво было набирать, я скинул ссылку на источник. Сам я это помню еще со школы. К чему эта выдержка про перенос слов в которой в самой сказано что к слогам она отношения не имеет?

СообщениеДобавлено: 17.02.2008 (Вс) 12:18
Antonariy
Мне показалось, что все время речь шла о переносах.