Алгоритм (принцип) дробления русского слова на слоги.

Алгоритмы, использующиеся при работе с естественными языками.
Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Алгоритм (принцип) дробления русского слова на слоги.

Сообщение Хакер » 03.02.2008 (Вс) 0:46

Он есть в принципе? Человек ведь в общем случае безошибочно совершает эту операцию?
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 03.02.2008 (Вс) 8:41

Смотря что считать "алгоритмом". Есть куча правил и масса исключений. Например, с виду можно записать и так и эдак: "дроб-ле-ния" и "дро-бле-ния". На самом деле правильный вариант - первый. "Дроб" - односложный корень, его делить не стоит. То есть еще нужна база корней. Однако ворд худо-бедно переносы расставляет, значит эти правила загнать в функцию можно, и словари у него имеются...

А вообще человек безошибочно выполняет кучу операций, в которых компьютер сел бы в лужу. :) Однажды в компьютерре была очень грамотная статья о принципах работы человеческого мозга, если интересно, могу поискать ссылку. Самое главное - человек способен выдавать правильное решение при недостатке данных, компьютер как ни крути - нет.
Лучший способ понять что-то самому — объяснить это другому.

Денис
Доктор VB наук
Доктор VB наук
Аватара пользователя
 
Сообщения: 2734
Зарегистрирован: 07.11.2006 (Вт) 13:55
Откуда: Ейск, Краснодарский край

Сообщение Денис » 03.02.2008 (Вс) 23:31

В СПС Гарант новых версий в поиске используется подбор всех граматических форм любого слова. судя по всему, там отрезаются окончания и подставляются все возможные. Упрощенная задача разбиения на слоги. Не так ли?
Программирование — богоизбранная дисциплина! Если бог и есть, то вселенную он скомпилировал, не иначе.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Сообщение Хакер » 03.02.2008 (Вс) 23:40

Денис
Дробление на слоге не совпадает с дроблением на морфемы.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

Денис
Доктор VB наук
Доктор VB наук
Аватара пользователя
 
Сообщения: 2734
Зарегистрирован: 07.11.2006 (Вт) 13:55
Откуда: Ейск, Краснодарский край

Сообщение Денис » 03.02.2008 (Вс) 23:43

Хакер
И это еще болше усложняет задачу.
Разбивку делать скорее всего придется по словарю. Слижком уж много исключений в нашем великом и могучем. Гораздо больше чем правил. Плюс неологизмы и (как это правильно) "иностранизмы"
Программирование — богоизбранная дисциплина! Если бог и есть, то вселенную он скомпилировал, не иначе.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Сообщение Хакер » 03.02.2008 (Вс) 23:56

Мне кажется принцип есть. Завтра попробую поэкспериментировать. Принцип, кажущийся мне действенным, чем то похож на ОВР.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Re: Алгоритм (принцип) дробления русского слова на слоги.

Сообщение alibek » 04.02.2008 (Пн) 9:32

Хакер писал(а):Человек ведь в общем случае безошибочно совершает эту операцию?

Нет.
Разложи "ландскнехт".
Lasciate ogni speranza, voi ch'entrate.

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 04.02.2008 (Пн) 10:10

Ландс-кнехт. Чего тут сложного? Два четко обозначенных германских корня.
Лучший способ понять что-то самому — объяснить это другому.

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Сообщение alibek » 04.02.2008 (Пн) 11:19

Но не зная происхождения, как ты вычислишь, что корней два и где именно проходит граница?
Без словаря, одним алгоритмом не обойтись.
У человека очень большой словарь, поэтому для него расстановка слогов обычно трудностей не представляет. Но если ему попадется незнакомое сложное слово, он не сможет расставить слоги.
Lasciate ogni speranza, voi ch'entrate.

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 04.02.2008 (Пн) 12:40

Без словаря, одним алгоритмом не обойтись.
Об том и речь. "Общий случай" в моем понимании подразумевает использование словаря, на то он и "общий", а не какой-то "конкретный".
Лучший способ понять что-то самому — объяснить это другому.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Сообщение Хакер » 04.02.2008 (Пн) 13:17

alibek
Сабж гласит "Алгоритм деления русского слова на слоги." По моему, слово "ландскнехт" немного нерусское.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 04.02.2008 (Пн) 13:28

В рамках правил переноса любое слово, записанное русскими буквами, считается русским. :)
Ви-жу-ал бей-сик, например. Что ж теперь, не переносить его что ли?
Правила корней и прочие смысловые - вспомогательные, когда правила деления по фонемам не могут дать однозначного результата или он противоречит здравому смыслу.

Кстати существуют случаи, когда разные варианты переноса равнозначны с точки зрения всех правил.
Последний раз редактировалось Antonariy 04.02.2008 (Пн) 13:37, всего редактировалось 1 раз.
Лучший способ понять что-то самому — объяснить это другому.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16473
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Сообщение Хакер » 04.02.2008 (Пн) 13:37

Я имею ввиду то, что в некоторых языках не соблюдается правило "не более трёх идущих подряд букв (звуков)". (Хотя и в русском есть исключения).

А так - да, любое слово можно разделить на слоге.

Ги-ду-ля-тив-ный
Ка-ла-мыз-дра
ку-зяв-ка
ух-мыр-ка
(любимые слова создателей тестов, где важно полностью отвлечься от реальных вещей/понятий)
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 04.02.2008 (Пн) 13:42

Я имею ввиду то, что в некоторых языках не соблюдается правило "не более трёх идущих подряд букв (звуков)". (Хотя и в русском есть исключения).
Во-первых, "некоторые языки" идут лесом, мы ведь про русский, или где? Чужие правила переноса нас не касаются. Во-вторых, что это за правило "трех букв"? Насчет количеств помню только одно - нельзя оставлять одну букву и переносить одну букву.
Лучший способ понять что-то самому — объяснить это другому.

Lumen
Постоялец
Постоялец
Аватара пользователя
 
Сообщения: 841
Зарегистрирован: 03.12.2005 (Сб) 16:09
Откуда: Брянск

Сообщение Lumen » 04.02.2008 (Пн) 19:46

Antonariy
Это в школе было такое правило. На самом деле их больше. Взять хотя бы деловое письмо. Или правила публикации печатных изданий.
Подпись проходит рефакторинг

Viper
Артефакт VBStreets
Артефакт VBStreets
Аватара пользователя
 
Сообщения: 4394
Зарегистрирован: 12.04.2005 (Вт) 17:50
Откуда: Н.Новгород

Сообщение Viper » 05.02.2008 (Вт) 8:09

Так все же, что за правило трех букв то такое? Что оно из себя представляет?
Весь мир матрица, а мы в нем потоки байтов!

GAGArin
Неистовый флудер
Неистовый флудер
 
Сообщения: 1777
Зарегистрирован: 23.12.2002 (Пн) 12:46
Откуда: я тут взялся, не знаю...

Сообщение GAGArin » 16.02.2008 (Сб) 13:16

Кхм... Деление на слоги никак не связано со словообразованием. Это фонетика и связано деление только с произношением. "дро-бле-ни-я" делится только так и никак не "дроб-ле-ния"

А вообще вот например: покурить этот материал и алгоритм станет довольно очевиден.
http://traktat.com/language/book/fonetic/slogex.php

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 17.02.2008 (Вс) 7:55

GAGArin
Сам-то курил этот материал?
Слогораздел не следует смешивать с переносом слова. на слоги — это характеристика звучащей речи, а перенос — условные правила, принятые на письме. Ср., например: идея — 3 слога, а перенести это слово нельзя, т.к. нельзя одну букву оставить в строке или перенести в следующую; слово пёстрый можно перенести тремя способами (пё-стрый, пёс-трый, пёстрый), а на слоги оно делится только одним: [п'o-стрыи].
Лучший способ понять что-то самому — объяснить это другому.

GAGArin
Неистовый флудер
Неистовый флудер
 
Сообщения: 1777
Зарегистрирован: 23.12.2002 (Пн) 12:46
Откуда: я тут взялся, не знаю...

Сообщение GAGArin » 17.02.2008 (Вс) 10:19

Antonariy
Я не понял к чему эта выдержка? При чем тут вообще перенос? Спрошено было про деление на слоги. Деление на слоги идет одним единственным вполне алгоритмизирующимся способом. В статье всё конкретно описано, мне просто лениво было набирать, я скинул ссылку на источник. Сам я это помню еще со школы. К чему эта выдержка про перенос слов в которой в самой сказано что к слогам она отношения не имеет?

Antonariy
Повелитель Internet Explorer
Повелитель Internet Explorer
Аватара пользователя
 
Сообщения: 4824
Зарегистрирован: 28.04.2005 (Чт) 14:33
Откуда: Мимо проходил

Сообщение Antonariy » 17.02.2008 (Вс) 12:18

Мне показалось, что все время речь шла о переносах.
Лучший способ понять что-то самому — объяснить это другому.


Вернуться в Лингвистика

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

    TopList  
cron