Словарь для распознания частей речи

Разговоры на любые темы: вы можете обсудить здесь какой-либо сайт, найти единомышленников или просто пообщаться...
alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Словарь для распознания частей речи

Сообщение alibek » 03.04.2021 (Сб) 21:42

Попалась мне недавно любопытная статья: https://pikabu.ru/story/vizualizatsiya_ ... kh_8103709
Иностранец визуализировал синтаксис русских песен, раскрашивая разноцветными квадратиками.
Но мне кажется, что сделать можно более интересно, если рисовать не один квадратик, а несколько, соответствующих числу слогов. И может быть выделяя рамкой ударения.
Тогда цветовой узор бы показывал синтаксическую структуру песен, а форма (количество квадратиков) соответствовала бы ритму песни.
Допустим со слогами можно схалтурить, не разбивать в действительности слова на слоги, а просто считать количество гласных букв.
Но вот с частями речи все будет сложнее. Я хочу опознавать части речи по словарю, а неизвестные или неопознанные слова рисовать прозрачным, чтобы их раскрашивал уже пользователь.
Но в любом случае тут все упирается в словарь. Может кто знает хорошие словари?
Lasciate ogni speranza, voi ch'entrate.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Словарь для распознания частей речи

Сообщение Хакер » 04.04.2021 (Вс) 16:14

А мне кажется лучше не цветом обозначать, а условно-графическим обозначением. Например существительные — кружками, прилагательные — волнистой чёрточкой (а-ля тильда).

Скажем, как выглядели бы электросхемы, если бы вместо УГО все элементы обозначались бы квадратиками разных цветов.

В качестве словаря: может быть парсить викисловарь?
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Re: Словарь для распознания частей речи

Сообщение alibek » 04.04.2021 (Вс) 23:59

Схема расцветки будет восприниматься глазом моментально и с любого расстояния. А какие-либо значки и условные обозначения мозгу нужно еще распознать и сопоставить.

Под викисловарем имеется ввиду онлайн?
Lasciate ogni speranza, voi ch'entrate.

Хакер
Телепат
Телепат
Аватара пользователя
 
Сообщения: 16478
Зарегистрирован: 13.11.2005 (Вс) 2:43
Откуда: Казахстан, Петропавловск

Re: Словарь для распознания частей речи

Сообщение Хакер » 05.04.2021 (Пн) 22:40

alibek писал(а):Схема расцветки будет восприниматься глазом моментально и с любого расстояния.

Не уверен, подсчечивание кубиков очень хорошо помогает сходу понять процентное соотношение разных компонент (столько-то синих, столько-то красных) и наличие некоторых регулярных структур. Т.е. в основном дать количественные оценки, но не качественные.

Какая схема выглядит яснее?
02.png
02.png (25.01 Кб) Просмотров: 1203

0.png
0.png (56.41 Кб) Просмотров: 1203

По хорошему надо провести эксперимент на двух людях: один из которых работает со схемами, а другой вообще с ними дел не имеет. В вопросе оценки количества разных элементов вторая может быть и лучше, но для понимания устройства определённо первая.

Вообще, мысль у меня была в том, что микро-символы (например круг для существительных, тильда для прилагательных) объединяются в макросимволы, которые тоже могут узнавать:
belsneg.png
belsneg.png (4.52 Кб) Просмотров: 1203

(Белый снег, серый лёд, на растрескавшемся стекле)


Под викисловарем имеется ввиду онлайн?

Да.
—We separate their smiling faces from the rest of their body, Captain.
—That's right! We decapitate them.

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Re: Словарь для распознания частей речи

Сообщение alibek » 06.04.2021 (Вт) 14:01

ИМХО совершенно нет.
Цветовое зрение более «инстинктивное», чем распознавание образов, и уж тем более символов. Да и работать цветные квадратики будут на большем расстоянии, чем символы.
И я бы не сравнивал электрическую схему (где важны все детали) и песню (в которой есть более важные и менее важные детали, а ряд деталей вообще не существенен).
Электронная схема почти немыслима без подписей (с номиналами и идентификаторами), а в песне внимание обращается в первую очередь на ритм.
Lasciate ogni speranza, voi ch'entrate.

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Re: Словарь для распознания частей речи

Сообщение alibek » 06.04.2021 (Вт) 14:02

Хакер писал(а):Да.

Тогда онлайн станет обязательным. И может сломаться, если викисловарь поменяет дизайн.
Но согласен, это будет куда проще.
Lasciate ogni speranza, voi ch'entrate.

Don Leno
Постоялец
Постоялец
Аватара пользователя
 
Сообщения: 421
Зарегистрирован: 13.10.2013 (Вс) 14:05

Re: Словарь для распознания частей речи

Сообщение Don Leno » 21.04.2021 (Ср) 11:26

Alibek, тема очень интересная. Вот только вопрос: как вы собираетесь обводить и раскрашивать слова?
Если есть мысли как это будет осуществляться, то будь так добры поделитесь с нами))

alibek
Большой Человек
Большой Человек
 
Сообщения: 14205
Зарегистрирован: 19.04.2002 (Пт) 11:40
Откуда: Russia

Re: Словарь для распознания частей речи

Сообщение alibek » 29.07.2021 (Чт) 22:11

Давненько не заходил.

Проблем с обведением слов я не вижу.
Но вообще-то это и не требуется.
Чтобы рисуемый узор соответствовал ритму песни (стиха), каждый рисуемый слог должен быть одинаковой ширины.
Так что нужно просто для каждой строфы посчитать и отобразить прямоугольники.
Lasciate ogni speranza, voi ch'entrate.


Вернуться в Народный треп

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 100

    TopList