Antonariy писал(а):На ASCII-код (типа \'e1) со схожим начертанием. Хотя перечитываю задание автора и не понимаю, как он собирается анализировать текст на предмет частоты встречаемости слов, если он фактически меняет в словах буквы?.. Разве что этот анализ оторван от общего словаря.По поводу разбора TextRTF: так и не понял, на что предлагается заменять \u*.
Мне надо проанализировать текст на предмет частоты встречаемости слов. Но, как анализировать слова, если часть букв, из которых состоят эти слова не читается? Программок, которые составляют частотные словари полно, но, ни одна из них не может проанализировать текст, набранный некоторыми шрифтами на некоторых языках. Приведённый пример с греческим языком и фонтом Palatino linotip, только частный случай.