Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/160157
Заглавие документа: | К проблеме автоматического разрешения лексико-грамматической омонимии, порождаемой отсутствием в текстах диактритических знаков |
Авторы: | Голяк, Ю. Д. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
Дата публикации: | 25-окт-2016 |
Издатель: | Минск: БГУ |
Аннотация: | Отсутствие диакритических знаков распространенная проблема при автоматической обработке текстов на языках, чья система письменности включает символы, фонетическое значение которых зависит от наличия или отсутствия диакритического знака. Данная статья описывает подход к обработке русскоязычных текстов, в которых отсутствие диакритики приводит к росту процента омонимичных словоформ в тексте. Описанный подход позволяет отказаться от восстановления всех отсутствующих в тексте диакритических знаков, но при этом учитывать возможную омонимию для последующей корректной обработки и извлечения информации из текста. |
URI документа: | http://elib.bsu.by/handle/123456789/160157 |
ISBN: | 978-985-566-369-1 |
Располагается в коллекциях: | Секция 6. ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Гордей.pdf | 1,08 MB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.