Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/160163
Заглавие документа: | Автоматизация порождения словаря парадигм на основе корпуса текстов для языков флективного типа |
Авторы: | Станкевич, В. И. Нагарнович, Э. В. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
Дата публикации: | 25-окт-2016 |
Издатель: | Минск: БГУ |
Аннотация: | На примере русского языка представлен алгоритм автоматического порождения словаря парадигм для языков флективного типа с использованием модели векторного представления слов Word2vec, полученной в результате обучения двуслойной нейронной сети на корпусе русскоязычных текстов. Особенностью предлагаемого подхода является то, что в нем лишь в незначительной степени применяется такой традиционный способ решения задачи, как стемминг, и совершенно не используется лемматизация – векторные представления слов являются ключевым элементом, выступающим как в роли источника словоформ парадигмы, так и в качестве «лингвиста-эксперта», оценивающего семантическое и грамматическое сходство словоформ. |
URI документа: | http://elib.bsu.by/handle/123456789/160163 |
ISBN: | 978-985-566-369-1 |
Располагается в коллекциях: | Секция 6. ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Станкевич_Нагарнович.pdf | 371,39 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.