Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/221831
Заглавие документа: | Задача нормализации содержащих общепринятые аббревиатуры и выражения текстов: магистерская диссертация / Татьяна Алексеевна Климук; БГУ, Факультет прикладной математики и информатики, Кафедра дискретной математики и алгоритмики; науч. рук. Соболевская Е. П. |
Авторы: | Климук, Татьяна Алексеевна |
Тема: | ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика |
Дата публикации: | 2019 |
Аннотация: | Магистерская диссертация 47 с., 3 рис., 8 таблиц, 13 источников. Ключевые слова: ЛЕКСЕМА, ВЫРАЖЕНИЕ, НОРМАЛЬНАЯ ФОРМА, НОРМАЛИЗАЦИЯ ТЕКСТА, ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА, ЗАДАЧА КЛАССИФИКАЦИИ, НЕЙРОННАЯ СЕТЬ. Объект исследования – методы нормализации слов и выражений естественного языка. Цель работы – изучить методы нормализации слов и выражений языка, разработать и реализовать алгоритм нормализации текстов. Методы исследования – анализ, эксперимент, тестирование, сравнение. Результаты исследования: ∙ изучены наиболее распространённые подходы к решению задачи нормализации текстов; ∙ выделено две основных подзадачи: 1. классификация выражений; 2. построение нормализованной последовательности; ∙ рассмотрены методы решения выделенных подзадач; ∙ подготовлены данные для тренировки моделей машинного обучения; ∙ получена модель классификации выражений; ∙ обучена модель нормализации слов и выражений. |
URI документа: | http://elib.bsu.by/handle/123456789/221831 |
Располагается в коллекциях: | 1-31 81 09 - "Алгоритмы и системы обработки больших объемов информации" |
Полный текст документа:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
Климук ТА_АСОБОИ_2019.pdf | 669,23 kB | Adobe PDF | Открыть |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.