Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/221831
Заглавие документа: Задача нормализации содержащих общепринятые аббревиатуры и выражения текстов: магистерская диссертация / Татьяна Алексеевна Климук; БГУ, Факультет прикладной математики и информатики, Кафедра дискретной математики и алгоритмики; науч. рук. Соболевская Е. П.
Авторы: Климук, Татьяна Алексеевна
Тема: ЭБ БГУ::ЕСТЕСТВЕННЫЕ И ТОЧНЫЕ НАУКИ::Математика
ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Информатика
Дата публикации: 2019
Аннотация: Магистерская диссертация 47 с., 3 рис., 8 таблиц, 13 источников. Ключевые слова: ЛЕКСЕМА, ВЫРАЖЕНИЕ, НОРМАЛЬНАЯ ФОРМА, НОРМАЛИЗАЦИЯ ТЕКСТА, ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА, ЗАДАЧА КЛАССИФИКАЦИИ, НЕЙРОННАЯ СЕТЬ. Объект исследования – методы нормализации слов и выражений естественного языка. Цель работы – изучить методы нормализации слов и выражений языка, разработать и реализовать алгоритм нормализации текстов. Методы исследования – анализ, эксперимент, тестирование, сравнение. Результаты исследования: ∙ изучены наиболее распространённые подходы к решению задачи нормализации текстов; ∙ выделено две основных подзадачи: 1. классификация выражений; 2. построение нормализованной последовательности; ∙ рассмотрены методы решения выделенных подзадач; ∙ подготовлены данные для тренировки моделей машинного обучения; ∙ получена модель классификации выражений; ∙ обучена модель нормализации слов и выражений.
URI документа: http://elib.bsu.by/handle/123456789/221831
Располагается в коллекциях:1-31 81 09 - "Алгоритмы и системы обработки больших объемов информации"

Полный текст документа:
Файл Описание РазмерФормат 
Климук ТА_АСОБОИ_2019.pdf669,23 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.