Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ:
https://elib.bsu.by/handle/123456789/255381
Заглавие документа: | Разработка алгоритма определения мнений в медиадискурсе на английском и белорусском языках |
Другое заглавие: | The design of the algorithm for opinion mining in the media discourse in English and Belarusian / V. V. Kazlova Распрацоўка алгарытму выяўлення меркаванняў у медыядыскурсе на англійскай і беларускай мовах / В. В. Казлова |
Авторы: | Козлова, В. В. |
Тема: | ЭБ БГУ::ОБЩЕСТВЕННЫЕ НАУКИ::Языкознание ЭБ БГУ::ГРАМАДСКІЯ НАВУКІ::Мовазнаўства |
Дата публикации: | 2020 |
Издатель: | Минск : БГУ |
Библиографическое описание источника: | Журнал Белорусского государственного университета. Филология = Journal of the Belarusian State University. Philology. - 2020. - № 3. - С. 40-49 |
Аннотация: | Рассматривается принципиальный алгоритм определения и классификации мнений в информационных и аналитических жанрах медийного дискурса на английском и белорусском языках, разработанный на основе словаря языковых единиц, маркирующих высказывания-мнения (733 единицы, функционирующих в более 5000 высказываний-мнений). Преимущество предложенной модели заключается в том, что она учитывает семантику выявленных единиц, их частотность, а также типологию высказываний-мнений В действия алгоритма включен ряд шагов: поиск маркеров мнения на основе разработанного словаря маркеров; присвоение каждому предложению определенного «веса» в зависимости от обнаруженных маркеров по сумме числовых значений из словаря (данные по «весу» языковых маркеров указываются в обобщенном виде); разделение высказываний на мнения-интерпретации, мнения-теории, мнения-предположения и комбинированные мнения. Классификация также учитывает семантические и количественные показатели. |
Аннотация (на другом языке): | The article runs about the design of the algorithm for opinion mining in the media discourse in English and Belarusian. The algorithm is based on the vocabularies of linguistic units that mark opinions in the media discourse (733 units that are mentioned in more than 5000 opinionated contexts). The advantage of the proposed model lies in the fact that it considers the semantical meaning of the linguistic markers in both languages, their frequency, and the typology of opinionated passages in the context of automatic sorting of opinions. The algorithm includes a number of steps: the search of opinion markers based on the developed vocabularies of linguistic markers, the assignment of a certain «weight» to each sentence depending on the markers (by the sum of numeric values from the vocabulary; the article provides data on the «weight» of linguistic markers in a generalized form), then statements are divided into opinions-interpretations, opinions-theories, opinions-assumptions and an opinion’s combined type. The classification takes into account semantic and quantitative indicators. = Разглядаецца прынцыповы алгарытм ідэнтыфікацыі і класіфікацыі меркаванняў у інфармацыйных і аналітычных жанрах медыйнага дыскурсу на англійскай і беларускай мовах, распрацованы на аснове слоўніка моўных адзінак, якія маркіруюць выказванні-меркаванні (733 адзінкі, якія функцыянуюць у больш чым 5000 выказваннях-меркаваннях). Перавага прапанаванай мадэлі заключаецца ў тым, што яна ўлічвае семантыку моўных адзінак, іх колькасныя даныя, а таксама тыпалогію выказванняў-меркаванняў. У дзеянні алгарытму ўключаны шэраг крокаў: пошук маркераў меркавання на аснове распрацаванага слоўніка маркераў; прысваенне кожнаму сказу пэўнай «вагі» ў залежнасці ад выяўленых маркераў па суме лікавых значэнняў са слоўніка (даныя па «вазе» моўных маркераў прыводзяцца ў агульным выглядзе); падзел на меркаванні-інтэрпрэтацыі, меркаванні-тэорыі, меркаванні-прагнозы і камбінаваныя меркаванні. Класіфікацыя таксама ўлічвае семантычныя і колькасныя паказчыкі. |
Доп. сведения: | Автор выражает признательность за помощь в выполнении исследования доктору филологических наук, профессору Т. П. Карпилович. |
URI документа: | https://elib.bsu.by/handle/123456789/255381 |
ISSN: | 2521-6775 |
Лицензия: | info:eu-repo/semantics/openAccess |
Располагается в коллекциях: | 2020, №3 |
Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.