Logo BSU

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот документ: https://elib.bsu.by/handle/123456789/323087
Заглавие документа: Multi-word expressions for Russian L2 learners: corpora-based selection with expert verification
Другое заглавие: Отбор многословных выражений на основе корпусных источников и экспертной оценки: обновление языкового содержания РКИ
Авторы: Laposhina, A.N.
Khramchanka, T.A.
Lebedeva, M.Yu.
Тема: ЭБ БГУ::Подразделение БГУ::Филологический факультет
Дата публикации: 2024
Издатель: Belgorod State National Research University
Библиографическое описание источника: Research Result Theoretical and Applied Linguistics. 2024 Jun 28;10(2):117.
Аннотация: The article describes the experience of creating a corpus-based list of the most relevant multi-word expressions for Russian L2 learners, distributed across the levels of the Common European Framework of Reference for Languages (CEFR) from A1 to C1. Modern linguistic and cognitive research shows that our speech is patterned and largely consists of stable segments. This fact is supported by the linguodidactic idea of teaching not isolated language units but their combinations of different nature. However, the selection and ranking of multi-word expressions based on language proficiency levels is constrained by the difficulty of automatically extracting them from a corpus of texts and estimating their frequency, as well as disagreements in defining the boundaries, linguistic nature, and terminology of multi-word expressions. This article describes the experience of compiling a list of the most valuable fixed-type multi-word expressions from various sources: two types of existing CEFR-graded vocabulary lists for Russian L2 learners – lexical minimums for the TORFL (Test of Russian as a Foreign Language) system and Russian KELLY (KEywords for Language Learning for Young and adults alike); the most frequent n-grams from the RuFoLa – Russian L2 textbook corpus and from the Russian Web corpus of internet texts; list of discourse formulas from the «Pragmaticon» project. The CEFR level of each multi-word expression is predicted using the frequency-based Max Delta measure, and its effectiveness is subsequently validated through annotation by multiple experts. The resulting list of multi-word expressions contains 1645 entries from A1 to C1 levels. The proposed version of the list has been implemented into an automated text analysis system for learners of Russian as a Foreign Language and can be useful for a wide range of professionals in the preparation of educational content for foreign language learners. The suggested Max Delta measure has demonstrated a high degree of agreement with expert evaluations within proficiency levels A1-B1. This signifies the importance of further exploring its potential in addressing related practical tasks and in selecting language learning content derived for other languages.
Аннотация (на другом языке): Статья описывает опыт создания с опорой на корпусные данные списка наиболее педагогически ценных многословных выражений для задач преподавания русского языка иностранным учащимся. Современные лингвистические и когнитивные исследования показывают, что наша речь шаблонизирована, во многом состоит из устойчивых сегментов. Этот факт подкрепляется и лингводидактической идеей обучения не изолированным языковым единицам, а их комплексам разной природы. Однако отбор и ранжирование по уровням языкового владения многословных выражений ограничивается трудностью их автоматизированного выделения из корпуса текстов и подсчетом частотности, а также разногласиями в определении границ многословных выражений, их лингвистической природы и терминологии. В данной статье описывается опыт компиляции списка многословных выражений фиксированного типа из разных источников: двух типов существующих уровневых списков РКИ, наиболее частотных n-gram корпуса текстов из учебников РКИ RuFoLa, корпуса интернет-текстов Russian Web, а также списка дискурсивных формул проекта «Прагматикон». В качестве меры определения языкового уровня многословного выражения используется мера максимальной Delta на основе информации о частотности выражения в корпусе учебных текстов для иностранных учащихся, эффективность которой затем проверяется множественной оценкой экспертов. Получившийся список многословных выражений содержит 1645 вхождений, распределенных по уровням шкалы CEFR от А1 до С1. Полученная версия списка внедрена в систему автоматического анализа сложности текста для изучающих РКИ и может быть полезна широкому кругу профильных специалистов при создании учебного контента. Предложенная мера максимальной Delta показала высокую степень совпадения с оценками уровня экспертами на уровнях A1-B1, что говорит о целесообразности дальнейшего изучения её потенциала для смежных прикладных задач и задач отбора языкового содержания на материале других языков.
URI документа: https://elib.bsu.by/handle/123456789/323087
DOI документа: 10.18413/2313-8912-2024-10-2-0-6
Scopus идентификатор документа: 85198120079
Финансовая поддержка: The article was prepared with the financial support of the state assignment of Ministry of Education and Science of the Russian Federation for 2020\u20132024 (No. FZNM-2020-0005) - Laposhina A.N., Lebedeva M.Yu. The study was conducted during the participation of Khramchanka T. A. in the fellowship programme \u00ABInteRussia\u00BB of the Gorchakov Fund.
Лицензия: info:eu-repo/semantics/openAccess
Располагается в коллекциях:Статьи филологического факультета (архив)

Полный текст документа:
Файл Описание РазмерФормат 
2024-02_июнь_Том_10_2-117-137.pdf804,97 kBAdobe PDFОткрыть
Показать полное описание документа Статистика Google Scholar



Все документы в Электронной библиотеке защищены авторским правом, все права сохранены.