Automatic determination of the complexity of English texts according to CEFR levels

Пискунова Анна Сергеевна; Piskunova Anna Sergeevna

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/25695

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Анфиногенов Сергей Олегович	ru_RU
dc.contributor.advisor	Anfinogenov Sergej Olegovic	en_GB
dc.contributor.author	Пискунова Анна Сергеевна	ru_RU
dc.contributor.author	Piskunova Anna Sergeevna	en_GB
dc.contributor.editor	Малинина Мария Анатольевна	ru_RU
dc.contributor.editor	Malinina Maria Anatolevna	en_GB
dc.date.accessioned	2021-03-24T15:07:45Z	-
dc.date.available	2021-03-24T15:07:45Z	-
dc.date.issued	2019
dc.identifier.other	031320	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/25695	-
dc.description.abstract	В работе рассмаривается автоматизация определения уровня сложности английского текста путем машинного обучения. За шкалу сложности принято соответствие общепринятым в методике CEFR уровням владения иностранным языком: Elementary(Beginner), Pre-intermediate, Intermediate, Advanced. Работа изложена на 43 страницах. В математической постановке задачи приведена математическая модель текстов и рассмотрены алгоритмы классификации и кластеризации текстов: классификатор Байеса, «Случайный лес», деревья решений, множественная линейная регрессия, алгоритм Краскала. Автор работы показал, чтопоставленную задачу можно решать автоматически: один из рассматриваемых методов, классификатор Байеса, показывает достаточно точный результат. Подобранные характеристические функции, определяющие векторную модель текста, хорошо подходят для автоматической классификации.	ru_RU
dc.description.abstract	Automatic determination of the complexity of English texts according to CEFR levels is considered in the paper. There are 4 levels: Elementary (Beginner), Pre-intermediate, Intermediate, Advanced. The work is presented on 43 pages.In the chapter devoted to the mathematical problem, the mathematical model, classification and clustering algoritmhs are presented, as follows: Bayesian learning, «Random forest», decision trees, multiple linear regression, Kruskal`s algoritm. Author of the work has demonstrated, that the aim can be achieved automatically. One of the methods described in the paper, Bayesian learning, is giving reasonably accurate result. Selected characteristic functions that determine the vector model of a text are well suited for automatic classification.	en_GB
dc.language.iso	ru
dc.subject	автоматическая классификация	ru_RU
dc.subject	машинное обучение	ru_RU
dc.subject	работа с текстом	ru_RU
dc.subject	метод Байеса	ru_RU
dc.subject	деревья решений	ru_RU
dc.subject	automatic classification	en_GB
dc.subject	machine learning	en_GB
dc.subject	text processing	en_GB
dc.subject	Bayesian method	en_GB
dc.subject	decision trees	en_GB
dc.title	Automatic determination of the complexity of English texts according to CEFR levels	en_GB
dc.title.alternative	Автоматическое определение уровня сложности английских текстов по шкале CEFR	ru_RU
Располагается в коллекциях:	MASTER'S STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
diplom_magistr.pdf	Article	1,36 MB	Adobe PDF	Просмотреть/Открыть
reviewSV_piskunova.jpg	ReviewSV	4,41 MB	JPEG	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета