Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/25695
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorАнфиногенов Сергей Олеговичru_RU
dc.contributor.advisorAnfinogenov Sergej Olegovicen_GB
dc.contributor.authorПискунова Анна Сергеевнаru_RU
dc.contributor.authorPiskunova Anna Sergeevnaen_GB
dc.contributor.editorМалинина Мария Анатольевнаru_RU
dc.contributor.editorMalinina Maria Anatolevnaen_GB
dc.date.accessioned2021-03-24T15:07:45Z-
dc.date.available2021-03-24T15:07:45Z-
dc.date.issued2019
dc.identifier.other031320en_GB
dc.identifier.urihttp://hdl.handle.net/11701/25695-
dc.description.abstractВ работе рассмаривается автоматизация определения уровня сложности английского текста путем машинного обучения. За шкалу сложности принято соответствие общепринятым в методике CEFR уровням владения иностранным языком: Elementary(Beginner), Pre-intermediate, Intermediate, Advanced. Работа изложена на 43 страницах. В математической постановке задачи приведена математическая модель текстов и рассмотрены алгоритмы классификации и кластеризации текстов: классификатор Байеса, «Случайный лес», деревья решений, множественная линейная регрессия, алгоритм Краскала. Автор работы показал, чтопоставленную задачу можно решать автомат­ически: один из рассматриваемых методов, классификат­ор Байеса, показывает достаточно точный результат. Подобранн­ые характеристические функции, определяю­щие векторную модель текста, хорошо подх­одят для автоматичес­кой классификации.ru_RU
dc.description.abstractAutomatic determination of the complexity of English texts according to CEFR levels is considered in the paper. There are 4 levels: Elementary (Beginner), Pre-intermediate, Intermediate, Advanced. The work is presented on 43 pages.In the chapter devoted to the mathematical problem, the mathematical model, classification and clustering algoritmhs are presented, as follows: Bayesian learning, «Random forest», decision trees, multiple linear regression, Kruskal`s algoritm. Author of the work has demonstrated, that the aim can be achieved automatically. One of the methods described in the paper, Bayesian learning, is giving reasonably accurate result. Selected characteristic functions that determine the vector model of a text are well suited for automatic classification.en_GB
dc.language.isoru
dc.subjectавтоматическая классификацияru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectработа с текстомru_RU
dc.subjectметод Байесаru_RU
dc.subjectдеревья решенийru_RU
dc.subjectautomatic classificationen_GB
dc.subjectmachine learningen_GB
dc.subjecttext processingen_GB
dc.subjectBayesian methoden_GB
dc.subjectdecision treesen_GB
dc.titleAutomatic determination of the complexity of English texts according to CEFR levelsen_GB
dc.title.alternativeАвтоматическое определение уровня сложности английских текстов по шкале CEFRru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
diplom_magistr.pdfArticle1,36 MBAdobe PDFПросмотреть/Открыть
reviewSV_piskunova.jpgReviewSV4,41 MBJPEGЭскиз
Просмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.