Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/40344
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorМамаев Иван Дмитриевичru_RU
dc.contributor.advisorMamaev Ivan Dmitrievicen_GB
dc.contributor.authorВаренникова Анастасия Станиславовнаru_RU
dc.contributor.authorVarennikova Anastasia Stanislavovnaen_GB
dc.contributor.editorМитренина Ольга Владимировнаru_RU
dc.contributor.editorMitrenina Olga Vladimirovnaen_GB
dc.date.accessioned2023-04-06T21:50:41Z-
dc.date.available2023-04-06T21:50:41Z-
dc.date.issued2022
dc.identifier.other070077en_GB
dc.identifier.urihttp://hdl.handle.net/11701/40344-
dc.description.abstractВ работе исследуются методы классификации текстов, совмещающих в себе естественный язык и части кода на языке программирования Python. В практической части рассматривается реализация программы для автоматической сортировки комментариев студентов обучающей платформы "JetBrains Academy". Алгоритм возвращает только полезную обратную связь к обучающим материалам на сайте компании, на основе которых можно внести улучшения в теорию и практические задания. В программе использует один из четырех методов машинного обучения с учителем, описанных в теоретической главе, в сочетании с дополнительной проверкой на наличие в текстах определенных n-грамм, указывающих на релевантность комментария. Также в работе подробно описывается очистка исходного размеченного датасета, предобработка комментариев в нем и векторизация текстовых данных.ru_RU
dc.description.abstractThe paper investigates the text classification methods that combine natural language and code blocks written in Python programming language. The study focuses on a Python program which automatically sorts feedback comments from students of the online educational platform "JetBrains Academy". The algorithm returns only the insightful feedback on the educational content published on the company website, which can later be used to improve the theoretical section as well as practical assignments. The program utilizes one the the four supervised machine learning methods described in the theoretical chapter, along with an additional check for the presence of certain n-grams in the texts, indicating the relevance of the comment. The paper also contains the detailed description of the tagged dataset cleaning, the preprocessing of comments in it, and the vectorization of textual data.en_GB
dc.language.isoru
dc.subjectPythonru_RU
dc.subjectестественный языкru_RU
dc.subjectдатасетru_RU
dc.subjectмашинное обучение с учителемru_RU
dc.subjectклассификацияru_RU
dc.subjectвекторизацияru_RU
dc.subjectn-граммыru_RU
dc.subjectрегулярные выраженияru_RU
dc.subjectPythonen_GB
dc.subjectnatural languageen_GB
dc.subjectdataseten_GB
dc.subjectsupervised learningen_GB
dc.subjectclassificationen_GB
dc.subjectvectorizationen_GB
dc.subjectn-grammsen_GB
dc.subjectregular expressionsen_GB
dc.titleAutomatic identification of useful feedback from comments to the educational resources of the JetBrains Academy platformen_GB
dc.title.alternativeАвтоматическое выявление полезной обратной связи из комментариев к обучающим материалам платформы "JetBrains Academy"ru_RU
Располагается в коллекциях:BACHELOR STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.