Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/40898
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorКипяткова Ирина Сергеевнаru_RU
dc.contributor.advisorKipatkova Irina Sergeevnaen_GB
dc.contributor.authorПоволоцкая Анастасия Андреевнаru_RU
dc.contributor.authorPovolockaa Anastasia Andreevnaen_GB
dc.contributor.editorЕвдокимова Вера Вячеславовнаru_RU
dc.contributor.editorEvdokimova Vera Vaceslavovnaen_GB
dc.date.accessioned2023-04-06T21:52:26Z-
dc.date.available2023-04-06T21:52:26Z-
dc.date.issued2022
dc.identifier.other085785en_GB
dc.identifier.urihttp://hdl.handle.net/11701/40898-
dc.description.abstractНа данный момент распознавание эмоций является одной из самых актуальных тем в области машинного обучения и нейросетевых технологий. В работе описывается процесс записи и предобработки корпуса эмоциональной речи. В основу корпуса вошел уникальный список фраз, и соответствующие им контексты. Записанный корпус был обработан и прошел апробацию с помощью перцептивного эксперимента. Все аудио-фрагменты были преобразованы в изображения контуров основного тона, спектрограммы и мел-спектрограммы. Все четыре сформированные наборы данных (начальный набор данных; начальный набор данных без разбалансировки; начальный набор данных для бинарной классификации; набор данных, прошедший перцептивный эксперимент для бинарной классификации) были протестированы на четырехслойной модели сверточной нейронной сети. Реализованная сверточная нейронная сеть показала результаты ниже среднего на изображениях контура основного тона; средний результат был достигнут на спектрограммах (начальный набор данных без разбалансировки, начальный набор данных для бинарной классификации) и мел-спектрограммах (начальный набор данных для бинарной классификации). Результат выше среднего были достигнуты на наборах данных после перцептивного эксперимента, как у спектрограмм, так и мел-спектрограмм.ru_RU
dc.description.abstractNowadays, emotion recognition is the topic of current interest in the field of machine learning and neural networks. The thesis describes an experiment of recording of emotional speech dataset, which was based on a unique list of phrases with the corresponding contexts. The recorded dataset was processed and series of perceptual tests were performed. All audio fragments were transformed into pictures: tone contour, spectrograms and mel-spectrograms. All four formed datasets (initial data set; initial data set without unbalancing; initial data set for binary classification; data set that has passed an auditory experiment for binary classification) were tested on a four -layer model of CNN. The developed CNN showed results below average on pictures of the main tone contour; average results on spectrograms (initial dataset without imbalance, initial dataset for binary classification) and mel-spectrograms (dataset for binary classification); above average results were shown on datasets after auditory experiment for binary classification both spectrograms and mel-spectrograms.en_GB
dc.language.isoru
dc.subjectраспознавание эмоцийru_RU
dc.subjectнейронные сетиru_RU
dc.subjectнейросетевые технологииru_RU
dc.subjectкорпус эмоциональной речиru_RU
dc.subjectперцептивный экспериментru_RU
dc.subjectemotion recognitionen_GB
dc.subjectneural networksen_GB
dc.subjectneural network technologyen_GB
dc.subjectemotional speech dataseten_GB
dc.subjectauditory experimenten_GB
dc.titleNegative emotion recognition using neural networksen_GB
dc.title.alternativeРаспознавание негативных эмоций с использованием нейросетевых технологийru_RU
Располагается в коллекциях:MASTER'S STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.