Audio data analysis and event recognition for security systems

Abstract

В данной работе рассматривается задача классификации аудио информации, а также применяется архитектура свёрточных нейронной сетей, которая достигает хороших результатов в других прикладных задачах. Помимо этого, описывается реализация алгоритма извлечения характеристик, скачивания и подготовки данных. Для повышения качества работы классификатора представлены методы увеличения объёма данных и регуляризации. Веса нейронной сети, которая предварительно обучается на большом наборе данных, используются для небольшого узкоспециализированного набора городских звуков. Полученные модели сравниваются по точности и времени обучения в задачах бинарной классификации и мультиклассификации.
In this work we consider the audio classification task and use the architecture of convolutional neural network that achieve high results in other applications. In addition, we describe the implementation of the algorithm for extracting features, downloading and preprocessing the data. Methods for data augmentation and regularization are introduced to improve the quality of the classifier. We train the model on a large dataset and use the weights of the pretrained model for a small dataset of urban sounds. The resulting models are compared in terms of accuracy and training time for binary classification and multiclassification.

Description

Citation

Collections

Endorsement

Review

Supplemented By

Referenced By