Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/13632
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorСизанов Алексей Владимировичru_RU
dc.contributor.authorИлямакова Наталья Юрьевнаru_RU
dc.contributor.authorIliamakova Nataliaen_GB
dc.contributor.editorДобрынин Владимир Юрьевичru_RU
dc.contributor.editorDobrynin Vladimir Iurevichen_GB
dc.date.accessioned2018-07-26T15:26:29Z-
dc.date.available2018-07-26T15:26:29Z-
dc.date.issued2018-
dc.identifier.other040242en_GB
dc.identifier.urihttp://hdl.handle.net/11701/13632-
dc.description.abstractЗадача автоматического реферирования приобрела особую актуальность в наши дни, в эпоху развития современных цифровых технологий, когда объемы данных безостановочно растут. В данной работе рассмотрен такой подход к реферированию, как извлечение из текстов наиболее важных предложений. Важность предложения складывалась из важности входящих в него слов. Для подсчета полезности (важности) слова использовалась такая мера, как взаимная информация между словом и кластером. Кроме того рассматривались и сравнивались два метода кластеризации: Information Bottleneck и К-средних. На основе различных подходов был разработан алгоритм для автоматического реферирования текста, а затем с помощью полученного алгоритма строились рефераты к текстовым документам и сравнивались с "идеальными" рефератами и рефератами, построенными другими системами.ru_RU
dc.description.abstractThe task of text summarization has acquired a special urgency in our days, in the era of the development of modern digital technologies, when the volume of data is continuously growing. In this work, such an approach to abstracting as extracting from the texts of the most important sentences are considered. The importance of the sentence was made up of the importance of words entering into it.To calculate the usefulness (importance) of the word, a measure was used such as the mutual information between the word and the cluster. In addition, two clustering methods were considered and compared: Information Bottleneck and K-means. Based on various approaches, an algorithm was developed for automatic text summarization, and then, using the algorithm, text documents were summarized and the summaries were compared with "ideal" summaries and summaries constructed by other systems.en_GB
dc.language.isoru-
dc.subjectРеферирование документовru_RU
dc.subjectвзаимная информацияru_RU
dc.subjectкластеризацияru_RU
dc.subjectText summarizationen_GB
dc.subjectInformation Bottlenecen_GB
dc.subjectmutual informatiomen_GB
dc.subjectclusteringen_GB
dc.titleStudy on machine learning methods for text summarizationen_GB
dc.title.alternativeИсследование методов машинного обучения для автоматического реферирования документовru_RU
Располагается в коллекциях:BACHELOR STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.