Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/42629
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorБондарев Антон Владимировичru_RU
dc.contributor.advisorBondarev Anton Vladimirovicen_GB
dc.contributor.authorГлазырин Антон Георгиевичru_RU
dc.contributor.authorGlazyrin Anton Georgievicen_GB
dc.contributor.editorЛуцив Дмитрий Вадимовичru_RU
dc.contributor.editorLuciv Dmitrij Vadimovicen_GB
dc.date.accessioned2023-07-26T12:44:25Z-
dc.date.available2023-07-26T12:44:25Z-
dc.date.issued2023
dc.identifier.other054643en_GB
dc.identifier.urihttp://hdl.handle.net/11701/42629-
dc.description.abstractДокументация является неотъемлемой частью любого крупного проекта и тоже требует сопровождения. Одним из наиболее влиятельных факторов усложнения ведения документации является наличие большого количества повторов. Для улучшения документации на основе поиска повторов был разработан инструмент Duplicate Finder. Однако, у него есть ряд проблем с компонентами поиска. В данной работе описывается разработка и реализация унифицированной системы поиска точных и неточных повторов, предназначенной заменить эти компоненты. Сначала проводится анализ инструментов из Duplicate Finder, потом разбираются основные этапы конвейера и приводится описание алгоритмов поиска. Затем проводится тестирование реализованного инструмента на наборе документов, представляющих собой документации разных крупных проектов.ru_RU
dc.description.abstractDocumentation is a vital part of any big project and it's necessary to maintain its quality. One of the factors that can affect this process negatively is the abundance of duplicates. In order to solve this problem, a tool called Duplicate Finder was implemented. Based on duplicate search, this tool can be used to improve the quality of documentation. However, there are some problems regarding some of the components which are responsible for search. This thesis is focused on developing and implementing universal search engine for exact and near-duplicates. First, tools used in Duplicate Finder are analyzed, then the main parts of pipeline and search algorithms are described. Finally, the implemented tool is tested on a compilation of documents that consists of documentations from different projects.en_GB
dc.language.isoru
dc.subjectпоиск неточных повторовru_RU
dc.subjectдокументацияru_RU
dc.subjectпрограммное обеспечениеru_RU
dc.subjectсуффиксный массивru_RU
dc.subjectхешированиеru_RU
dc.subjectn-граммыru_RU
dc.subjectnear-duplicate searchen_GB
dc.subjectdocumentationen_GB
dc.subjectsoftwareen_GB
dc.subjectsuffix arrayen_GB
dc.subjecthashingen_GB
dc.subjectn-gramen_GB
dc.titleUniversal initial duplicate search engine for the Duplicate Finder toolkiten_GB
dc.title.alternativeУниверсальный механизм первичного поиска повторов в тексте для пакета Duplicate Finderru_RU
Располагается в коллекциях:MASTER'S STUDIES



Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.