Development of hybrid code clone detection method based on formal and DL methods
Loading...
Date
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
В данной работе представлена разработка гибридного метода поиска клонов программного кода, который объединяет формальные методы и методы глубокого обучения. Обнаружение клонов кода является важной задачей в разработке программного обеспечения, так как оно способствует улучшению качества программ, снижению затрат на их поддержку и упрощению рефакторинга. Существующие инструменты, основанные на формальных методах, эффективно выявляют синтаксические клоны, но не справляются с семантическими клонами. Напротив, методы глубокого обучения хорошо обнаруживают семантические связи, но ограничены в реальных условиях. Предложенный гибридный метод использует формальный метод CCStokener и метод TBCCD, основанный на глубоком обучении. Эксперименты на бенчмарке BigCloneEval показали, что предложенная схема позволяет значительно улучшить результаты обнаружения клонов типа Moderately Type-3, повышая их полноту с 53% до 66%, сохраняя высокую точность.
This paper presents the development of a hybrid method for code clone detection, combining formal methods and deep learning techniques. Code clone detection is a crucial task in software development as it helps improve software quality, reduce maintenance costs, and simplify code refactoring. Existing tools based on formal methods are effective at detecting syntactic clones but struggle with semantic clones. Conversely, deep learning methods excel at identifying semantic relationships but are limited in real-world applications. The proposed hybrid method utilizes the formal method CCStokener and the deep learning-based method TBCCD. Experiments on the BigCloneEval benchmark demonstrate that the proposed scheme significantly improves the detection of Moderately Type-3 clones, increasing recall from 53% to 66% while maintaining high precision.
This paper presents the development of a hybrid method for code clone detection, combining formal methods and deep learning techniques. Code clone detection is a crucial task in software development as it helps improve software quality, reduce maintenance costs, and simplify code refactoring. Existing tools based on formal methods are effective at detecting syntactic clones but struggle with semantic clones. Conversely, deep learning methods excel at identifying semantic relationships but are limited in real-world applications. The proposed hybrid method utilizes the formal method CCStokener and the deep learning-based method TBCCD. Experiments on the BigCloneEval benchmark demonstrate that the proposed scheme significantly improves the detection of Moderately Type-3 clones, increasing recall from 53% to 66% while maintaining high precision.