Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/44675
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorКовальчук Сергей Валерьевичru_RU
dc.contributor.advisorKovalcuk Sergej Valerevicen_GB
dc.contributor.authorОмельченко Максим Андреевичru_RU
dc.contributor.authorOmelcenko Maksim Andreevicen_GB
dc.contributor.editorБулычев Дмитрий Юрьевичru_RU
dc.contributor.editorBulycev Dmitrij Urevicen_GB
dc.date.accessioned2024-01-23T13:54:22Z-
dc.date.available2024-01-23T13:54:22Z-
dc.date.issued2023
dc.identifier.other075972en_GB
dc.identifier.urihttp://hdl.handle.net/11701/44675-
dc.description.abstractС приходом больших генеративных моделей появилась возможность автоматической генерации программного кода. Это позволяет сэкономить время миллионов разработчиков а также автоматизировать процессы разработки. Цель этой работы --- улучшить качество генерации кода для уже существующих генеративных моделей. Для достижения этой цели, предлагается метод дообучения больших языковых моделей, который заключается в добавлении специальных ключевых слов к входу в качестве подсказки. В работе были проведены эксперименты в области ответов на вопросы на платформе Stack Overflow. Эксперименты показали эффективность предложенного метода, а лучшая дообученная модель набрала 0.44 BLEU на публичном датасете по генерации кода CoNaLa, опережая предыдущий лучший результат на 0.10 BLEU.ru_RU
dc.description.abstractWith the advent of Large Language Models (LLM), it became possible to automatically generate program code. This saves time for millions of developers and automates development processes. The purpose of this work is to improve the quality of code generation for already existing generative models. To achieve this goal, a method for fine-tuning LLMs is proposed, which consists in adding special keywords to the input as a prompt. Further, experiments were conducted in the field of answering questions on the Stack Overflow platform. The experiments showed the effectiveness of the proposed method, and the best fine-tuned model scored 0.44 BLEU on the public code generation CoNaLa dataset, ahead of the previous best result by 0.10 BLEU.en_GB
dc.language.isoru
dc.subjectМашинное обучениеru_RU
dc.subjectCQA платформыru_RU
dc.subjectГлубокое обучениеru_RU
dc.subjectГенерация кодаru_RU
dc.subjectБольшие языковые моделиru_RU
dc.subjectMachine Learningen_GB
dc.subjectCQA sitesen_GB
dc.subjectDeep Learningen_GB
dc.subjectCode Generationen_GB
dc.subjectLarge Language Modelsen_GB
dc.titleThe investigation of generative models in the problem of finding the optimal answer to specialized questions with application to StackOverflowen_GB
dc.title.alternativeИсследование генеративных моделей в задаче поиска оптимального ответа на специализированные вопросы на примере StackOverflowru_RU
Располагается в коллекциях:BACHELOR STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
diploma.pdfArticle1,29 MBAdobe PDFПросмотреть/Открыть
reviewSV_review.pdfReviewSV104 kBAdobe PDFПросмотреть/Открыть
reviewSV_st075972_Omelcenko_Maksim_Andreevic_(supervisor)(Ru).txtReviewSV2,98 kBTextПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.