Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/25710
Полная запись метаданных
Поле DCЗначениеЯзык
dc.contributor.advisorСироткин Александр Владимировичru_RU
dc.contributor.advisorSirotkin Aleksandr Vladimirovicen_GB
dc.contributor.authorОсипов Анатолий Александровичru_RU
dc.contributor.authorOsipov Anatolij Aleksandrovicen_GB
dc.contributor.editorПетросян Ованес Леоновичru_RU
dc.contributor.editorPetrosan Ovanes Leonovicen_GB
dc.date.accessioned2021-03-24T15:07:47Z-
dc.date.available2021-03-24T15:07:47Z-
dc.date.issued2019
dc.identifier.other031903en_GB
dc.identifier.urihttp://hdl.handle.net/11701/25710-
dc.description.abstractВ данной работе разработана модель мультигентной игры в футбол для проведения обучения с подкреплением. Также был перенесён один из современных методов обучения с подкреплением на данную модель с изменением настроек. Этот метод был протестирован для различных гиперпараметров, и была показана эффективность данного метода.ru_RU
dc.description.abstractIn this thesis was developed a model of a multi-agent soccer game for reinforcement learning. One of the modern reinforcement learning methods was also transferred to this model with changing settings. This method has been tested for various hyperparameters, and the effectiveness of this method has been shown.en_GB
dc.language.isoru
dc.subjectконтрфактуальный методru_RU
dc.subjectградиентный методru_RU
dc.subjectмашинное обучениеru_RU
dc.subjectобучение с подкреплениемru_RU
dc.subjectмультиагентные средыru_RU
dc.subjectалгоритм машинного обученияru_RU
dc.subjectалгоритм обучения с подкреплениемru_RU
dc.subjectcounterfactual methoden_GB
dc.subjectpolicy gradient methoden_GB
dc.subjectmachine learningen_GB
dc.subjectreinforcement learningen_GB
dc.subjectmulti-agent environmenten_GB
dc.subjectmachine learning algorithmen_GB
dc.subjectreinforcement learning algorithmen_GB
dc.titleApplication of counterfactual multi-agent policy gradients agorithm to conflict-controlled multi-agent problemsen_GB
dc.title.alternativeПрименение контрфактуального градиентного алгоритма группового обучения для моделирования конфликтно-управляемых мультиагентных системru_RU
Располагается в коллекциях:MASTER'S STUDIES

Файлы этого ресурса:
Файл Описание РазмерФормат 
main.pdfArticle1,85 MBAdobe PDFПросмотреть/Открыть


Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.