Application of counterfactual multi-agent policy gradients agorithm to conflict-controlled multi-agent problems

Осипов Анатолий Александрович; Osipov Anatolij Aleksandrovic

Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс: http://hdl.handle.net/11701/25710

Полная запись метаданных

Поле DC	Значение	Язык
dc.contributor.advisor	Сироткин Александр Владимирович	ru_RU
dc.contributor.advisor	Sirotkin Aleksandr Vladimirovic	en_GB
dc.contributor.author	Осипов Анатолий Александрович	ru_RU
dc.contributor.author	Osipov Anatolij Aleksandrovic	en_GB
dc.contributor.editor	Петросян Ованес Леонович	ru_RU
dc.contributor.editor	Petrosan Ovanes Leonovic	en_GB
dc.date.accessioned	2021-03-24T15:07:47Z	-
dc.date.available	2021-03-24T15:07:47Z	-
dc.date.issued	2019
dc.identifier.other	031903	en_GB
dc.identifier.uri	http://hdl.handle.net/11701/25710	-
dc.description.abstract	В данной работе разработана модель мультигентной игры в футбол для проведения обучения с подкреплением. Также был перенесён один из современных методов обучения с подкреплением на данную модель с изменением настроек. Этот метод был протестирован для различных гиперпараметров, и была показана эффективность данного метода.	ru_RU
dc.description.abstract	In this thesis was developed a model of a multi-agent soccer game for reinforcement learning. One of the modern reinforcement learning methods was also transferred to this model with changing settings. This method has been tested for various hyperparameters, and the effectiveness of this method has been shown.	en_GB
dc.language.iso	ru
dc.subject	контрфактуальный метод	ru_RU
dc.subject	градиентный метод	ru_RU
dc.subject	машинное обучение	ru_RU
dc.subject	обучение с подкреплением	ru_RU
dc.subject	мультиагентные среды	ru_RU
dc.subject	алгоритм машинного обучения	ru_RU
dc.subject	алгоритм обучения с подкреплением	ru_RU
dc.subject	counterfactual method	en_GB
dc.subject	policy gradient method	en_GB
dc.subject	machine learning	en_GB
dc.subject	reinforcement learning	en_GB
dc.subject	multi-agent environment	en_GB
dc.subject	machine learning algorithm	en_GB
dc.subject	reinforcement learning algorithm	en_GB
dc.title	Application of counterfactual multi-agent policy gradients agorithm to conflict-controlled multi-agent problems	en_GB
dc.title.alternative	Применение контрфактуального градиентного алгоритма группового обучения для моделирования конфликтно-управляемых мультиагентных систем	ru_RU
Располагается в коллекциях:	MASTER'S STUDIES

Файлы этого ресурса:

Файл	Описание	Размер	Формат
main.pdf	Article	1,85 MB	Adobe PDF	Просмотреть/Открыть

Показать базовое описание ресурса Просмотр статистики

Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.

Архив открытого доступаСанкт-Петербургского государственного университета

Архив открытого доступа
Санкт-Петербургского государственного университета