Пожалуйста, используйте этот идентификатор, чтобы цитировать или ссылаться на этот ресурс:
http://hdl.handle.net/11701/25710
Полная запись метаданных
Поле DC | Значение | Язык |
---|---|---|
dc.contributor.advisor | Сироткин Александр Владимирович | ru_RU |
dc.contributor.advisor | Sirotkin Aleksandr Vladimirovic | en_GB |
dc.contributor.author | Осипов Анатолий Александрович | ru_RU |
dc.contributor.author | Osipov Anatolij Aleksandrovic | en_GB |
dc.contributor.editor | Петросян Ованес Леонович | ru_RU |
dc.contributor.editor | Petrosan Ovanes Leonovic | en_GB |
dc.date.accessioned | 2021-03-24T15:07:47Z | - |
dc.date.available | 2021-03-24T15:07:47Z | - |
dc.date.issued | 2019 | |
dc.identifier.other | 031903 | en_GB |
dc.identifier.uri | http://hdl.handle.net/11701/25710 | - |
dc.description.abstract | В данной работе разработана модель мультигентной игры в футбол для проведения обучения с подкреплением. Также был перенесён один из современных методов обучения с подкреплением на данную модель с изменением настроек. Этот метод был протестирован для различных гиперпараметров, и была показана эффективность данного метода. | ru_RU |
dc.description.abstract | In this thesis was developed a model of a multi-agent soccer game for reinforcement learning. One of the modern reinforcement learning methods was also transferred to this model with changing settings. This method has been tested for various hyperparameters, and the effectiveness of this method has been shown. | en_GB |
dc.language.iso | ru | |
dc.subject | контрфактуальный метод | ru_RU |
dc.subject | градиентный метод | ru_RU |
dc.subject | машинное обучение | ru_RU |
dc.subject | обучение с подкреплением | ru_RU |
dc.subject | мультиагентные среды | ru_RU |
dc.subject | алгоритм машинного обучения | ru_RU |
dc.subject | алгоритм обучения с подкреплением | ru_RU |
dc.subject | counterfactual method | en_GB |
dc.subject | policy gradient method | en_GB |
dc.subject | machine learning | en_GB |
dc.subject | reinforcement learning | en_GB |
dc.subject | multi-agent environment | en_GB |
dc.subject | machine learning algorithm | en_GB |
dc.subject | reinforcement learning algorithm | en_GB |
dc.title | Application of counterfactual multi-agent policy gradients agorithm to conflict-controlled multi-agent problems | en_GB |
dc.title.alternative | Применение контрфактуального градиентного алгоритма группового обучения для моделирования конфликтно-управляемых мультиагентных систем | ru_RU |
Располагается в коллекциях: | MASTER'S STUDIES |
Файлы этого ресурса:
Файл | Описание | Размер | Формат | |
---|---|---|---|---|
main.pdf | Article | 1,85 MB | Adobe PDF | Просмотреть/Открыть |
Все ресурсы в архиве электронных ресурсов защищены авторским правом, все права сохранены.