[시즌RL].Lecture 2 - OpenAI GYM 게임해보기

* 이 글은 홍콩과기대 김성훈 교수님의 무료 동영상 강좌 "모두를 위한 머신러닝과 딥러닝 강의"를 보고 요점을 정리한 글 입니다.

 

OpenAI GYM

Reinforcement Learning(강화 학습)은 Agent와 Environment(환경)로 구성되어 있습니다. Agent가 어떠한 Action(행동)을 하게 되면 그것에 따른 Environment에서의 State(상태)와 Reward(보상)에 대한 정보를 받게 되고 이것을 통하여 학습을 하는 것이 Reinforcement Learning인데, 여기서 Environment를 전부 구현하는 것은 매우 어렵습니다. 이런 구현하기 어려운 Environment가 미리 구현되어져 있고 이것을 라이브러리를 통해 쉽게 사용할 수 있게 제공하는 것이 OpenAI GYM입니다. OpenAI GYM에는 Atari, Frozen Lake등 많은 게임에 대한 Environment들이 구현되어져 있습니다.

 

OpenAI GYM를 사용하면 현재 상태, 보상, 게임의 종료, 추가정보들을 Environment에서 얻을 수 있습니다. Agent가 Action을 취하면 State와 Reward를 받고 만약 Agent가 Goal에 도착하면 Reward값은 1, 그 외에는 0을 받습니다. 이런 규칙들을 일반화하면 이론적으로 모든 게임에 적용이 가능합니다.