현재, 강화학습을 기반으로한 Dynamic Scheduling을 연구하고 있는 나로써는 매우 읽어보고 싶은 책이었고, 마침 좋은 기회가 생겨 책을 읽어볼 수가 있었다. 책에 대한 리뷰는 다음과 같다.
강화학습 알고리즘을 구성하는데에 있어, 내가 개인적으로 가장 중요하다고 생각되는 부분은 도메인에 맞는 환경을 직접 구성하는 데에 있다고 생각한다.
하지만, 이 부분은 꽤 많은 코드를 요구하고 있으며, 시작하기 전에 한숨만 나오는 상황이다. 나는 이 책을 그런 부분에서 좀 조언을 얻고자 읽고 싶었던 마음이 컸다.
이 책을 읽어본 결과, 장점은 다음과 같다.
1. 최근에 뜨거운 관심을 받았던 알파고의 빌드업 과정에 대해 쉽게 이해할 수가 있다.
2. 강화학습 환경구성 및 인식에는 무엇이 중요하며, 학습과정에서는 어떤 정책이 기반으로 되는지, 이세돌과의 대결에서 알파고는 어떻게 작동하고 있었는지 쉽게 이해할 수가 있다.
3. 시각적 자료가 잘 정리되어 있다.
4. 기반 논문에 대한 제목을 하나하나 첨부해주었기에, 더 자세하게 공부하고 싶을 경우, 편하게 접근할 수가 있다.
5. 딥러닝, 강화학습 등에 대한 개념이 부족해도, 이 책에서 해당 이론에 대한 컨셉만큼은 확실하게 설명해주기에, 이해하는데 불편함이 적어진다. (그래도, 기본적인 지식이 있으면 이해하기에는 더 수월할 것이다.)
현재, Dynamic Scheduling을 위한 강화학습 환경을 직접 구성하고 있는데, 학습 속도를 어떻게 하면 빠르게 개선시킬 수 있을까라는 고민을 하던 와중에, 이 책을 통해 어떻게 하면 되겠다라는 아이디어를 얻었으며, 이 아이디어를 통해 가치가 있는 논문을 작성해보려고 한다.
대학원생활 만족하시나요?
답글삭제네 살만해요
삭제