
교양도서
파이썬과 케라스로 배우는 강화학습: 내 손으로 직접 구현하는 게임 인공지능
- 발행사항
- 파주 : 위키북스, 2017
- 형태사항
- xxix, 344 p. : 천연색삽화, 도표 ; 24 cm
- 총서사항
- 데이터 사이언스 시리즈 ; 004
- 서지주기
- 참고문헌(p. 340)과 색인수록
소장정보
위치 | 등록번호 | 청구기호 / 출력 | 상태 | 반납예정일 |
---|---|---|---|---|
이용 가능 (1) | ||||
자료실 | G101450 | 대출가능 | - |
이용 가능 (1)
- 등록번호
- G101450
- 상태/반납예정일
- 대출가능
- -
- 위치/청구기호(출력)
- 자료실
책 소개
"강화학습을 쉽게 이해하고 코드로 구현하기"
강화학습의 기초부터 최근 알고리즘까지 친절하게 설명한다!
'알파고'로부터 받은 신선한 충격으로 많은 사람들이 강화학습에 관심을 가지기 시작했다. 하지만 처음 강화학습을 공부하는 분들을 위한 쉬운 자료나 강의를 찾아보기 어려웠다. 외국 강의를 통해 어렵게 이론을 공부하더라도 강화학습을 구현하는 데는 또 다른 장벽이 있었다. 이 책은 강화학습을 처음 공부하는 데 어려움을 겪는 독자를 위해 이론부터 코드 구현까지의 가이드를 제시한다.
★ 이 책에서 다루는 내용 ★
◎ 강화학습의 배경과 개념
◎ 강화학습의 기초 이론: MDP, 벨만 방정식, 다이내믹 프로그래밍
◎ 고전 강화학습 알고리즘: 몬테카를로, 살사, 큐러닝
◎ 인공신경망을 이용한 강화학습 알고리즘: 딥살사, REINFORCE, DQN, 액터-크리틱, A3C
◎ 강화학습 알고리즘 구현: 그리드월드, 카트폴, 아타리게임
강화학습의 기초부터 최근 알고리즘까지 친절하게 설명한다!
'알파고'로부터 받은 신선한 충격으로 많은 사람들이 강화학습에 관심을 가지기 시작했다. 하지만 처음 강화학습을 공부하는 분들을 위한 쉬운 자료나 강의를 찾아보기 어려웠다. 외국 강의를 통해 어렵게 이론을 공부하더라도 강화학습을 구현하는 데는 또 다른 장벽이 있었다. 이 책은 강화학습을 처음 공부하는 데 어려움을 겪는 독자를 위해 이론부터 코드 구현까지의 가이드를 제시한다.
★ 이 책에서 다루는 내용 ★
◎ 강화학습의 배경과 개념
◎ 강화학습의 기초 이론: MDP, 벨만 방정식, 다이내믹 프로그래밍
◎ 고전 강화학습 알고리즘: 몬테카를로, 살사, 큐러닝
◎ 인공신경망을 이용한 강화학습 알고리즘: 딥살사, REINFORCE, DQN, 액터-크리틱, A3C
◎ 강화학습 알고리즘 구현: 그리드월드, 카트폴, 아타리게임
목차
[1부] 강화학습 소개
1장: 강화학습 개요
강화학습의 개념
강화학습 문제
강화학습의 예시: 브레이크아웃
정리
[2부] 강화학습 기초
2장: 강화학습 기초 1 - MDP와 벨만 방정식
MDP
가치함수
벨만 방정식
정리
3장: 강화학습 기초 2 - 그리드월드와 다이내믹 프로그래밍
다이내믹 프로그래밍과 그리드월드
다이내믹 프로그래밍 1: 정책 이터레이션
다이내믹 프로그래밍 2: 가치 이터레이션
다이내믹 프로그래밍의 한계와 강화학습
다이내믹 프로그래밍의 한계
모델 없이 학습하는 강화학습
정리
4장: 강화학습 기초 3 - 그리드월드와 큐러닝
강화학습과 정책 평가 1: 몬테카를로 예측
강화학습과 정책 평가 2: 시간차 예측
강화학습 알고리즘 1: 살사
강화학습 알고리즘 2: 큐러닝
정리
[3부] 강화학습 심화
5장: 강화학습 심화 1 - 그리드월드와 근사함수
근사함수
인공신경망
인공신경망 라이브러리: 케라스
딥살사
폴리시 그레이디언트
정리
6장: 강화학습 심화 2 - 카트폴
알고리즘 1: DQN
알고리즘 2: 액터-크리틱
정리
7장: 강화학습 심화 3 - 아타리
브레이크아웃 DQN
브레이크아웃 A3C
정리
부록A: 학습결과 업로드