심층강화학습 > 컴퓨터공학

도서간략정보

심층강화학습

판매가격 27,000원

저자	이창환
도서종류	국내도서
출판사	도서출판 홍릉
발행언어	한국어
발행일	2023
페이지수	420
ISBN	9791156001003
배송비결제	주문시 결제
도서구매안내	온, 오프라인 서점에서 구매 하실 수 있습니다.

위시리스트

추천하기

구매기능

이전도서 알기쉽게 쓴 회로이론(개정판)다음 도서 스크래치 주니어퀘스트 이재호 교수의 사고력 코딩

도서 정보

도서 상세설명

1부 강화학습

CHAPTER 01 강화학습의 개요
1.1 인공지능과 기계학습
1.2 기계학습의 방법들
1.3 강화학습의 소개
1.4 강화학습의 응용분야
1.5 요약

CHAPTER 02 마르코프 결정 프로세스
2.1 마르코프 모델
2.2 마르코프 보상 프로세스(MRP)
2.3 마르코프 결정 프로세스(MDP)
2.4 최적 가치값과 최적 정책
2.5 부분관측 마르코프 결정 프로세스

CHAPTER 03 동적 프로그래밍
3.1 동적 프로그래밍의 조건
3.2 정책평가
3.3 컨트롤
3.5 가치값 반복
3.6 일반화된 정책반복
3.7 요약

CHAPTER 04 모델프리 정책평가
4.1 모델프리 환경
4.2 몬테카를로 정책평가 방법
4.3 TD 학습
4.4 몬테카를로와 TD의 배치 학습
4.5 TD(n) 학습
4.6 TD(λ) 학습
4.7 요약

CHAPTER 05 모델프리 컨트롤
5.1 몬테카를로 일반화된 정책반복
5.2 ε-탐욕방법 정책향상
5.3 TD 학습
5.4 Sarsa 방법
5.5 Sarsa(λ) 학습
5.6 오프정책
5.7 Q 학습
5.8 더블 Q 학습
5.9 요약

2부 심층강화학습
CHAPTER 06 가치값 근사함수
6.1 가치값 표시방법
6.2 가치값 근사함수방법
6.3 점진적 하강 방법
6.4 목적값이 주어진 가치값 근사함수 학습
6.5 몬테카를로 근사함수방법
6.6 TD 학습 근사함수방법
6.7 TD(l) 근사함수방법
6.8 적정성추적
6.9 모델프리 환경의 가치값 근사함수
6.10 요약

CHAPTER 07 심층신경망과 최적화 학습
7.1 인공신경망
7.2 신경망의 학습방법
7.3 심층신경망
7.4 심층신경망의 종류
7.5 요약

CHAPTER 08 심층 Q 네트워크
8.1 심층강화학습
8.2 심층 Q 네트워크
8.3 Atari 게임에서의 DQN
8.4 더블 DQN
8.5 듀얼 DQN
8.6 순환 DQN
8.7 요약

CHAPTER 09 정책 그레디언트
9.1 정책기반 강화학습
9.2 정책 네트워크
9.3 정책 목적함수
9.4 정책 최적화
9.5 정책 그레디언트 정리
9.6 REINFORCE 알고리즘
9.7 액터-크리틱 방법
9.8 GAE
9.9 요약

CHAPTER 10 고급 정책 그레디언트
10.1 A3C 282
10.2 최대엔트로피 강화학습 291
10.3 TRPO 294
10.4 PPO 312
10.5 DDPG 315
10.6 TD3 322
10.7 요약 326

CHAPTER 11 모방 학습
11.1 보상값의 예측
11.2 행동복제
11.3 DAGGER
11.4 역강화학습
11.5 속성매칭
11.6 도제학습
11.7 GAIL
11.8 요약

CHAPTER 12 새로운 강화학습
12.1 다중 에이전트 강화학습
12.2 계층 강화학습
사용후기

사용후기가 없습니다.

사용후기 쓰기 새 창 더보기
배송/교환정보

배송정보
배송 안내 입력전입니다.

교환/반품
교환/반품 안내 입력전입니다.

선택하신 도서가 장바구니에 담겼습니다.

계속 둘러보기 장바구니보기

도서출판 홍릉 정보

서울특별시 강북구 인수봉로50길 10 (수유동 455-60)
대표 : 송 준
사업자 등록번호 : 210-90-69650
전화 : 02-999-2274~5 팩스 : 02-905-6729
개인정보 보호책임자 : 송 준

도서분류

심층강화학습 > 컴퓨터공학

도서간략정보

구매기능

도서 정보

도서 상세설명

사용후기

배송/교환정보

배송정보

교환/반품

문의처

도서출판 홍릉 정보

공지사항