楼主: jinjintang
7637 13

Dynamic Programming and Optimal Control 3rd Edition, Volume II, Chapter 6 [推广有奖]

  • 0关注
  • 0粉丝

已卖:82份资源

本科生

45%

还不是VIP/贵宾

-

威望
0
论坛币
1427 个
通用积分
0.0750
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
662 点
帖子
111
精华
0
在线时间
62 小时
注册时间
2009-8-23
最后登录
2015-8-16

楼主
jinjintang 发表于 2010-12-12 09:04:40 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
附件是书中第六章
Contents
6.1. General Issues of Cost Approximation . . . . . . . . p. 327
6.1.1. Approximation Architectures . . . . . . . . . p. 327
6.1.2. Approximate Policy Iteration . . . . . . . . . p. 331
6.1.3. Direct and Indirect Approximation . . . . . . p. 336
6.1.4. Simplifications . . . . . . . . . . . . . . . p. 338
6.1.5. The Role of Contraction Mappings . . . . . . p. 344
6.1.6. The Role of Monte Carlo Simulation . . . . . . p. 345
6.2. Direct Policy Evaluation - Gradient Methods . . . . . p. 349
6.3. Projected Equation Methods . . . . . . . . . . . . p. 354
6.3.1. The Projected Bellman Equation . . . . . . . p. 355
6.3.2. Deterministic Iterative Methods . . . . . . . . p. 361
6.3.3. Simulation-Based Methods . . . . . . . . . . p. 365
6.3.4. LSTD, LSPE, and TD(0) Methods . . . . . . p. 367
6.3.5. Optimistic Versions . . . . . . . . . . . . . p. 375
6.3.6. Multistep Simulation-Based Methods . . . . . p. 376
6.3.7. Policy Iteration Issues - Exploration . . . . . . p. 382
6.3.8. Policy Oscillations – Chattering . . . . . . . . p. 390
6.3.9. A Synopsis . . . . . . . . . . . . . . . . . p. 400
6.4. Aggregation Methods . . . . . . . . . . . . . . . p. 405
6.4.1. Cost Approximation via the Aggregate Problem . p. 408
6.4.2. Cost Approximation via the Enlarged Problem . p. 411
6.5. Q-Learning . . . . . . . . . . . . . . . . . . . . p. 421
6.5.1. Convergence Properties of Q-Learning . . . . . p. 424
6.5.2. Q-Learning and Approximate Policy Iteration . . p. 428
6.5.3. Q-Learning for Optimal Stopping Problems . . . p. 431
6.5.4. Finite Horizon Q-Learning . . . . . . . . . . p. 436
321
322 Approximate Dynamic Programming Chap. 6
6.6. Stochastic Shortest Path Problems . . . . . . . . . p. 438
6.7. Average Cost Problems . . . . . . . . . . . . . . p. 443
6.7.1. Approximate Policy Evaluation . . . . . . . . p. 443
6.7.2. Approximate Policy Iteration . . . . . . . . . p. 452
6.7.3. Q-Learning for Average Cost Problems . . . . . p. 454
6.8. Simulation-Based Solution of Large Systems . . . . . p. 458
6.8.1. Projected Equations - Simulation-Based Versions p. 458
6.8.2. Matrix Inversion and Regression-Type Methods . p. 462
6.8.3. Iterative/LSPE-Type Methods . . . . . . . . p. 464
6.8.4. Extension of Q-Learning for Optimal Stopping . p. 472
6.8.5. Bellman Equation Error-Type Methods . . . . p. 474
6.8.6. Oblique Projections . . . . . . . . . . . . . p. 478
6.8.7. Generalized Aggregation by Simulation . . . . . p. 480
6.9. Approximation in Policy Space . . . . . . . . . . . p. 485
6.9.1. The Gradient Formula . . . . . . . . . . . . p. 486
6.9.2. Computing the Gradient by Simulation . . . . p. 487
6.9.3. Essential Features of Critics . . . . . . . . . p. 488
6.9.4. Approximations in Policy and Value Space . . . p. 491
6.10. Notes, Sources, and Exercises . . . . . . . . . . . p. 492
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Programming Edition control Program Dynamic Institute Technology Dimitri

Dynamic Programming and Optimal Control.pdf
下载链接: https://bbs.pinggu.org/a-813652.html

1.71 MB

需要: 20 个论坛币  [购买]

爱好运筹学

沙发
research(真实交易用户) 发表于 2010-12-12 09:59:02
提示: 作者被禁止或删除 内容自动屏蔽

藤椅
jinjintang(未真实交易用户) 发表于 2010-12-12 10:15:47
我上面写了呀,就第六章
爱好运筹学

板凳
jinjintang(未真实交易用户) 发表于 2010-12-12 10:22:00
我在描述里写Contents,就是第六章的内容!实在不好意思让你误解了!
爱好运筹学

报纸
research(真实交易用户) 发表于 2010-12-12 13:26:40
提示: 作者被禁止或删除 内容自动屏蔽

地板
jinjintang(未真实交易用户) 发表于 2010-12-12 21:13:44
我是贴过来的,真没有想到会误导你!要是全本,不可能才20个币呀!
爱好运筹学

7
左元(未真实交易用户) 发表于 2011-1-29 07:07:59
楼主确实不厚道!

8
wagonwagon(未真实交易用户) 发表于 2011-8-18 07:58:40
jinjintang 发表于 2010-12-12 21:13
我是贴过来的,真没有想到会误导你!要是全本,不可能才20个币呀!
真是。。。哎。。
要有全本出个价也就算了。
你弄个第六章来卖钱,人家作者本来就在个人网站上面挂着,免费:
http://web.mit.edu/dimitrib/www/dpchapter.pdf

9
yanguibe(真实交易用户) 发表于 2011-10-21 13:59:01
你个垃圾。

10
cunxws(未真实交易用户) 发表于 2012-7-13 20:17:49
还好没有下

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注jltj
拉您入交流群
GMT+8, 2025-12-26 00:09