Prediction and Control with Function Approximation-学不厌资源

Coursera课程下载

课程名称: Prediction and Control with Function Approximation

课程主页: https://www.coursera.org/learn/prediction-control-function-approximation

所在平台: Coursera

课程类别: 机器学习 Machine Learning

大学或机构: 阿尔伯塔大学

讲师： Martha White,Adam White

授课语言： 英语

提供字幕： 英文

课程文件大小： 1.11GB

课程介绍： 在本课程中，您将学习如何解决大型，高维以及可能无限的状态空间的问题。您将看到估计值函数可以转换为有监督的学习问题-函数逼近-使您能够构建谨慎地平衡概括性和歧视性以最大化报酬的代理。我们将通过研究如何将我们的策略评估或预测方法（如蒙特卡洛和TD）扩展到函数近似设置来开始这一旅程。您将学习用于RL的特征构造技术，以及通过神经网络和反向传播技术进行表示学习。我们将通过深入探讨政策梯度方法来结束本课程。直接学习政策而无需学习价值功能的方法。在本课程中，您将解决两个连续状态控制任务，并研究连续操作环境中策略渐变方法的好处。先决条件：本课程以课程1和2的基础为基础，学习者应该在开始本课程之前完成这些课程。学习者还应熟悉概率和能力。期望，基本线性代数，基本演算，Python 3.0（至少1年），以及通过伪代码实现算法。在本课程结束时，您将能够： -了解如何使用监督学习方法来近似值函数 -了解函数逼近下的预测目标（值估计） -在具有无限状态空间（连续状态空间）的环境中用函数逼近（状态聚合）实现TD -了解固定基础和神经网络的特征构建方法 -在连续状态环境中用神经网络函数逼近TD -理解为函数逼近时探索中的新困难 -对照控制的折扣问题公式与平均奖励问题公式 -在连续状态控制任务上使用函数逼近来实现预期的Sarsa和Q学习 -了解直接估算政策的目标（政策梯度目标） -在离散状态环境中实施策略梯度方法（称为Actor-Critic）

课程压缩包下载地址（度盘链接）：

资源下载此资源下载价格为6学币，请先

解压密码：xuebuyan.org 客服微信：amanda12321

友情提醒：

1、若遇到链接失效请加客服微信：amanda12321反馈，我们将在上线第一时间处理。

2、课程制作成压缩包后通过百度网盘分享，需要下载解压之后才能正常观看；

3、课程视频为官网提供下载的最高清的分辨率MP4格式，字幕为srt外挂字幕。

4、官网没有提供答案，因此所有课程的测试和作业均不提供答案；

5、课程文件包含视频（MP4）、字幕（SRT）、字幕文本版（TXT）、阅读材料（html）和测试及作业（PDF或HTML），如果官网有提供下载，还将包含课件以及与课程相关的其它附件等。

6、百度网盘下载速度我们也无法控制，建议您先自行测试。

7、课程文件仅供您离线学习和参考，版权归原平台及作者所有，如果条件允许我们仍建议您通过coursera平台进行学习，可获得更优质的学习体验，完成课程还能获得相应证书，如果内容侵犯了您的权利请通知，我们将在收到通知24小时内删除内容。

Prediction and Control with Function Approximation

相关推荐

评论抢沙发

评论前必须登录！

置顶推荐

最新文章

热门课程

推荐课程

热门标签

课程归档

网站统计

关注微信

回顶部