课程名称: Sample-based Learning Methods
课程主页: https://www.coursera.org/learn/sample-based-learning-methods
所在平台: Coursera
课程类别: 机器学习 Machine Learning
大学或机构: 阿尔伯塔大学
讲师: Martha White,Adam White
授课语言: 英语
提供字幕: 英文
课程文件大小: 1.20GB
课程介绍: 在本课程中,您将学习几种算法,这些算法可以基于与环境的反复试验而学习接近最佳策略的方法-从代理自身的经验中学习。从实际经验中吸取教训是惊人的,因为它不需要环境动力学的先验知识,但仍然可以获得最佳行为。我们将介绍直观上简单但功能强大的蒙特卡洛方法,以及包括Q学习在内的时差学习方法。我们将总结本课程,探讨如何才能两全其美:可以结合基于模型的计划(类似于动态编程)和时间差异更新以从根本上加速学习的算法。 在本课程结束时,您将能够: -理解时差学习和蒙特卡洛(Monte Carlo)作为从抽样经验中估算价值函数的两种策略 -在模型中使用采样经验而不是动态编程扫描时,了解探索的重要性 -了解蒙特卡洛与动态编程和TD之间的联系。 -实施并应用TD算法,以估算值函数 -实施和应用预期的Sarsa和Q学习(两种TD方法进行控制) -了解政策上和政策外控制之间的区别 -了解具有模拟经验的计划(与经典计划策略相对) -实施基于模型的RL方法,称为Dyna,该方法使用模拟经验 -进行实证研究,以查看使用Dyna时样品效率的提高.
课程压缩包下载地址(度盘链接):
友情提醒:
1、若遇到链接失效请加客服微信:amanda12321反馈,我们将在上线第一时间处理。
2、课程制作成压缩包后通过百度网盘分享,需要下载解压之后才能正常观看;
3、课程视频为官网提供下载的最高清的分辨率MP4格式,字幕为srt外挂字幕。
4、官网没有提供答案,因此所有课程的测试和作业均不提供答案;
5、课程文件包含视频(MP4)、字幕(SRT)、字幕文本版(TXT)、阅读材料(html)和测试及作业(PDF或HTML),如果官网有提供下载,还将包含课件以及与课程相关的其它附件等。
6、百度网盘下载速度我们也无法控制,建议您先自行测试。
7、课程文件仅供您离线学习和参考,版权归原平台及作者所有,如果条件允许我们仍建议您通过coursera平台进行学习,可获得更优质的学习体验,完成课程还能获得相应证书,如果内容侵犯了您的权利请通知,我们将在收到通知24小时内删除内容。
评论前必须登录!
注册