课程名称: Machine Learning: Clustering & Retrieval/聚类与检索/华盛顿大学
课程主页: https://www.coursera.org/learn/ml-clustering-and-retrieval
所在平台: Coursera
课程类别: 机器学习 Machine Learning
大学或机构: 华盛顿大学
讲师: Emily Fox,Carlos Guestrin
授课语言: 英语
提供字幕: 英文
课程文件大小: 2.24GB
课程介绍: 机器学习:群集和检索:案例研究:查找相似文档 读者对特定的新闻文章感兴趣,并且您想查找类似的文章进行推荐。正确的相似性概念是什么?此外,如果还有数百万其他文档怎么办?每次您想要检索一个新文档时,是否需要搜索所有其他文档?您如何将相似的文档分组在一起?您如何发现文档涵盖的新兴主题? 在第三个案例研究中,查找相似的文档,您将研究基于相似度的检索算法。在本课程中,您还将检查用于描述语料库中文档的结构化表示形式,包括聚类和混合成员模型,例如潜在的Dirichlet分配(LDA)。您将实现期望最大化(EM)以学习文档聚类,并了解如何使用MapReduce缩放方法。 学习成果:在本课程结束时,您将能够: -使用k最近邻创建文档检索系统。 -确定文本数据的各种相似性指标。 -通过使用KD树减少k最近邻搜索中的计算。 -使用位置敏感的哈希生成近似最近的邻居。 -比较和对比有监督和无监督的学习任务。 -使用k均值按主题聚类文档。 -描述如何使用MapReduce并行化k均值。 -使用混合模型检查概率聚类方法。 -使用期望最大化(EM)拟合高斯模型的混合。 -使用潜在Dirichlet分配(LDA)执行混合成员资格建模。 -描述Gibbs采样器的步骤以及如何使用其输出进行推断。 -非凸优化目标的比较和对比初始化技术。 -在Python中实施这些技术。
课程压缩包下载地址(度盘链接):
友情提醒:
评论前必须登录!
注册