课程名称: Data Mining Project
课程主页: https://www.coursera.org/learn/data-mining-project
所在平台: Coursera
课程类别: 数据分析
大学或机构: 伊利诺伊大学香槟分校
讲师: Jiawei Han,ChengXiang Zhai,John C. Hart
授课语言: 英语
提供字幕: 英文
课程文件大小: 3.68GB
课程介绍: 注意:在开始本课程之前,您应该完成本专业中的所有其他课程。
这个为期六周的数据挖掘专业化项目课程将使您能够应用专业化以前课程中学到的算法和技术进行数据挖掘,包括模式发现,聚类,文本检索,文本挖掘和可视化,以解决有趣的现实世界中的数据挖掘挑战。具体来说,您将使用Yelp的餐厅评论数据集,并使用从以前的课程中学到的所有知识和技能来挖掘该数据集,以发现有趣且有用的知识。该项目的设计强调:1)在实际工作环境中模拟数据挖掘者的工作流程; 2)整合多个单独课程中涵盖的不同采矿技术; 3)尝试各种解决问题的方法,以加深您对技术的理解;和4)允许您创造性地提出和探索自己的想法。
该项目的目标是分析和挖掘大量的Yelp审查数据集,以发现有用的知识,以帮助人们在就餐方面做出决策。该项目将包括以下输出:
1.意见可视化:浏览并可视化评论内容,以了解人们在这些评论中所说的内容。
2.烹饪地图的构建:挖掘数据集以了解不同类型的菜肴的景观及其相似性。
3.发现美食的流行菜肴:挖掘数据集以发现特定美食的常见/大众菜肴。
4.建议餐馆,以帮助人们决定在哪里用餐:挖掘数据集以对特定菜式的餐馆进行排名,并预测餐馆的卫生状况。
从用户的角度来看,美食地图可以帮助他们了解那里的美食,并查看各种美食及其关系的全景图。一旦他们决定尝试哪种菜,他们就会对知道该菜的流行菜并决定要吃的菜感兴趣。最后,他们将需要选择一家餐厅。因此,推荐基于特定菜肴的餐馆将是有用的。此外,预测餐厅的卫生状况也将有所帮助。
通过完成这些任务,您将获得典型的数据挖掘工作流程的经验,该工作流程包括数据预处理,数据探索,数据分析,分析方法的改进和结果的表示。您将有机会结合来自不同课程的多种算法来完成相对复杂的挖掘任务,并尝试以不同方式解决问题,以了解解决问题的最佳方法。我们将建议特定的方法,但是强烈建议您探索自己的想法,因为从设计角度而言,公开探索是项目的目标。
您需要为每项任务提交一份简短的报告,以进行同行评分。还需要一份最终的综合报告,并将其进行同行评等。
本课程属于 Data Mining Specialization/数据挖掘 专项课程 中的第6门课程。
课程压缩包下载地址(度盘链接 解压密码:xuebuyan.org):
友情提醒:
评论前必须登录!
注册