课程名称: 大规模数据处理:系统与算法/华盛顿大学/Bill Howe
课程主页: https://www.coursera.org/learn/data-manipulation
所在平台: Coursera
课程类别: 数据分析Data Analysis
大学或机构: 华盛顿大学
讲师: Bill Howe
授课语言: 英语
提供字幕: 英文
课程文件大小: 1.35GB
课程介绍: 大规模的数据处理:系统和算法:数据分析已取代数据获取,这已成为基于证据的决策制定的瓶颈-我们正在淹没其中。从大型,异构且嘈杂的数据集中提取知识不仅需要强大的计算资源,还需要编程抽象才能有效地使用它们。过去十年中出现的抽象概念融合了并行数据库,分布式系统和编程语言的思想,从而创建了一类新的可伸缩数据分析平台,这些平台构成了现实规模的数据科学的基础。
在本课程中,您将学习相关系统的概况,它们所依赖的原则,它们的权衡以及如何根据您的要求评估其效用。您将学习实用系统是如何从计算机科学的研究前沿中衍生出来的,以及即将出现的系统。将介绍云计算,SQL和NoSQL数据库,MapReduce及其产生的生态系统,Spark及其同时代人以及用于图形和数组的专用系统。
您还将学习数据科学的历史和背景,术语所暗示的技能,挑战和方法,以及如何构建数据科学项目。在本课程结束时,您将能够: 学习目标:
1.描述与数据科学项目相关的常见模式,挑战和方法,以及它们与相关领域的项目有何不同。
2.识别并使用与可伸缩数据处理相关的编程模型,包括关系代数,mapreduce和其他数据流模型。
3.使用适用于大规模分析的数据库技术,包括驱动并行数据库,并行查询处理和数据库内分析的概念
4.评估键值存储和NoSQL系统,描述它们在可比系统中的权衡,该空间中重要示例的细节以及未来趋势。
5. MapReduce中的“思考”功能,可为包括Hadoop和Spark在内的系统有效地编写算法。您将了解它们的局限性,设计细节,它们与数据库的关系以及它们相关的算法,扩展和语言生态系统。 用Spark编写程序 6.描述用于图形,数组和流的专用大数据系统的概况
本课程属于 Data Science at Scale Specialization/大规模数据科学 专项课程 中的第1门课程。
课程压缩包下载地址(度盘链接):
友情提醒:
评论前必须登录!
注册