课程名称: Introduction to Big Data with Spark and Hadoop
课程主页: https://www.coursera.org/learn/introduction-to-big-data-with-spark-hadoop
所在平台: Coursera
课程类别: 数据分析
大学或机构: IBM
讲师: Karthik Muthuraman,Aije Egwaikhide
授课语言: 英语
提供字幕: 英文
课程文件大小: 328MB
课程介绍: Bernard Marr 将大数据定义为我们在这个数字时代产生的数字痕迹。在本课程中,您将了解大数据的特点及其在大数据分析中的应用。您将了解一些大数据处理工具的特性、优势、局限性和应用。您将探索 Hadoop 和 Hive 如何帮助利用大数据的优势,同时克服它带来的一些挑战。
Hadoop 是一个开源框架,允许使用简单的编程模型跨计算机集群分布式处理大型数据集。 Hive 是一种数据仓库软件,它提供了一个类似 SQL 的界面,可以有效地查询和操作驻留在与 Hadoop 集成的各种数据库和文件系统中的大型数据集。
Apache Spark 是一个开源处理引擎,它为用户提供了存储和使用大数据的新方法。它是一个围绕速度、易用性和分析构建的开源处理引擎。在本课程中,您将了解如何利用 Spark 提供可靠的见解。本课程概述了该平台,并介绍了组成 Apache Spark 的不同组件。
在本课程中,您还将了解弹性分布式数据集或 RDD,它支持跨 Spark 集群的节点进行并行处理。
本课程属于 IBM Data Engineering Professional Certificate/IBM 数据工程 专业证书 中的第11门课程。
课程压缩包下载地址(度盘链接 解压密码:xuebuyan.org):
友情提醒:
评论前必须登录!
注册