课程名称: Managing Big Data in Clusters and Cloud Storage
课程主页: https://www.coursera.org/learn/cloud-storage-big-data-analysis-sql
所在平台: Coursera
课程类别: 数据分析
大学或机构: Cloudera
讲师: Glynn Durham,Ian Cook
授课语言: 英语
提供字幕: 英文
课程文件大小: 8.21GB
课程介绍: 在本课程中,您将学习如何管理大数据集,如何将它们加载到集群和云存储,以及如何将结构应用到数据,以便您可以使用分布式SQL引擎,如Apache Hive和Apache Impala运行查询。您将学习如何根据要使用的工具和需要的性能选择正确的数据类型、存储系统和文件格式。
课程结束时,你将能够
•使用不同的工具浏览大数据系统中的现有数据库和表;
•使用不同的工具在分布式大数据文件系统和云存储中探索文件;
•使用Apache Hive和Apache Impala创建和管理大数据数据库和表;和
•对大数据系统的不同数据类型和文件格式进行描述和选择。
要使用本课程的动手环境,您需要下载并安装一个虚拟机和用于运行它的软件。在继续之前,请确保你所使用的电脑符合下列硬件和软件要求:
•Windows、macOS或Linux操作系统(ipad和Android平板电脑不能工作)
•64位操作系统(32位操作系统无法工作)
•8gb内存或更多
•25GB或更多的可用磁盘空间
•启用英特尔VT-x或AMD-V虚拟化支持(在使用英特尔处理器的Mac电脑上,这总是启用;
在Windows和Linux计算机上,您可能需要在BIOS中启用它)
•仅适用于Windows XP电脑:你必须安装一个解压缩工具,如7-Zip或WinZip (Windows XP内置的解压缩工具不能工作)
本课程属于 Modern Big Data Analysis with SQL Specialization/专项课程 中的第3门课程。
课程压缩包下载地址(度盘链接 解压密码:xuebuyan.org):
友情提醒:
评论前必须登录!
注册