课程名称: Big Data Analysis: Hive, Spark SQL, DataFrames and GraphFrames
课程主页: https://www.coursera.org/learn/big-data-analysis
所在平台: Coursera
课程类别: 数据分析Data Analysis
大学或机构: Yandex
讲师: Alexey A. Dral,Pavel Klemenkov
授课语言: 英语
提供字幕: 英文
课程文件大小: 1.47GB
课程介绍: 大数据分析:Hive,Spark SQL,DataFrames和GraphFrames:无疑,处理海量数据非常困难,但是要想翻山越岭,您必须处理很多小问题。但是为什么要紧张自己呢?使用Mapreduce和Spark可部分解决问题,从而为高级工具留出一些空间。停止为使大数据工作流程高效而高效而奋斗,请使用我们为您提供的工具。 本课程将教您如何: -使用Hive,Spark SQL和Spark DataFframe有效地存储数据。 -使用大型图,例如社交图或网络。 -优化Spark应用程序以获得最佳性能。 准确地说,您将掌握以下知识: -编写和执行Hive& Spark SQL查询; -推理如何将查询转换为实际的执行原语(无论是MapReduce作业还是Spark转换); -在Hive中组织数据以优化磁盘空间使用和执行时间; -构造Spark DataFrames并使用它们轻松编写临时分析作业; -使用Spark GraphFrames处理大型图形; -调试,分析和优化Spark应用程序性能。 还是有疑问吗?看一下这个。通过学习本课程成为数据忍者! 特别感谢: -MIPT APT部门的Mikhail Roytberg教授,他是该项目的最初审阅者,也是BigData团队一半的主管和导师。他是帮助推动这场演出的人。 -Oleg Sukhoroslov(博士,IITP RAS高级研究员),自2008年以来一直在教授MapReduce,Hadoop和朋友。现在,他领导基础架构团队。 -奥列格·伊夫琴科(MITP博士,APT系学生),帕维尔·阿克赫蒂亚莫夫(Pavel Akhtyamov)(MITP系APT系硕士)和弗拉基米尔·库兹涅佐夫(PG德米多夫·雅罗斯拉夫尔州立大学的助教),他们已经开发并维护了用于本课程中的实际作业。 -Asya Roitberg,Eugene Baulin,Marina Sudarikova。这些人日夜不睡觉,这会让您的学习体验富有成效,顺畅而令人兴奋。
课程压缩包下载地址(度盘链接):
友情提醒:
评论前必须登录!
注册