课程名称: Cloud Computing Applications, Part 2: Big Data and Applications in the Cloud
课程主页: https://www.coursera.org/learn/cloud-applications-part2
所在平台: Coursera
课程类别: 数据分析Data Analysis
大学或机构: 伊利诺伊大学香槟分校
讲师: Reza Farivar,Roy H. Campbell
授课语言: 英语
提供字幕: 英语
课程文件大小: 2.66GB
课程介绍: 云计算应用程序,第2部分:云中的大数据和应用程序:欢迎参加“云计算应用程序”课程,这是两门课程系列的第二部分,旨在向您全面介绍云计算和大数据的世界! 在第二个课程中,我们将继续探索云如何开放云对静态或高速流传输的海量数据的数据分析的能力,从而继续发展云计算应用程序。云应用程序和数据分析代表着社会了解和使用信息方式的颠覆性变化。第一周开始,我们将介绍一些主要的数据分析系统,包括Spark,以及主要的框架和分析应用程序的发行版,包括Hortonworks,Cloudera和MapR。在第一周中旬,我们介绍了适用于Hadoop等许多应用程序的HDFS分布式健壮文件系统,并通过研究功能强大的MapReduce编程模型以及YARN和Mesos等分布式操作系统如何支持灵活的可扩展环境来完成第一周。大数据分析。在第二周,我们的课程介绍了大规模数据存储以及在使用大量处理器,内存和磁盘的大型存储中达成共识的困难和问题。我们讨论了最终的一致性,ACID和BASE以及数据中心(包括Paxos和Zookeeper)中使用的共识算法。我们的课程介绍分布式键值存储以及数据中心中用于性能的Redis之类的内存数据库。接下来,我们介绍NOSQL数据库。我们访问HBase,这是一种可扩展的低延迟数据库,它支持使用Hadoop的应用程序中的数据库操作。然后,我们再次展示Spark SQL如何对大量数据进行SQL查询编程。在第二周结束时,我们将进行有关使用Kafka的分布式发布/订阅系统的演示,Kafka是一种分布式日志消息系统,在将大数据和流应用程序连接在一起以形成复杂的系统中得到了广泛的应用。第三周转向快速数据实时流传输,并介绍了在Yahoo等行业中广泛使用的Storm技术。我们将继续介绍Spark Streaming,Lambda和Kappa体系结构,以及Streaming生态系统的介绍。第四周的重点是图处理,机器学习和深度学习。我们介绍图形处理的思想,并介绍Pregel,Giraph和Spark GraphX。然后,我们使用Mahout和Spark的示例进行机器学习。以Kmeans,朴素贝叶斯和fpm为例。 Spark ML和Mllib继续以可编程性和应用程序构建为主题。我们在第四周讨论的最后一个主题介绍了深度学习技术,包括Theano,Tensor Flow,CNTK,MXnet和Caffe on Spark。
课程压缩包下载地址(度盘链接):
友情提醒:
评论前必须登录!
注册