学而不厌
孜孜不倦

Distributed Computing with Spark SQL

课程名称: Distributed Computing with Spark SQL

课程主页: https://www.coursera.org/learn/spark-sql

所在平台: Coursera

课程类别: 数据分析

大学或机构: 加州大学戴维斯分校

讲师: Brooke Wenig,Conor Murphy

授课语言: 英语

提供字幕: 英文

课程文件大小: 316MB

课程介绍: 本课程是为有SQL经验的学生开设的,现在他们想进一步熟悉使用Spark的分布式计算。学生将了解什么时候使用Spark,以及Spark作为一个引擎如何将数据和人工智能技术大规模地结合起来。这四个模块相互构建,在课程结束时,学生将理解:Spark架构、Spark数据框架、优化读/写数据以及如何构建机器学习模型。第一个模块将介绍Spark,包括Spark如何与分布式计算一起工作,以及什么是Spark数据框架。模块2涵盖了Spark的核心概念,如存储与计算、缓存、分区和Spark用户界面。第三个模块着眼于工程数据管道,包括连接数据库、模式和类型、文件格式和编写好的数据。最后一个模块将通过业务用例,对什么是机器学习的简短介绍,构建和应用模型,以及最后的课程总结,来看一下Spark在机器学习中的应用。通过了解何时使用Spark,或者在模型或数据太大而无法在单台机器上处理时进行扩展,或者需要简单地加快速度以获得更快的结果,学生们将磨练自己的SQL技能,成为一名更熟练的数据科学家。

本课程属于 Learn SQL Basics for Data Science Specialization/专项课程 中的第3门课程。

最近更新:2020年7月7日。

课程压缩包下载地址(度盘链接 解压密码:xuebuyan.org):

资源下载此资源下载价格为6学币,请先
解压密码:xuebuyan.org 客服微信:amanda12321


友情提醒:

1、若遇到链接失效请加客服微信:amanda12321反馈,我们将在上线第一时间处理
2、课程制作成压缩包后通过百度网盘分享,需要下载解压之后才能正常观看;
3、课程视频为官网提供下载的最高清的分辨率MP4格式,字幕为srt外挂字幕。
4、官网没有提供答案,因此所有课程的测试和作业均不提供答案;
5、课程文件包含视频(MP4)、字幕(SRT)、字幕文本版(TXT)、阅读材料(html)和测试及作业(PDF或HTML),如果官网有提供下载,还将包含课件以及与课程相关的其它附件等。
6、百度网盘下载速度我们也无法控制,建议您先自行测试。
7、课程文件仅供您离线学习和参考,版权归原平台及作者所有,如果条件允许我们仍建议您通过coursera平台进行学习,可获得更优质的学习体验,完成课程还能获得相应证书,如果内容侵犯了您的权利请通知,我们将在收到通知24小时内删除内容。


未经允许不得转载:学不厌资源 » Distributed Computing with Spark SQL

评论 抢沙发

评论前必须登录!