课程名称: ETL and Data Pipelines with Shell, Airflow and Kafka
课程主页: https://www.coursera.org/learn/etl-and-data-pipelines-shell-airflow-kafka
所在平台: Coursera
课程类别: 数据分析
大学或机构: IBM
讲师: Yan Luo,Jeff Grossman,Sabrina Spillner,Ramesh Sannareddy
授课语言: 英语
提供字幕: 英文
课程文件大小: 182MB
课程介绍: 完成本课程后,您将能够描述将原始数据转换为分析就绪数据的两种不同方法。一种方法是提取、转换、加载 (ETL) 过程。另一种对比方法是提取、加载和转换 (ELT) 过程。 ETL 流程适用于数据仓库和数据集市。 ELT 流程适用于数据湖,其中数据由请求/调用应用程序按需转换。
ETL 和 ELT 都从源系统中提取数据,通过数据管道移动数据,并将数据存储在目标系统中。在本课程中,您将体验 ELT 和 ETL 处理的不同之处,并确定两者的用例。
您将确定用于提取数据、以逻辑或物理方式合并提取的数据以及将数据导入数据存储库的方法和工具。您还将定义要应用于源数据的转换,以使数据可信、符合上下文并可供数据用户访问。您将能够概述将数据加载到目标系统、验证数据质量、监控加载故障以及在发生故障时使用恢复机制的多种方法中的一些方法。
最后,您将完成一个可共享的期末项目,使您能够展示您在每个模块中获得的技能。
本课程属于 IBM Data Engineering Professional Certificate/IBM 数据工程 专业证书 中的第8门课程。
课程压缩包下载地址(度盘链接 解压密码:xuebuyan.org):
友情提醒:
评论前必须登录!
注册