课程信息

52,368 次近期查看
可灵活调整截止日期
根据您的日程表重置截止日期。
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
中级
完成时间大约为14 小时
英语(English)

您将学到的内容有

  • U​se the collaborative Databricks workspace to write scalable Spark SQL code that executes against a cluster of machines

  • Inspect the Spark UI to analyze query performance and identify bottlenecks

  • Create an end-to-end pipeline that reads data, transforms it, and saves the result

  • B​uild a medallion (bronze, silver, gold) lakehouse architecture with Delta Lake to ensure the reliability, scalability, and performance of your data

您将获得的技能

Data ScienceApache SparkDelta LakeSQL
可灵活调整截止日期
根据您的日程表重置截止日期。
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
中级
完成时间大约为14 小时
英语(English)

提供方

Placeholder

加州大学戴维斯分校

教学大纲 - 您将从这门课程中学到什么

1

1

完成时间为 3 小时

Introduction to Spark

完成时间为 3 小时
6 个视频 (总计 43 分钟), 3 个阅读材料, 2 个测验
2

2

完成时间为 3 小时

Spark Core Concepts

完成时间为 3 小时
6 个视频 (总计 36 分钟), 2 个阅读材料, 2 个测验
3

3

完成时间为 4 小时

Engineering Data Pipelines

完成时间为 4 小时
7 个视频 (总计 62 分钟), 2 个阅读材料, 2 个测验
4

4

完成时间为 4 小时

Data Lakes, Warehouses and Lakehouses

完成时间为 4 小时
8 个视频 (总计 52 分钟), 2 个阅读材料, 3 个测验

审阅

来自DISTRIBUTED COMPUTING WITH SPARK SQL的热门评论

查看所有评论

关于 Learn SQL Basics for Data Science 专项课程

Learn SQL Basics for Data Science

常见问题

还有其他问题吗?请访问 学生帮助中心