课程信息

65,119 次近期查看
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
可灵活调整截止日期
根据您的日程表重置截止日期。
中级
完成时间大约为12 小时
英语(English)

您将获得的技能

Data ScienceApache SparkSQL
可分享的证书
完成后获得证书
100% 在线
立即开始,按照自己的计划学习。
可灵活调整截止日期
根据您的日程表重置截止日期。
中级
完成时间大约为12 小时
英语(English)

提供方

Placeholder

加州大学戴维斯分校

教学大纲 - 您将从这门课程中学到什么

1

1

完成时间为 3 小时

Introduction to Spark

完成时间为 3 小时
6 个视频 (总计 32 分钟), 3 个阅读材料, 2 个测验
6 个视频
Why Distributed Computing?7分钟
Spark DataFrames6分钟
The Databricks Environment8分钟
SQL in Notebooks3分钟
Import Data2分钟
3 个阅读材料
A Note From UC Davis10分钟
Readings and Resources40分钟
Assignment #1 - Queries in Spark SQL30分钟
2 个练习
Assignment #1 Quiz - Queries in Spark SQL30分钟
Module 1 Quiz30分钟
2

2

完成时间为 2 小时

Spark Core Concepts

完成时间为 2 小时
6 个视频 (总计 25 分钟), 2 个阅读材料, 2 个测验
6 个视频
Spark Terminology3分钟
Caching5分钟
Shuffle Partitions7分钟
Spark UI3分钟
Broadcast Joins3分钟
2 个阅读材料
Readings30分钟
Assignment #2 - Spark Internals30分钟
2 个练习
Assignment #2 Quiz - Spark Internals30分钟
Module 2 Quiz30分钟
3

3

完成时间为 3 小时

Engineering Data Pipelines

完成时间为 3 小时
7 个视频 (总计 43 分钟), 2 个阅读材料, 2 个测验
7 个视频
Spark as a Connector6分钟
Accessing Data10分钟
File Formats8分钟
Schemas and Types4分钟
Writing Data6分钟
Managed and Unmanaged Tables4分钟
2 个阅读材料
Readings1小时
Assignment #3 - Engineering Data Pipelines30分钟
2 个练习
Assignment #3 Quiz - Engineering Data Pipelines30分钟
Module 3 Quiz30分钟
4

4

完成时间为 4 小时

Machine Learning Applications of Spark

完成时间为 4 小时
7 个视频 (总计 35 分钟), 2 个阅读材料, 3 个测验
7 个视频
Applications of Machine Learning4分钟
Machine Learning Fundamentals6分钟
Linear Regression6分钟
Training Linear Regression Model8分钟
Applying Machine Learning with UDFs4分钟
Course Summary3分钟
2 个阅读材料
Readings1小时
Assignment #4 - Logistic Regression Classifier10分钟
2 个练习
Assignment #4 Quiz - Logistic Regression Classifier30分钟
Module 4 Quiz30分钟

审阅

来自DISTRIBUTED COMPUTING WITH SPARK SQL的热门评论

查看所有评论

关于 Learn SQL Basics for Data Science 专项课程

Learn SQL Basics for Data Science

常见问题

还有其他问题吗?请访问 学生帮助中心