1

## Introduction the course and grading environment

2 个视频 （总计 3 分钟）, 2 个阅读材料, 3 个测验
2 个视频
Overview of technology used within the course1分钟
2 个阅读材料
Assignment and Exercise Environment Setup10分钟
IMPORTANT: How to submit your programming assignments10分钟
1 个练习
Challenges, terminology, methods and technology2分钟
2

## Tools that support BigData solutions

8 个视频 （总计 51 分钟）, 2 个阅读材料, 4 个测验
8 个视频
Parallel data processing strategies of Apache Spark7分钟
Programming language options on ApacheSpark10分钟
Functional programming basics6分钟
Introduction of Cloudant2分钟
Resilient Distributed Dataset and DataFrames - ApacheSparkSQL6分钟
Overview of how the test data has been generated (optional)8分钟
IBM Watson Studio (formerly Data Science Experience)3分钟
2 个阅读材料
Apache Parquet (optional)10分钟
Create the data on your own (optional)10分钟
3 个练习
Data storage solutions, and ApacheSpark12分钟
Programming language options and functional programming12分钟
ApacheSparkSQL and Cloudant12分钟
3

## Scaling Math for Statistics on Apache Spark

7 个视频 （总计 35 分钟）, 1 个阅读材料, 4 个测验
7 个视频
Averages5分钟
Standard deviation3分钟
Skewness3分钟
Kurtosis2分钟
Covariance, Covariance matrices, correlation13分钟
Multidimensional vector spaces5分钟
1 个阅读材料
Exercise 210分钟
3 个练习
Averages and standard deviation10分钟
Skewness and kurtosis10分钟
Covariance, correlation and multidimensional Vector Spaces16分钟
4

## Data Visualization of Big Data

4 个视频 （总计 24 分钟）, 2 个阅读材料, 2 个测验
4 个视频
Plotting with ApacheSpark and python's matplotlib12分钟
Dimensionality reduction4分钟
PCA5分钟
2 个阅读材料
Exercise 3.110分钟
Exercise 3.210分钟
1 个练习
Visualization and dimension reduction10分钟
