Explorar precios de acciones con Spark SQL

提供方
Coursera Project Network
在此指导项目中,您将:

Cree una aplicación que se ejecute en un clúster de Spark

Obtenga conocimiento de los datos utilizando Spark RDD y DataFrames

Almacenar resultados en tablas de parquet

Clock2 horas
Intermediate中级
Cloud无需下载
Video分屏视频
Comment Dots西班牙语(Spanish)
Laptop仅限桌面

En este proyecto guiado de 1 hora, aprenderemos cómo interactuar con un clúster de Spark usando el entorno Jupyter y cómo crear una aplicación Spark. Aprenderemos a utilizar Spark Resisilent Distributed Datasets y Spark Data Frames para explorar colecciones de datos. Cargaremos un conjunto de datos en nuestro programa Spark y realizaremos análisis de datos utilizando acciones, transformaciones, Spark DataFrame API y Spark SQL. Aprenderemos como elegir las mejores herramientas para utilizar en cada escenario. Finalmente, aprenderemos a guardar resultados en tablas de Parquet.

您要培养的技能

Spark SQLApache ParquetBig DataApache SparkExploratory Data Analysis

分步进行学习

在与您的工作区一起在分屏中播放的视频中,您的授课教师将指导您完成每个步骤:

  1. Al final de la Tarea 1, se familiarizará con el entorno de desarrollo Jupyter.

  2. Al final de la Tarea 2, podrá crear una aplicación Spark

  3. Al final de la Tarea 3, podrá crear conjuntos de datos distribuidos resistentes (RDD) en Spark

  4. Al final de la Tarea 4, podrá crear Spark Data Frames

  5. Al final de la Tarea 5, podrá explorar conjuntos de datos con Spark SQL

  6. Al final de la Tarea 6, podrá escribir consultas estadísticas y comparaciones de datos con Spark DataFrames

  7. Al final de la Tarea 7, podrá almacenar DataFrames en tablas Parquet

指导项目工作原理

您的工作空间就是浏览器中的云桌面,无需下载

在分屏视频中,您的授课教师会为您提供分步指导

常见问题

常见问题

还有其他问题吗?请访问 学生帮助中心