Por lo general, la canalización de datos se clasifica en uno de los siguientes paradigmas: Extraer-cargar, Extraer-cargar-transformar o Extraer-transformar-cargar. En este curso, se describe cuál es el paradigma que se debe usar y en qué momento usarlo para los datos por lotes. Además, en este curso, se presentan diferentes tecnologías de Google Cloud Platform para la transformación de datos, entre las que se incluyen BigQuery, la ejecución de Spark en Cloud Dataproc, los gráficos de canalización en Cloud Data Fusion y el procesamiento de datos sin servidores mediante Cloud Dataflow. Los participantes obtendrán experiencia práctica sobre cómo compilar los componentes de la canalización de datos en Google Cloud Platform mediante QwikLabs.
课程信息
提供方

Google 云端平台
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
授课大纲 - 您将从这门课程中学到什么
Introducción
En este módulo, se presentan el curso y el temario
Introducción a las canalizaciones de datos por lotes
En este módulo, se revisan los diferentes métodos de carga de datos (EL, ELT y ETL) y cuándo utilizarlos
Cómo ejecutar Spark en Cloud Dataproc
En este módulo, se muestra cómo ejecutar Hadoop en Cloud Dataproc, cómo aprovechar GCS y cómo optimizar sus trabajos de Dataproc.
Administre canalizaciones de datos con Cloud Data Fusion y Cloud Composer
En este módulo, se muestra cómo administrar canalizaciones de datos con Cloud Data Fusion y Cloud Composer.
Procesamiento de datos sin servidores con Cloud Dataflow
En este módulo, se describe cómo usar Cloud Dataflow para compilar sus canalizaciones de procesamiento de datos
Resumen
En este módulo, se revisan los temas que se trataron en este curso
审阅
- 5 stars72.22%
- 4 stars25%
- 3 stars2.77%
来自BUILDING BATCH DATA PIPELINES ON GCP EN ESPAÑOL的热门评论
Útil para comprender las herramientas que te da GCP para crear grandes canalizaciones de datos
Excelente curso, muy bien explicado, las parcticas son muy utiles
excelente material, buena explicación de conceptos claves para la creación de pipelines, y porque elegir dataflow en vez de datafusion
常见问题
我能否在注册前预览课程?
我注册之后会得到什么?
我什么时候会收到课程证书?
我为什么不能旁听此课程?
有助学金吗?
还有其他问题吗?请访问 学生帮助中心。