En règle générale, les pipelines de données fonctionnent sur le modèle "Extraction et chargement" (EL), "Extraction, chargement et transformation" (ELT), ou "Extraction, transformation et chargement" (ETL). Dans ce cours, vous apprendrez où et quand appliquer ces différents modèles à des lots de données. Vous découvrirez également plusieurs technologies Google Cloud Platform permettant de transformer des données, y compris BigQuery, Spark exécuté sur Cloud Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement de données sans serveur avec Cloud Dataflow. Vous aurez en outre l'occasion de créer les composants d'un pipeline de données sur Google Cloud Platform dans le cadre d'un atelier pratique QwikLabs.
课程信息
提供方

Google 云端平台
We help millions of organizations empower their employees, serve their customers, and build what’s next for their businesses with innovative technology created in—and for—the cloud. Our products are engineered for security, reliability, and scalability, running the full stack from infrastructure to applications to devices and hardware. Our teams are dedicated to helping customers apply our technologies to create success.
授课大纲 - 您将从这门课程中学到什么
Introduction
Dans ce module, nous présentons le cours et son programme.
Introduction aux pipelines de données par lots
Ce module présente les différentes méthodes de chargement de données (EL, ELT et ETL) et leurs cas d'utilisation.
Exécuter Spark sur Cloud Dataproc
Dans ce module, vous apprendrez à exécuter Hadoop sur Cloud Dataproc, à exploiter GCS et à optimiser vos tâches Dataproc.
Gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer
Dans ce module, vous apprendrez à gérer des pipelines de données avec Cloud Data Fusion et Cloud Composer.
Traiter des données sans serveur avec Cloud Dataflow
Dans ce module, vous apprendrez à créer vos pipelines de traitement de données avec Cloud Dataflow.
Résumé
Ce module récapitule les sujets abordés dans ce cours.
关于 Data Engineer, Big Data and ML on Google Cloud en Français 专项课程
Cette formation de spécialisation en ligne d'une durée de cinq semaines présente en pratique comment concevoir et développer des systèmes de traitement des données sur Google Cloud. À travers un ensemble de présentations, de démonstrations et d'ateliers pratiques, les participants apprennent à concevoir des systèmes de traitement de données, à créer des pipelines de données de bout en bout, à analyser des données et à exécuter des tâches de machine learning.

常见问题
我能否在注册前预览课程?
我注册之后会得到什么?
我什么时候会收到课程证书?
我为什么不能旁听此课程?
有助学金吗?
还有其他问题吗?请访问 学生帮助中心。