课程信息
5.0
1 个评分
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为15 小时

建议:Se estima una dedicación de 6 a 8 horas por semana....
可选语言

西班牙语(Spanish)

字幕:西班牙语(Spanish)
100% 在线

100% 在线

立即开始,按照自己的计划学习。
可灵活调整截止日期

可灵活调整截止日期

根据您的日程表重置截止日期。
中级

中级

完成时间(小时)

完成时间大约为15 小时

建议:Se estima una dedicación de 6 a 8 horas por semana....
可选语言

西班牙语(Spanish)

字幕:西班牙语(Spanish)

教学大纲 - 您将从这门课程中学到什么

1
完成时间(小时)
完成时间为 1 小时

INTRODUCCIÓN

...
Reading
2 个视频 (总计 10 分钟), 8 个阅读材料
Video2 个视频
Presentación del curso6分钟
Reading8 个阅读材料
Bienvenida1分钟
Contenidos del curso (Temario)1分钟
Organización del curso y evaluación5分钟
Sobre el certificado2分钟
FAQs - Generales10分钟
FAQs - Cuestionarios y ejercicios2分钟
FAQs - Certificado10分钟
Enlaces relacionados1分钟
完成时间(小时)
完成时间为 1 小时

LA MÁQUINA VIRTUAL

<b>ATENCIÓN: Si ya te instalaste la máquina virtual en el curso anterior de la Especialización no es necesario que vuelvas a hacerlo. En caso contrario, sigue leyendo.</b><br><br>Los ejercicios y sesiones prácticas pretenden mostrar un caso práctico de procesamiento y análisis de datos en el contexto de Big Data. En este sentido, será necesario trabajar con una máquina virtual que ya trae configuradas e instaladas una serie de componentes habituales al manejar Big Data. En este apartado te explicamos cómo descargar e instalar la máquina virtual Cloudera en tu ordenador. La MV-Cloudera requiere disponer de un equipo con las siguientes características: (1) máquina de 64 bits, (2) mínimo 6G de memoria (recomendable 8G), y (3) 20G disponibles en disco.<br><br> <i><b>Ten en cuenta que bajar e instalar la máquina virtual te llevará tiempo dado el tamaño y complejidad de la misma</i></b>...
Reading
4 个视频 (总计 16 分钟), 4 个阅读材料
Video4 个视频
Instalación de la máquina virtual - Import start4分钟
Instalación de la máquina virtual - Tips3分钟
Instalación de la máquina virtual - Pyspark setup4分钟
Reading4 个阅读材料
Link para la descarga de la MV_Cloudera10分钟
Instalación de la MV - Import start10分钟
Instalación de la MV - Tips10分钟
Instalación de la MV - Pyspark setup10分钟
完成时间(小时)
完成时间为 2 分钟

MATERIAL DE PRÁCTICAS Y FICHEROS DE TRABAJO

Para poder seguir la parte aplicada del curso, responder a los cuestionarios y trabajar con las herramientas que te explicamos, necesitarás acceder a una serie de ficheros de código, así como las bases de datos de trabajo, que hemos recopilado y comprimido. Verás que algunos vídeos llevan un código entre paréntesis que coincide con el nombre de alguno de estos ficheros. Esto significa que en el vídeo correspondiente se trabaja con dicho fichero. <br><br>A continuación te explicamos como incorporarlos en la máquina virtual....
Reading
2 个阅读材料
Reading2 个阅读材料
FICHEROS DE TRABAJO Y PAQUETES - IMPORTANTE1分钟
INICIO DE LA SESIÓN - IMPORTANTE1分钟
完成时间(小时)
完成时间为 2 小时

MÓDULO 1 - Análisis Exploratorio de Datos

Durante la primera semana del curso se introducen el curso y las herramientas que se emplearán. Además también se presentan las tareas relacionadas con el Análisis Exploratorio de Datos. Cada pocos temas tratados en los vídeos encontrarás un pequeño custionario de 5 preguntas. <br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 个视频 (总计 84 分钟), 6 个测验
Video10 个视频
Datos - Fuentes de información4分钟
Distintos problemas y técnicas8分钟
Caso de estudio y herramientas4分钟
Introducción a Jupyter Notebook y Pyspark (S1E4.ipynb)5分钟
Exploración de la estructura de datos (S1E5.ipynb)14分钟
Primera etapa del análisis exploratorio (S1E6.ipynb)11分钟
Preproceso de datos (I) - (S1E7.ipynb)11分钟
Preproceso de datos (II) - (S1E8.ipynb)6分钟
Segunda etapa del análisis exploratorio (S1E9.ipynb)14分钟
Quiz6 个练习
Cuestionario 110分钟
Cuestionario 210分钟
Cuestionario 310分钟
Cuestionario 410分钟
Cuestionario 510分钟
Cuestionario 610分钟
2
完成时间(小时)
完成时间为 3 小时

MÓDULO 2 - MODELOS DE REGRESIÓN

En el módulo 2 del curso se introducen conceptos de modelización generales (calibración y validación) y en particular los modelos de regresión lineal y regresión logística. Desde la perspectiva de Big Data, se incluyen aspectos relacionados con la regularización de los modelos para su simplificación. <br><br><i>Como en el módulo anterior, visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 个视频 (总计 89 分钟), 7 个测验
Video10 个视频
Objetivo de la Modelización8分钟
Calibración del modelo10分钟
Resultado de la Modelización11分钟
Regresión Simple (S2E4.ipynb)11分钟
Nuevas variables (S2E5.ipynb)8分钟
Regresión Múltiple (I) (S2E6.ipynb)7分钟
Regresión Múltiple (II) (S2E7.ipynb)11分钟
Regresión Logística (I) (S2E8.ipynb)8分钟
Regresión Logística (II) (S2E9.ipynb)10分钟
Quiz7 个练习
Cuestionario 110分钟
Cuestionario 210分钟
Cuestionario 310分钟
Cuestionario 410分钟
Cuestionario 510分钟
Cuestionario 610分钟
Cuestionario 710分钟
3
完成时间(小时)
完成时间为 3 小时

MÓDULO 3 - ÁRBOLES DE REGRESIÓN Y CLASIFICACIÓN

En el módulo 3 del curso se introduce la família de modelos basada en árboles (clasificación, regresión, bosques) y aspectos generales sobre la incertidumbre y el sobreajuste. Después de cada tema, o de unos pocos temas, encontrarás un cuestionario para comprobar tu nivel de comprensión de los mismos.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 个视频 (总计 89 分钟), 7 个测验
Video10 个视频
Introducción a la Modelización5分钟
Medir la Incertidumbre10分钟
Concepto de Árbol8分钟
Árboles de Regresión11分钟
Modelización con Árboles de Regresión (S3E5.ipynb)9分钟
Árboles de Clasificación9分钟
Modelización con Árboles de Clasificación (S3E7.ipynb)9分钟
Bosques Aleatorios14分钟
Modelización con Bosques Aleatorios (S3E9.ipynb)9分钟
Quiz7 个练习
Cuestionario 18分钟
Cuestionario 210分钟
Cuestionario 310分钟
Cuestionario 410分钟
Cuestionario 510分钟
Cuestionario 610分钟
Cuestionario 710分钟
4
完成时间(小时)
完成时间为 3 小时

MÓDULO 4 - REDES NEURONALES Y TÉCNICAS NO SUPERVISADAS

En el módulo 4 del curso se introduce la família de modelos basada en redes neuronales así como se introducen las técnicas básicas no supervisadas, tanto de clasificación automática como de reducción de la dimensionalidad. En este módulo, además de los cuestionarios convencionales, tendrás que realizar un trabajo práctico en el que trabajarás las técnicas aprendidas hasta el momento.<br><br><i>Visualiza los vídeos, contesta los cuestionarios tantas veces como quieras, realiza el ejercicios práctico, y accede a los foros para discutir los temas que te parezcan más interesantes.</i>...
Reading
10 个视频 (总计 75 分钟), 1 个阅读材料, 7 个测验
Video10 个视频
Redes Neuronales12分钟
Modelización con redes neuronales (S4E2.ipynb)6分钟
Introducción al reconocimiento de patrones5分钟
Reducción dimensión11分钟
Análisis de componentes principales (S4E6.ipynb)10分钟
Clasificación automática8分钟
Análisis de clústers (S4E8.ipynb)7分钟
Revisión de la ciencia de datos (I)5分钟
Revisión de la ciencia de datos (II)6分钟
Reading1 个阅读材料
TRABAJO PRÁCTICO - Enunciado30分钟
Quiz7 个练习
Cuestionario 110分钟
Cuestionario 210分钟
Cuestionario 310分钟
Cuestionario 410分钟
Cuestionario 510分钟
Cuestionario 610分钟
Cuestionario del Ejercicio Práctico30分钟

讲师

Avatar

Llorenç Badiella

Director Servei d'Estadística Aplicada UAB
Universitat Autònoma de Barcelona
Avatar

Isabel Serra

Doctora
Centre de Recerca Matemàtica

关于 Universitat Autònoma de Barcelona

The Universitat Autònoma de Barcelona (UAB) is a public university located in the metropolitan area of Barcelona. International in its outlook, it is fully consolidated within its local surroundings, and offers quality education in close association with research activity, the transfer of scientific, technological, cultural and educational knowledge, the promotion of its human potential and the responsible management of available resources. The UAB currently offers 81 degrees, 130 official Master Programmes and 183 UAB-specific Masters Degrees. In addition, it offers 174 lifelong learning programmes and 65 PhD Programmes, 27 of which have been distinguished through Quality Awards. The UAB has a total of over 3,500 teaching and research staff, over 2,000 administrative staff and over 40,000 students....

关于 Big Data – Introducción al uso práctico de datos masivos 专项课程

Este programa, de 4 cursos más un proyecto final, está pensado como una entrada al mundo de los datos masivos y su tratamiento. El primer curso tiene como objetivo mostrar al estudiante el impacto del Big Data en la sociedad actual, tanto en el mundo de los negocios como en el de la política y administraciones públicas, los medios de comunicación, y/o la investigación científica. A lo largo de los cursos 2, 3 y 4 se estudian la identificación, captura, pre-procesamiento, análisis y visualización de datos, desde un punto de vista “usuario”, y con una orientación práctica. Finalmente, el Capstone Project permite al estudiante utilizar en conjunto las herramientas y conceptos vistos en los cursos precedentes en un campo donde el concepto “Big Data” es innegable: el estudio de las galaxias. Al finalizar los cursos de esta especialización el estudiante será capaz de: 1. Entender el impacto del tratamiento de datos masivos en la sociedad actual 2. Entender y explicar la procedencia y características de los datos masivos. 3. Adquirir, preparar, almacenar, analizar, visualizar y manejar grandes conjuntos de datos 4. Extraer información de los datos 5. Trabajar dentro del ecosistema Hadoop 6. Contestar a una pregunta bien formulada en función de la información disponible (capstone project) Contamos con un conjunto maravilloso de profesores, con una gran experiencia en el tema, provenientes tanto de la universidad como de la empresa....
Big Data – Introducción al uso práctico de datos masivos

常见问题

  • 注册以便获得证书后,您将有权访问所有视频、测验和编程作业(如果适用)。只有在您的班次开课之后,才可以提交和审阅同学互评作业。如果您选择在不购买的情况下浏览课程,可能无法访问某些作业。

  • 您注册课程后,将有权访问专项课程中的所有课程,并且会在完成课程后获得证书。您的电子课程证书将添加到您的成就页中,您可以通过该页打印您的课程证书或将其添加到您的领英档案中。如果您只想阅读和查看课程内容,可以免费旁听课程。

还有其他问题吗?请访问 学生帮助中心