300 HORAS
En los últimos años la importancia de los datos ha crecido enormemente, llegando a ser uno de los puntos vitales para las empresas. Por eso mismo, saber cómo trabajar con ellos y entenderlos se ha convertido en una tarea esencial para los analistas de datos y para las empresas. Aprende todo sobre ingeniería de datos con el Máster Data Engineering Online
La ingeniería de datos se ha convertido en un pilar fundamental dentro de cualquier organización orientada a la información. Este máster permite comprender cómo se construyen los sistemas que hacen posible el análisis avanzado, la inteligencia de negocio y el aprendizaje automático. La ingeniería de datos engloba todas las tareas necesarias para adquirir, transformar, almacenar y preparar la información que posteriormente será utilizada por analistas, data scientists o sistemas automatizados.
A través del Máster Data Engineering desarrollarás una base sólida en Python, abarcando sintaxis, estructuras de datos, programación orientada a objetos, lectura y escritura de ficheros, acceso a bases de datos y uso de librerías esenciales como Numpy y Pandas. También se incluyen conceptos más avanzados como multitarea, módulos, acceso a APIs y automatización mediante scripts.
La importancia de conocer SQL radica en estudiar las operaciones CRUD, relaciones entre tablas, consultas avanzadas, exportación de datos y su conexión con Power BI. A través del módulo de Power BI conocerás el modelado, las transformaciones, DAX y la creación de informes. Finalmente, el aprendizaje se completa con Snowflake, una de las plataformas cloud más utilizadas para construir data warehouses modernos, abarcando su arquitectura, carga de datos, automatización y administración.
En conjunto, el máster Data Engineering Online ofrece una visión completa y práctica de la ingeniería de datos, permitiendo comprender el flujo del dato de principio a fin para poder aplicar a proyectos de cualquier tamaño en nuetro trabajo
Módulo 0. Presentación al máster
Presentación al máster
Módulo 1. Fundamentos de Programación en Python para Data Engineering
1. INTRODUCCIÓN A PYTHON APLICADO A LA INGENIERÍA DE DATOS
2. ENTORNO DE DESARROLLO Y BUENAS PRÁCTICAS (VIRTUAL ENVIRONMENTS, ESTRUCTURA
DE PROYECTOS)
3. TIPOS DE DATOS, ESTRUCTURAS BÁSICAS Y CONTROL DE FLUJO
4. FUNCIONES, MÓDULOS Y REUTILIZACIÓN DE CÓDIGO
5. MANEJO DE FICHEROS Y SISTEMAS DE ARCHIVOS (CSV, JSON, PARQUET)
6. INTRODUCCIÓN A PANDAS PARA MANIPULACIÓN DE DATOS
7. LECTURA, LIMPIEZA Y TRANSFORMACIÓN BÁSICA DE DATOS
8. CONSUMO DE APIS Y MANEJO DE DATOS EXTERNOS
9. AUTOMATIZACIÓN DE TAREAS Y SCRIPTING
10. GESTIÓN DE ERRORES Y EXCEPCIONES
11. LOGGING Y TRAZABILIDAD DE PROCESOS
12. INTRODUCCIÓN A PRUEBAS BÁSICAS (TESTING)
13. BUENAS PRÁCTICAS DE CÓDIGO PARA PIPELINES PRODUCTIVOS
MÓDULO 2. Modelado de Datos y SQL avanzado
1. FUNDAMENTOS DE SQL
a. Estructura de una consulta SQL
b. Selección, filtrado y ordenación de datos
c. Operaciones de agregación
2. CONSULTAS SQL COMPLEJAS
a. Joins (INNER, LEFT, RIGHT, FULL)
b. Self joins y joins sobre múltiples tablas
c. Subconsultas correlacionadas y no correlacionadas
d. Common Table Expressions (CTE)
3. FUNCIONES ANALÍTICAS Y WINDOW FUNCTIONS
a. Uso de OVER, PARTITION BY y ORDER BY
b. Funciones de ranking y cálculo acumulado
c. Análisis temporal y comparativas entre registros
4. TRANSFORMACIÓN DE DATOS CON SQL
a. Limpieza y enriquecimiento de datos
b. Cálculos derivados y métricas
5. OPTIMIZACIÓN DE CONSULTAS SQL
a. Uso de índices
b. Análisis de planes de ejecución
c. Buenas prácticas de rendimiento
6. MODELADO DE DATOS RELACIONAL
a. Diseño de esquemas y relaciones
b. Normalización y desnormalización
c. Claves primarias y foráneas
7. MODELADO DIMENSIONAL
a. Conceptos de hechos y dimensiones
b. Definición de granularidad
c. Medidas y atributos
8. ESQUEMA ESTRELLA
9. ESQUEMA COPO DE NIEVE
10. BUENAS PRÁCTICAS DE MODELADO ORIENTADO A ANALÍTICA Y REPORTING
11. CASOS PRÁCTICOS DE DISEÑO Y CONSULTA SOBRE MODELOS DE DATOS
MÓDULO 3. Bases de Datos NoSQL y Modelos No Relacionales
1. INTRODUCCIÓN A LAS BASES DE DATOS NOSQL
2. LIMITACIONES DE LOS MODELOS RELACIONALES TRADICIONALES
3. NOSQL VS SQL
a. Casos de uso
b. Escalabilidad horizontal y vertical
c. Consistencia, disponibilidad y tolerancia a particiones (CAP)
4. TIPOS DE BASES DE DATOS NOSQL
a. Documentales
b. Clave-valor
c. Columnas
d. Grafos
5. FUNDAMENTOS DE MODELADO NOSQL
a. Diseño orientado a consultas
b. Desnormalización y duplicación controlada
6. INTRODUCCIÓN A MONGODB
a. Arquitectura y conceptos básicos
b. Colecciones y documentos
c. Tipos de datos
7. CONSULTAS EN MONGODB
a. Filtros, proyecciones y ordenación
b. Operadores
8. FRAMEWORK DE AGREGACIÓN EN MONGODB
9. ÍNDICES Y RENDIMIENTO EN MONGODB
10. INTRODUCCIÓN A CASSANDRA
a. Arquitectura distribuida
b. Modelo de datos basado en columnas
c. Particiones y clustering
11. MODELADO DE DATOS EN CASSANDRA
12. CONSULTAS Y PATRONES DE ACCESO EN CASSANDRA
13. CASOS DE USO REALES DE MONGODB Y CASSANDRA
14. INTEGRACIÓN DE BASES DE DATOS NOSQL EN PIPELINES DE DATOS
MÓDULO 4. Procesamiento Distribuido de Datos con Apache Spark
1. INTRODUCCIÓN AL PROCESAMIENTO DISTRIBUIDO DE DATOS
2. ARQUITECTURA DE APACHE SPARK
a. Driver, executors y cluster manager
b. Modos de ejecución (local, cluster)
3. CONCEPTOS FUNDAMENTALES DE SPARK
a. RDDs: características y casos de uso
b. DataFrames y Datasets
4. OPERACIONES EN SPARK
a. Transformaciones y acciones
b. Lazy evaluation
5. SPARK SQL
a. Ejecución de consultas SQL sobre DataFrames
b. Integración con fuentes de datos
6. PROCESAMIENTO BATCH CON SPARK
a. Lectura y escritura de grandes volúmenes de datos
b. Transformaciones complejas y agregaciones
7. OPTIMIZACIÓN BÁSICA EN SPARK
a. Particionado y paralelismo
b. Caché y persistencia
8. INTRODUCCIÓN AL PROCESAMIENTO EN STREAMING
a. Conceptos de Spark Structured Streaming
b. Casos de uso habituales
9. CASOS PRÁCTICOS DE PROCESAMIENTO DE GRANDES VOLÚMENES DE DATOS
a. Transformaciones batch
b. Análisis y agregaciones sobre datasets masivos
MÓDULO 5. Ingesta y Streaming de Datos con Apache Kafka
1. INTRODUCCIÓN A LAS ARQUITECTURAS ORIENTADAS A EVENTOS
2. CONCEPTOS FUNDAMENTALES DE APACHE KAFKA
a. Brokers y cluster
b. Zookeeper / modo KRaft (visión general)
3. TOPICS, PARTICIONES Y REPLICACIÓN
a. Distribución y paralelismo
b. Garantías de entrega
4. PRODUCTORES Y CONSUMIDORES
a. Publicación de eventos
b. Consumo y procesamiento de mensajes
5. SERIALIZACIÓN DE DATOS
a. Formatos comunes (JSON, Avro)
6. GESTIÓN DE OFFSETS Y GRUPOS DE CONSUMIDORES
7. KAFKA CONNECT
a. Arquitectura y conectores
b. Integración con bases de datos y sistemas externos
8. INTRODUCCIÓN AL CHANGE DATA CAPTURE (CDC)
a. Concepto y casos de uso
b. Integración con Kafka
9. CASOS DE USO DE STREAMING DE DATOS
a. Procesamiento en tiempo real
b. Integración con sistemas batch
10. BUENAS PRÁCTICAS Y PATRONES DE DISEÑO CON KAFKA
MÓDULO 6. Orquestación y Automatización de Pipelines de Datos
1. INTRODUCCIÓN A LA ORQUESTACIÓN DE PIPELINES DE DATOS
2. DISEÑO DE PIPELINES DE DATOS
a. Pipelines batch y near-real-time
b. Buenas prácticas de diseño
3. CONCEPTOS ETL VS ELT
a. Diferencias y casos de uso
b. Impacto en arquitecturas modernas de datos
4. INTRODUCCIÓN A HERRAMIENTAS DE ORQUESTACIÓN
a. Apache Airflow o herramienta equivalente
5. CONCEPTOS CLAVE DE ORQUESTACIÓN
a. DAGs
b. Tareas y operadores
c. Dependencias entre tareas
6. PLANIFICACIÓN Y SCHEDULING DE PROCESOS
7. GESTIÓN DE ERRORES Y REINTENTOS
8. MONITORIZACIÓN Y CONTROL DE EJECUCIONES
9. BUENAS PRÁCTICAS PARA PIPELINES PRODUCTIVOS
10. CASOS PRÁCTICOS DE AUTOMATIZACIÓN DE FLUJOS DE DATOS
MÓDULO 7. Plataformas Cloud de Datos y Data Warehousing (Snowflake)
1. INTRODUCCIÓN A LAS ARQUITECTURAS CLOUD DE DATOS
2. CONCEPTOS DE DATA WAREHOUSE MODERNO
3. ARQUITECTURA DE SNOWFLAKE
a. Almacenamiento, compute y servicios
4. CARGA DE DATOS EN SNOWFLAKE
a. Stages internos y externos
b. Formatos de datos
5. SQL analítico en Snowflake
a. Consultas complejas y transformaciones
6. OPTIMIZACIÓN Y RENDIMIENTO
a. Clustering
b. Gestión de recursos
7. TIME TRAVEL Y RECUPERACIÓN DE DATOS
8. STREAMS Y TASKS
a. Automatización de flujos de datos
9. INTRODUCCIÓN A SNOWPARK
a. Procesamiento de datos con Python en Snowflake
10. CASOS PRÁCTICOS DE USO DE SNOWFLAKE EN PIPELINES DE DATOS
MÓDULO 8. Contenedores, Control de Versiones y DevOps para Data Engineers
1. INTRODUCCIÓN A BUENAS PRÁCTICAS DEVOPS EN DATA ENGINEERING
2. CONTROL DE VERSIONES CON GIT
a. Repositorios
b. Ramas y flujos de trabajo colaborativos
3. BUENAS PRÁCTICAS DE VERSIONADO DE CÓDIGO DE DATOS
4. INTRODUCCIÓN A DOCKER
a. Conceptos básicos de contenedores
b. Imágenes y contenedores
5. CREACIÓN DE ENTORNOS REPRODUCIBLES CON DOCKER
6. DOCKER COMPOSE
a. Orquestación básica de servicios
b. Entornos de desarrollo y pruebas
7. INTRODUCCIÓN A CI/CD APLICADO A PROYECTOS DE DATOS
a. Automatización de pruebas y despliegues
8. INTEGRACIÓN DE PIPELINES DE DATOS EN FLUJOS CI/CD
MÓDULO 9. Consumo Analítico y Business Intelligence para Data Engineers
1. ROL DEL DATA ENGINEER EN LA CAPA DE CONSUMO
2. ARQUITECTURA DE LA CAPA ANALÍTICA
3. PREPARACIÓN DE DATASETS PARA CONSUMO
4. INTEGRACIÓN CON HERRAMIENTAS DE BUSINESS INTELLIGENCE
a. Power BI u otras herramientas
5. MODELOS SEMÁNTICOS Y DATASETS
6. BUENAS PRÁCTICAS PARA SERVIR DATOS A NEGOCIO
a. Rendimiento
b. Calidad del dato
7. GESTIÓN DE ACTUALIZACIONES Y REFRESCOS
8. CASOS PRÁCTICOS DE CONSUMO ANALÍTICO
MÓDULO 10. Proyecto final integrador de Data Engineering
1. DEFINICIÓN DEL CASO PRÁCTICO
2. DISEÑO DE LA ARQUITECTURA DEL PIPELINE DE DATOS
3. INGESTA DE DATOS DESDE DISTINTAS FUENTES
4. PROCESAMIENTO Y TRANSFORMACIÓN DE DATOS
5. ALMACENAMIENTO Y MODELADO DE DATOS
6. AUTOMATIZACIÓN Y ORQUESTACIÓN DEL PIPELINE
7. PREPARACIÓN DE LA CAPA DE CONSUMO
8. CONTROL DE CALIDAD Y VALIDACIÓN DE DATOS
9. DOCUMENTACIÓN TÉCNICA DEL PROYECTO
10. PRESENTACIÓN FINAL DEL PROYECTO
FORMACIÓN BONIFICADA
Acompañamiento experto, seguimiento personalizado y apoyo continuo9 unidades de aprendizaje
Ejercicios prácticos
Certificado disponible según modalidad Sin horarios
¡Empieza tu formación hoy mismo! Formación 100% bonificable
PRESENTACIÓN
¡Inscribirte en un curso es muy fácil! Solo debes completar el formulario de inscripción e inmediatamente te enviaremos tus datos de acceso a la dirección de email que nos hayas indicado. Recuerda prestar atención a la carpeta de spam si no recibes nuestro email, ya que algunos filtros anti-spam podrían filtrar este correo.
Una vez tengas tu nombre de usuario y contraseña ya podrás entrar en el curso. Tienes acceso gratuito a la unidad de Metodología para que puedas evaluar el aula virtual y la dinámica de la formación online. Inicialmente, solo puedes ver la unidad de Metodología, aunque en algunos casos también puedes evaluar la primera unidad del curso elegido.
Puedes realizar el pago del curso durante el proceso de inscripción o en cualquier momento desde el campus del aula virtual. El pago puede realizarse mediante tarjeta bancaria, Paypal, Bizum, o a través de una transferencia bancaria enviando posteriormente el justificante. Una vez realizado el pago podrás acceder a todas las unidades de aprendizaje, siempre de una manera secuencial.
CONTENIDO
La inteligencia artificial para las tareas cotidianas
- Introducción
- ¿Qué es la IA?
- Aplicaciones de la IA
- IA y privacidad: precauciones antes de empezar
- Resumen
Conoce los chatbots de las IA principales y algunos más
- Introducción
- ChatGPT
- Gemini
- Copilot
- Claude
- Otras herramientas de IA
- Resumen
Comunicate con la IA. Estrategia para el diseño de PROMPTS
- Introducción
- ¿Cómo nos comunicamos con la IA?
- ¿Cómo tienen que ser los prompts?
- Estrategia para diseñar prompts efectivos
- Posibles tipos de conversación: trucos para conversar
- Resumen
Genera contenido en forma de texto
- Introducción
- Prompt para generar texto
- ChatGPT para generar texto
- Gemini para generar texto
- Copilot para generar texto
- Claude para generar texto
- Otras herramientas de IA para generar texto
- Resumen
Resume textos
- Introducción
- Prompts para resumir texto
- ChatGPT para resumir texto
- Gemini para resumir texto
- Copilot para resumir texto
- Claude para resumir texto
- Otras herramientas de IA para resumir texto
- Resumen
Crea un mapa mental
- Introducción
- Prompts para crear un mapa mental
- ChatGPT para generar un mapa mental
- Gemini para generar el texto de un mapa mental
- Copilot para generar el texto de un mapa mental
- Claude para generar el texto de un mapa mental
- Otras herramientas de IA para generar el texto de un mapa mental
- Xmind para crear mapas mentales
- Resumen
Genera una presentación
- Introducción
- Prompts para crear una presentación
- ChatGPT para generar una presentación
- Gemini para generar el texto de una presentación
- Copilot para generar el texto de una presentación
- Claude para generar el texto de una presentación
- Otras herramientas de IA para generar el texto de una presentación
- Resumen
Interactúa con vídeos
- Introducción
- Prompt para interactuar con vídeos
- ChatGPT para interactuar con un vídeo
- Gemini para interactuar con un vídeo
- Copilot para interactuar con un vídeo
- Claude para interactuar con un vídeo
- Otras herramientas de IA para interactuar con videos
- Resumen
Analiza datos
- Introducción
- Prompts para analizar datos
- ChatGPT para analizar datos
- Gemini para analizar datos
- Copilot para analizar datos
- Claude para analizar datos
- Otras herramientas de IA para analizar datos
- Resumen
Evalua y selecciona herramientas de IA
- Introducción
- Identifica tus herramientas de IA
- Resumen
PRECIOS
FORMACIÓN BONIFICADA
Acompañamiento experto, seguimiento personalizado y apoyo continuo10 unidades de aprendizaje
10 prácticas
324 min de vídeo 10 test de evaluación Certificado disponible según modalidad Sin horarios
¡Empieza tu formación hoy mismo! Formación 100% bonificable


