IFCT0118 BIG DATA PARA INGENIERÍAS

100 Horas
ONLINE
El curso IFCT0118 BIG DATA PARA INGENIERÍAS te ofrece la oportunidad de sumergirte en el fascinante mundo del Big Data, un campo en constante crecimiento y con una demanda laboral que no deja de aumentar. Las empresas buscan cada vez más profesionales capaces de manejar grandes volúmenes de datos y extraer información valiosa para la toma de decisiones estratégicas. Al participar en este curso, desarrollarás habilidades esenciales en el análisis y gestión de datos masivos, lo que te permitirá destacar en un mercado competitivo. Este programa te capacitará para identificar patrones, tendencias y relaciones ocultas en conjuntos de datos complejos, lo que es crucial para la innovación y el desarrollo en diversas áreas de la ingeniería. Si deseas estar a la vanguardia tecnológica y potenciar tu carrera profesional, esta formación es ideal para ti.
IFCT0118 BIG DATA PARA INGENIERÍAS Ampliar
DISPONIBLE PRÓXIMAMENTE
EF_427109-2601
  1. MÓDULO 1. FUNDAMENTOS DE BIG DATA Y PROCESAMIENTO DE DATOS

UNIDAD DIDÁCTICA 1. CONOCIMIENTO DE LOS FUNDAMENTOS DE BIG DATA

  1. Definición y conceptos básicos de Big Data.
  2. Características de Big Data (las 8 Vs).
  3. Principales paradigmas de procesamiento en Big Data.
  4. Introducción a los sistemas de almacenamiento distribuido.

UNIDAD DIDÁCTICA 2: PROCESAMIENTO DE DATOS

  1. Introducción a Hadoop y el sistema de archivos HDFS
  2. Funcionamiento de MapReduce en Hadoop
  3. Gestión de recursos con YARN
  4. Ingestión de datos con Apache Flume y Sqoop
  5. Configuración de seguridad en Hadoop con Kerberos

UNIDAD DIDÁCTICA 3. CONOCIMIENTO DE PROCESOS Y HERRAMIENTAS QUE FAVORECEN LA EFICIENCIA ENERGÉTICA EN EL TRABAJO CON GRANDES VOLÚMENES DE DATOS.

  1. Conocimiento de Procesos y Herramientas que Favorecen la Eficiencia Energética en el Trabajo con Grandes Volúmenes de Datos
  2. MÓDULO 2. PROCESAMIENTO AVANZADO, CIENCIA DE DATOS Y APRENDIZAJE AUTOMÁTICO

UNIDAD DIDÁCTICA 1. PROCESAMIENTO AVANZADO CON SPARK

  1. Conceptos básicos y ventajas de Spark.
  2. Uso de DataFrames y Spark SQL para análisis de datos.
  3. Operaciones con DataFrames y optimización de consultas.
  4. Operaciones con Resilient Distributed Datasets (RDDs).
  5. Ejecución de aplicaciones en Spark y manejo de clusters.

UNIDAD DIDÁCTICA 2. USO DE LA CIENCIA DE DATOS Y MACHINE LEARNING

  1. Introducción a Spark MLlib y algoritmos básicos de machine learning.
  2. Modelado, evaluación y validación de modelos de datos.
  3. Librerías y funciones de MLlib para procesamiento de datos.
  4. Implementación de pipelines de machine learning.
  5. MÓDULO 3. ANÁLISIS Y PROCESAMIENTO EN TIEMPO REAL

UNIDAD DIDÁCTICA 1. ANÁLISIS Y ALMACENAMIENTO DE DATOS

  1. Introducción a Hive e Impala para consultas SQL en Hadoop.
  2. Creación y gestión de tablas y bases de datos.
  3. Consultas avanzadas con HiveQL y optimización de Impala.
  4. Análisis de datos complejos con Hive y consultas de Impala.

UNIDAD DIDÁCTICA 2. PROCESAMIENTO EN TIEMPO REAL

  1. Fundamentos de Spark Streaming y fuentes de datos en tiempo real.
  2. Configuración y ejecución de flujos de datos en Spark.
  3. Integración con Apache Kafka para ingestión de datos en tiempo real.
  4. Análisis en streaming y actualización en tiempo real.
  • Duración: 100 horas