IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS

80 Horas
ONLINE
IFCT166PO ALGORITMOS DE BIGDATA PARA INGENIERÍAS Ampliar
EF_266058-1901

UNIDAD DIDÁCTICA 1. MINERÍA DE DATOS O DATA MINING Y EL APRENDIZAJE AUTOMÁTICO

  1. Introducción a la minería de datos y el aprendizaje automático
  2. - Proceso KDD
  3. - Modelos y Técnicas de Data Mining
  4. - Áreas de aplicación
  5. - Minería de textos y Web Mining
  6. - Data mining y marketing

UNIDAD DIDÁCTICA 2. R COMO HERRAMIENTA PARA BIG DATA

  1. Instalación de R y RStudio
  2. - Introducción al lenguaje
  3. - Historia e Introducción a R
  4. - Operaciones Básicas y Números
  5. - Atributos, Entrada y Coerción
  6. - Matrices
  7. - Precedencia Operaciones Vectoriales
  8. - Manejo de fechas y tiempo
  9. - Listas, Factores, Valores Faltantes y Dataframes
  10. - Subconjuntos de Datos
  11. - Leer y Escribir Datos
  12. Uso del lenguaje
  13. - Estructuras de Control
  14. - Funciones
  15. - Reglas de Alcance
  16. Sistema de gráficos
  17. - Funciones *apply: apply
  18. - Funciones *apply: lapply / sappy
  19. - Funciones *apply: mapply / rep
  20. - Graficación con el Sistema de Base de Gráficos
  21. - Algunas Funciones Gráficas de Alto Nivel
  22. - Parámetros en el Sistema de Gráficos
  23. - Colores en el Sistema de Gráficos
  24. - Graficación con Notación Matemática
  25. - Graficación con texto y notación matemática
  26. - Creación de Gráficas en 3D
  27. Expresiones regulares. Gráficas con ggplot2 y Simulación
  28. - Expresiones Regulares
  29. - Paquete de gráficos ggplot2
  30. - Simulación
  31. R en el mundo real
  32. - Estadística Descriptiva y Predictiva con R
  33. - Integración de R en Hadoop

UNIDAD DIDÁCTICA 3. PRE-PROCESAMIENTO &, PROCESAMIENTO DE DATOS

  1. Obtención y limpieza de los datos (ETL)
  2. Inferencia estadística
  3. Pruebas de hipótesis
  4. Modelos de regresión
  5. Árboles de Decisión
  6. Algoritmos de Clasificación / Regresión (J48/C5.0, M5P)
  7. Normalización, Tipos de distancia, Correlación
  8. Machine Learning
  9. Comparar Artículos (k-NN)
  10. Modelo predictivo de profit (k-NN, M5P...)
  11. Modelo predictivo de clasificación (J48, k-NN)

UNIDAD DIDÁCTICA 4. ANÁLISIS DE LOS DATOS

  1. Inteligencia Analítica de negocios
  2. La teoría de grafos y el análisis de redes sociales
  3. Presentación de resultados

UNIDAD DIDÁCTICA 5. PROCESAMIENTO DISTRIBUIDO DE DATOS CON HADOOP

  1. ¿Qué es Hadoop?
  2. El sistema de archivos HDFS
  3. Algunos comandos de referencia
  4. Procesamiento MapReduce con Hadoop
  5. El concepto de los clusters en Hadoop

UNIDAD DIDÁCTICA 6. WEKA Y DATA MINING

  1. ¿Qué es Weka?
  2. Técnicas de Data Mining en Weka
  3. Interfaces de Weka
  4. Selección de atributos
  • Duración: 80 horas