Saltar al contenido

Preparación de datos para Data Mining

    Duracion:

    • 3 días.

    Descripción:

    • Este curso introduce en las técnicas de programación usadas por los analistas
      para transformar datos brutos en un formato apropiado para la modelización
      predictiva.

    Aprenda cómo:

    • extraer datos relevantes.
    • transformar datos transaccionales o de sucesos.
    • usar datos no numéricos, incluyendo el control de los grados de libertad.
    • resolver excepciones y extremos.

    Quiénes debieran asistir

    • Profesionales de data mining y de IT.

    Prerrequisitos

    • Este curso supone alguna experiencia en data mining. Antes de asistir a este curso,
      usted debiera tener experiencia en las técnicas comunes de modelización predictiva.

    Contenido

    1. Introducción:
    2. Estructuras de datos brutos.
    3. Estructuras de datos para modelización predictiva.
    4. Revisión de los problemas principales en la preparación de datos.
    5. Extracción de datos relevantes:
    6. Dificultades con los datos.
    7. Evaluación de los datos disponibles.
    8. Acceso a los datos disponibles.
    9. Extracción de una muestra representativa de targets.
    10. Extracción de una muestra no contaminada de variables de entrada.
    11. Transformación de datos transaccionales y de sucesos.
    12. Ventajas y desventajas de los datos transaccionales.
    13. Estructuras comunes de las transacciones.
    14. Definición del horizonte temporal.
    15. Métodos fijos y variables de horizonte temporal.
    16. Implementación de transformaciones transaccionales comunes.
    17. Uso de datos no numéricos:
    18. Definiciones y dificultades de los datos no numéricos.
    19. Detección de errores de codificación y multicodificación.
    20. Control de grados de libertad.
    21. Geocodificación.
    22. Manejo de excepciones y valores extremos:
    23. Dificultades con los valores extremos, valores faltantes y no aplicables.
    24. Dificultades con las distribuciones extremas.
    25. Detección de excepciones y valores extremos.
    26. Remedios para las excepciones y valores extremos.