Duracion:
- 3 días.
Descripción:
- Este curso introduce en las técnicas de programación usadas por los analistas
para transformar datos brutos en un formato apropiado para la modelización
predictiva.
Aprenda cómo:
- extraer datos relevantes.
- transformar datos transaccionales o de sucesos.
- usar datos no numéricos, incluyendo el control de los grados de libertad.
- resolver excepciones y extremos.
Quiénes debieran asistir
- Profesionales de data mining y de IT.
Prerrequisitos
- Este curso supone alguna experiencia en data mining. Antes de asistir a este curso,
usted debiera tener experiencia en las técnicas comunes de modelización predictiva.
Contenido
- Introducción:
- Estructuras de datos brutos.
- Estructuras de datos para modelización predictiva.
- Revisión de los problemas principales en la preparación de datos.
- Extracción de datos relevantes:
- Dificultades con los datos.
- Evaluación de los datos disponibles.
- Acceso a los datos disponibles.
- Extracción de una muestra representativa de targets.
- Extracción de una muestra no contaminada de variables de entrada.
- Transformación de datos transaccionales y de sucesos.
- Ventajas y desventajas de los datos transaccionales.
- Estructuras comunes de las transacciones.
- Definición del horizonte temporal.
- Métodos fijos y variables de horizonte temporal.
- Implementación de transformaciones transaccionales comunes.
- Uso de datos no numéricos:
- Definiciones y dificultades de los datos no numéricos.
- Detección de errores de codificación y multicodificación.
- Control de grados de libertad.
- Geocodificación.
- Manejo de excepciones y valores extremos:
- Dificultades con los valores extremos, valores faltantes y no aplicables.
- Dificultades con las distribuciones extremas.
- Detección de excepciones y valores extremos.
- Remedios para las excepciones y valores extremos.