ITAM - Instituto Tecnológico Autónomo de México

Diplomado en Herramientas de Minería de Datos y Analítica Empresarial

ITAM - Instituto Tecnológico Autónomo de México

Descripción

El Diplomado en Herramientas de Minería de Datos y Analítica Empresarial  tiene por objetivo  que los participantes adquieran las herramientas, técnicas, habilidades y conocimientos para elaborar modelos de analítica enfocados al ámbito empresarial.

Temario del curso

Módulo 1: HERRAMIENTAS DE PROCESAMIENTO GENERAL DE DATOS 
Objetivo: Se proporcionará a los participantes las herramientas básicas de programación para el tratamiento detallado de datos y para manejar arreglos, series y tramas de datos en Python. Con ello se establecerá una plataforma general para la adquisición y procesamiento de datos. Se analizarán los métodos generales para procesar tablas por medio de tramas de datos en pandas. 
1. Programación en Python, NumPy, pandas y Matplotlib 
2. Estructura de la trama de datos. Índices y columnas 
3. Importación y exportación de datos. Codificación 
4. Métodos de consolidación de información. Limpieza y transformación de datos 
5. Selección de registros. Mutación de valores. Concatenación y fusión 
6. Visualización de datos 
7. Herramientas para el análisis exploratorio de datos. Funciones lambda 
8. Generación de documentos con el resultado de las ejecuciones 

Módulo 2: MODELOS SUPERVISADOS 
Objetivo: En este módulo, los participantes comprenderán los fundamentos, hipótesis y finalidad de los métodos supervisados, la manera en que se establecen los objetivos de negocio en términos de la variable objetivo y las métricas con que se determina la bondad de ajuste de los modelos desarrollados. Para el caso de los clasificadores, se analizará el comportamiento de la puntuación de pertenencia del caso a cada una de las clases y su impacto en el negocio. 
1. Introducción a la minería de datos. Modelos supervisados y modelos no supervisados 
2. Clasificadores. Entropía e información. Información ganada 
3. ROC y PRC. Concepto de puntuación de corte 
4. Submuestras de entrenamiento y de prueba. Validación cruzada 
5. Bayesiano ingenuo 
6. CART 
7. Regresión logística 
8. Máquinas de soporte vectorial 
9. Redes neuronales como clasificadores 
10.KNN como clasificadores 
11.Sobrecarga y compensación 
12.Predictores. Objetivo 
13.Modelos lineales. Correlación lineal 
14.Regresión lineal 
15.Modelos no lineales. Redes neuronales como predictores 
16.Árboles para regresión 
17.KNN como predictores 

Módulo 3: MODELOS NO SUPERVISADOS Y TRANSFORMACIÓN DE DATOS 
Objetivo: Los participantes conocerán los fundamentos y objetivos de los modelos de asociación y la manera en que se derivan y usan las reglas de asociación. 
Se analizarán las métricas aplicables a estos modelos y sus implicaciones para el negocio. Se revisarán las principales técnicas para elaborar modelos de agrupamiento y se examinarán los criterios para formar el número adecuado de grupos. 
Los participantes aprenderán a analizar con ayuda de los clasificadores el contenido de los grupos resultado de un agrupamiento dado y determinarán el impacto en el negocio. 
1. Modelos de asociación. Algoritmos 
2. Reglas obtenidas e interpretación 
3. Métricas para la selección de combinaciones 
4. Aplicación de los modelos de selección para relaciones entre elementos 
5. Relación con grafos de elementos 
6. Conglomerados o agrupamientos 
7. Técnicas de dendrograma 
8. Técnicas de Ward 
9. KNN 
10.Mapas autoorganizativos 
11.Métricas para seleccionar el número de grupos 
12.Componentes principales 
13.Proyecciones 
14.Estandarización 
15.Logaritmos y exponenciales 
16.Binarización y agrupamiento de valores por rango 

Módulo 4: PROCESAMIENTO Y ANÁLISIS DE TEXTO 
Objetivo: Los participantes analizarán los problemas que plantea la elaboración de modelos para tratamiento de texto. Se configurarán procesamientos para extraer información con el fin de analizar los textos y utilizar esta información con modelos supervisados y no supervisados. Se comprenderá la finalidad del análisis de textos en función del objetivo particular. 
1. Captura de datos en páginas web 
2. Captura de tweets 
3. Corpus. Proceso general de detección de asociación de términos. Medidas de relevancia 
4. Matriz de documentos y términos. Búsqueda de narrativas 
5. Expresiones regulares para las narrativas 
6. Variables indicadoras de narrativas para clasificadores, predictores, asociaciones o conglomerados. Puesta en producción de detección de narrativas en textos  


Módulo 5: SISTEMAS DE RECOMENDACIÓN. USO DE HERRAMIENTAS EN LA NUBE 
Objetivo: Los sistemas de recomendación constituyen actualmente una de las herramientas comerciales más importantes. Los participantes aprenderán a utilizar estos sistemas y a realizar modelos para este fin. 
1. Sistemas de recomendación. Análisis de clientes y su comportamiento 
2. Conformación de agrupamientos y asociación de ítems 
3. Procesamiento en flujo 
4. Ejemplos en R para proceso de datos 
5. Bibliotecas equivalentes para modelos supervisados y no supervisados 
6. Similitudes y diferencias entre pandas y tramas de datos en R 
7. Datos en la nube y herramientas en nube 
8. Prácticas con herramientas en nube para desarrollo de modelos 
9. Avance y presentación del proyecto

Requisitos

Los participantes deben saber ejecutar programas, manejar archivos y carpetas, comprimir y descomprimir archivos, consultar y bajar archivos en la red, manejar hojas electrónicas y tener nociones de bases de datos relacionales. Se requieren conocimientos básicos de álgebra, álgebra lineal, probabilidad y estadística.

Metodología

El programa se imparte en cinco módulos, en los que se exponen los temas y se llevan a cabo prácticas con tablas de volúmenes considerables de registros. El trabajo se realiza normalmente en computadora. Los participantes realizarán trabajos fuera de clase, para lo cual deben instalar en su computadora las herramientas de software para las prácticas y las tareas. Al concluir el módulo 4, los participantes formarán equipos para elaborar un proyecto y presentarlo como trabajo final del diplomado al terminar el módulo 5.

Idiomas en los que se imparte

Español

Horario/Turno

Lunes de 19:00 a 22:00 h.
Miércoles de 19:00 a 22:00 h.

Duración

120 horas, 5 módulos.
Inicia: Consultar con el centro.

Objetivos


  • Se analizan los modelos supervisados y los no supervisados, así como las técnicas de transformación de datos.

  • Para el caso de los clasificadores, se realizan posprocesos a partir de la puntuación.

  • Se determina la puntuación de corte para los casos en que existan utilidades y costos asociados a la decisión.

  • Se utiliza Python como herramienta de procesamiento de datos y formación de modelos, además de herramientas de software abierto o gratuito con Python como soporte general.

  • Se usa Weka por su versatilidad y facilidad para desarrollo rápido de prototipos y modelos.

  • Se contempla la puesta en producción en Python y Weka y se analiza R como alternativa.



Titulación obtenida

Título de Diplomado, expedido por ITAM.

Promociones

Consultar con el centro

Precio

57.600 $
Costo de inscripción: 8,100.00 pesos m.n
Costo por módulo: 9,900.00 pesos m.n

Ventajas del curso

¿Te gustó este programa? ITAM puede llevarlo a Tu Empresa o diseñar alguno de acuerdo a las necesidades de Tu Organización.

Sí, me interesa

conocer todos los detalles, precios, becas, fechas y plazas disponibles

Diplomado en Herramientas de Minería de Datos y Analítica Empresarial

Para contactar debes aceptar la política de privacidad
Enviando este formulario acepta recibir información periódica de Educaweb y del Centro relacionada con estos cursos.
También te recomendamos estos cursos

Diplomado en Herramientas de Minería de Datos y Analítica Empresarial