DIPLOMADO EN APRENDIZAJE MÁQUINA Y PROFUNDO
APLICADO A GRANDES VOLÚMENES DE DATOS
(Machine Learning, Deep Learning y Big Data)
PROYECTO PAPIME PE103124 2024-2025.
Modulo I. Machine Learning, 5 de marzo al 5 de abril del 2024.
Módulo II. Deep Learning, del 29 de julio al 30 de agosto del 2024.
Módulo III. Big Data, del 14 de octubre al 8 de noviembre del 2024.
Diplomado de especialización de 120 horas; 60 horas teoría y 60 horas prácticas, para académicos y estudiantes de la UNAM Campus Morelia. El diplomado se realizará en las instalaciones del Instituto de Investigaciones en Ecosistemas y Sustentabilidad en sus laboratorios y servidores, en modalidad híbrida.
El diplomado es parte del proyecto DGAPA-UNAM PAPIME: PE103124, “Mejora de la enseñanza del aprendizaje automático aplicado a la Ciencia de Datos a gran escala; dirigido a académicos y estudiantes de la Licenciatura en Tecnologías para la Información en Ciencias (LTICs) en la ENES Morelia”.
Los módulos que se ofrecen son los siguientes:
MÓDULO I. Aprendizaje automático (ML). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje máquina (ML) aplicado a la Ciencia de Datos.
Temas:
- Inteligencia artificial y Machine Learning
- Fases de un proyecto de ML
- Métodos de regresión
- Métodos de clasificación
- Métodos de predicción
- Aprendizaje supervisado
- Aprendizaje no supervisado
- Métricas
Prácticas:
- Instalación y configuración de herramientas
- Clasificación usando árboles de decisión
- Predicción de costos (Regresión lineal/ Regresión logística)
- Algoritmo de k-vecinos más cercanos
- Aprendizaje no supervisado (k-medias)
- Predicción del clima (Regresión lineal)
Herramientas; Anaconda, Python, JupyterLab, Numpy, Pandas, Scikit-Learn, Matplotlib, Seaborn, entre otras.
Módulo II. Deep Learning, del 29 de julio al 30 de agosto del 2024.
MÓDULO II. Aprendizaje profundo (DL). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje profundo (DL) aplicado a la Ciencia de Datos.
Temas, horario de 17:00 a 20:00 hrs, lunes y jueves:
- Lunes 29 de julio. Inteligencia artificial y Deep Learning (DL). Práctica 1.
- Jueves 1 de agosto. Fases de un proyecto de DL. Práctica 2.
- Lunes 5 agosto. Visión por computadora y redes neuronales convolucionales (CNNs). Práctica 3 y 4.
- Jueves 8. Transferencia de aprendizaje. Práctica 5 y 6.
- Lunes 12 y jueves 15 de agosto. Redes neuronales recurrentes (RNNs) y Tratamiento de lenguaje natural. Práctica 7 y 8.
- Lunes 19 de agosto. Introducción a la Arquitectura Transformer (fundamentos de ChatGPT, LLMs). Práctica 9.
- Jueves 22 de agosto. Cierre de sesiones síncronas.
- Semana del 26 al 30 de agosto. Sesiones asíncronas de apoyo.
Prácticas:
- Implementación de un clúster de almacenamiento (HDFS)
- Implementación de un clúster de procesamiento (DASK)
- Predicción de precio de autos (Regresión múltiple)
- Clasificación de imágenes de objetos comunes -vestimenta- (MLP)
- Identificación de mosquitos (CNNs)
- Identificación de la cantidad de nitrógeno en hojas por medio del color (CNNs)
- Clasificación de imágenes de deportes (Transferencia de aprendizaje y aumento de datos)
- Aplicación del DL al procesamiento del lenguaje natural (NLP)
- Práctica con ChatGPT (LLMs)
Herramientas; Anaconda, Python, Pandas, Numpy, Scikit-Learn, Matplotlib, Seaborn, TensorFlow, Keras, ChatGPT, entre otras.
MÓDULO III. Grandes volúmenes de datos (Big Data). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje máquina y profundo (ML y DL) aplicado a la Ciencia de Datos a gran escala.
Temas:
- Grandes volúmenes de datos
- Sistemas de archivos distribuidos
- Técnicas de limpieza de grandes volúmenes de datos
- Aplicación del ML y DL en proyectos reales
- Despliegue del modelo en sistemas en producción
Prácticas:
- Uso de Unidades de Procesamiento Gráfico (GPUs)
- Instalación y uso de frameworks para cómputo distribuido
- Instalación y uso de almacenamiento distribuido
- Casos especiales de ML/DL
- Instalación y configuración de GPU en proyectos de ML/DL
- Ejemplos de aplicaciones reales.
Herramientas; Anaconda, Python, Scikit-Learn, Matplotlib, TensorFlow, Dask, HDFS, Keras, entre otras.
El diplomado se aplicará de acuerdo con la siguiente planificación:
Al finalizar el diplomado los académicos y estudiantes recibirán de parte del IIES un reconocimiento con valor curricular y avalado por los instructores:
- Heberto Ferreira Medina, Técnico Académico, IIES-UNAM. Cédula: 09875495.
- Sergio Rogelio Tinoco Martínez, Técnico Académico. ENES-UNAM. Cédula: 09124089.
- José Luis Cendejas Valdez. UTM, Morelia. Cédula: 08955231.
- Froylan Hernández Rendón. ENES-UNAM.
- LTIC. Bruce Hiram Ginori Rodríguez. LTIC, ENES-UNAM.
- ISC. Jessica Jazmin Torres Gallegos
- ISC. Karla Guadalupe Ornelas Gamero
- TICS. José Alejandro Ponce de León Magaña
Los aspirantes deberán inscribirse en el link siguiente;
- enesmorelia.unam.mx o escuelamldl.iies.unam.mx, formulario en el link de cursos
- Deben tener conocimiento previo de estadística, matemáticas y lenguaje Python, a nivel básico.
- Compromiso para terminar los tres módulos del diplomado (formato de compromiso)
Mayores informes;
ENES: 5556237300 Ext. UNAM: 80620 y 37307
IIES: 4433222711 o Ext. UNAM: 32711 y 32838
ATTE.
Dr. Heberto Ferreira Medina, Dr. Sergio Rogelio Tinoco Martínez y MTI Froylan Hernández Rendón.
Responsables del proyecto PAPIME: PE103124. Periodo 2024-2025.