DIPLOMADO EN APRENDIZAJE MÁQUINA Y PROFUNDO

APLICADO A GRANDES VOLÚMENES DE DATOS

(Machine Learning, Deep Learning y Big Data)

 

PROYECTO PAPIME PE103124 2024-2025.

Modulo I. Machine Learning, 5 de marzo al 5 de abril del 2024.

Módulo II. Deep Learning, del 29 de julio al 30 de agosto del 2024.

Módulo III. Big Data, del 14 de octubre al 8 de noviembre del 2024.

 

Diplomado de especialización de 120 horas; 60 horas teoría y 60 horas prácticas, para académicos y estudiantes de la UNAM Campus Morelia. El diplomado se realizará en las instalaciones del Instituto de Investigaciones en Ecosistemas y Sustentabilidad en sus laboratorios y servidores, en modalidad híbrida.

El diplomado es parte del proyecto DGAPA-UNAM PAPIME: PE103124, “Mejora de la enseñanza del aprendizaje automático aplicado a la Ciencia de Datos a gran escala; dirigido a académicos y estudiantes de la Licenciatura en Tecnologías para la Información en Ciencias (LTICs) en la ENES Morelia”.

Los módulos que se ofrecen son los siguientes:

 

MÓDULO I. Aprendizaje automático (ML). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje máquina (ML) aplicado a la Ciencia de Datos.

Temas:

  1. Inteligencia artificial y Machine Learning
  2. Fases de un proyecto de ML
  3. Métodos de regresión
  4. Métodos de clasificación
  5. Métodos de predicción
  6. Aprendizaje supervisado
  7. Aprendizaje no supervisado
  8. Métricas

Prácticas:

  • Instalación y configuración de herramientas
  • Clasificación usando árboles de decisión
  • Predicción de costos (Regresión lineal/ Regresión logística)
  • Algoritmo de k-vecinos más cercanos
  • Aprendizaje no supervisado (k-medias)
  • Predicción del clima (Regresión lineal)

Herramientas; Anaconda, Python, JupyterLab, Numpy, Pandas, Scikit-Learn, Matplotlib, Seaborn, entre otras.

 

Módulo II. Deep Learning, del 29 de julio al 30 de agosto del 2024.

MÓDULO II. Aprendizaje profundo (DL). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje profundo (DL) aplicado a la Ciencia de Datos.

Temas, horario de 17:00 a 20:00 hrs, lunes y jueves:

  • Lunes 29 de julio. Inteligencia artificial y Deep Learning (DL). Práctica 1.
  • Jueves 1 de agosto. Fases de un proyecto de DL. Práctica 2.
  • Lunes 5 agosto. Visión por computadora y redes neuronales convolucionales (CNNs). Práctica 3 y 4.
  • Jueves 8. Transferencia de aprendizaje. Práctica 5 y 6.
  • Lunes 12 y jueves 15 de agosto. Redes neuronales recurrentes (RNNs) y Tratamiento de lenguaje natural. Práctica 7 y 8.
  • Lunes 19 de agosto. Introducción a la Arquitectura Transformer (fundamentos de ChatGPT, LLMs). Práctica 9.
  • Jueves 22 de agosto. Cierre de sesiones síncronas.
  • Semana del 26 al 30 de agosto. Sesiones asíncronas de apoyo.

Prácticas:

  1. Implementación de un clúster de almacenamiento (HDFS)
  2. Implementación de un clúster de procesamiento (DASK)
  3. Predicción de precio de autos (Regresión múltiple)
  4. Clasificación de imágenes de objetos comunes -vestimenta- (MLP)
  5. Identificación de mosquitos (CNNs)
  6. Identificación de la cantidad de nitrógeno en hojas por medio del color (CNNs)
  7. Clasificación de imágenes de deportes (Transferencia de aprendizaje y aumento de datos)
  8. Aplicación del DL al procesamiento del lenguaje natural (NLP)
  9. Práctica con ChatGPT (LLMs)

Herramientas; Anaconda, Python, Pandas, Numpy, Scikit-Learn, Matplotlib, Seaborn, TensorFlow, Keras, ChatGPT, entre otras.

 

MÓDULO III. Grandes volúmenes de datos (Big Data). 40 horas (20 teoría y 20 práctica). Teoría y práctica para la mejora de la enseñanza del aprendizaje máquina y profundo (ML y DL) aplicado a la Ciencia de Datos a gran escala.

Temas:

  • Grandes volúmenes de datos
  • Sistemas de archivos distribuidos
  • Técnicas de limpieza de grandes volúmenes de datos
  • Aplicación del ML y DL en proyectos reales
  • Despliegue del modelo en sistemas en producción

Prácticas:

  • Uso de Unidades de Procesamiento Gráfico (GPUs)
  • Instalación y uso de frameworks para cómputo distribuido
  • Instalación y uso de almacenamiento distribuido
  • Casos especiales de ML/DL
  • Instalación y configuración de GPU en proyectos de ML/DL
  • Ejemplos de aplicaciones reales.

Herramientas; Anaconda, Python, Scikit-Learn, Matplotlib, TensorFlow, Dask, HDFS, Keras, entre otras.

 

El diplomado se aplicará de acuerdo con la siguiente planificación:

Al finalizar el diplomado los académicos y estudiantes recibirán de parte del IIES un reconocimiento con valor curricular y avalado por los instructores:

  • Heberto Ferreira Medina, Técnico Académico, IIES-UNAM. Cédula: 09875495.
  • Sergio Rogelio Tinoco Martínez, Técnico Académico. ENES-UNAM. Cédula: 09124089.
  • José Luis Cendejas Valdez. UTM, Morelia. Cédula: 08955231.
  • Froylan Hernández Rendón. ENES-UNAM.
  • LTIC. Bruce Hiram Ginori Rodríguez. LTIC, ENES-UNAM.
  • ISC. Jessica Jazmin Torres Gallegos
  • ISC. Karla Guadalupe Ornelas Gamero
  • TICS. José Alejandro Ponce de León Magaña

Los aspirantes deberán inscribirse en el link siguiente;

  • enesmorelia.unam.mx o escuelamldl.iies.unam.mx, formulario en el link de cursos
  • Deben tener conocimiento previo de estadística, matemáticas y lenguaje Python, a nivel básico.
  • Compromiso para terminar los tres módulos del diplomado (formato de compromiso)

 

Mayores informes; Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo., teléfono

ENES: 5556237300 Ext. UNAM: 80620 y 37307

IIES: 4433222711 o Ext. UNAM: 32711 y 32838

 

ATTE.

Dr. Heberto Ferreira Medina, Dr. Sergio Rogelio Tinoco Martínez y MTI Froylan Hernández Rendón.

Responsables del proyecto PAPIME: PE103124. Periodo 2024-2025.

Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.