LLM desde cero (Large Language Model desde cero)

Presentación

Virtual.

Objetivos

Proveer a los alumnos conocimientos teórico, técnico y de implementación de las arquitecturas basadas en la red neuronal Transformer. Así también como proveer habilidades de pre-procesamiento de datos, construcción de arquitecturas de modelos de lenguaje basadas en Transformer tales como BERT y GPT (el LLM más popular hoy en día).

Dirigido a

Publico en general relacionado a las carreras de ciencia de la computación, ingeniería de sistemas y afines.

Contenido

Modelo Transformer

    • Revisión de redes neuronales.
    • Introducción a los Word Embeddings.
    • Fundamentos teóricos del modelo Transformer.
    • Codificación.
    • Aplicaciones.

Modelo BERT (Bidirectional Encoder Representations from Transformers)

    • Introducción.
    • Mecanismo de atención de BERT.
    • Entrenamiento BERT.
    • BERT embeddings.

Modelo GPT (Generative Pretrained Transformer)

    • Introducción.
    • Pre-entrenamiento GPT.
    • Fine-tuning GPT.
    • Aplicaciones avanzadas con GPT.

Expositores

Dr.Julio Omar Santisteban Pablo

Doctor en Ciencia de la Computación por la Universidad Nacional de San Agustín de Arequipa. MSc. en Internetworking por la University of Technology Sydney, Australia. GradCert. en Internetworking por la University of Technology, Australia. Dip. en Information Technology – Applications Programming por el South Western Sydney Institute, Australia. Se incorporó a la Universidad Católica San Pablo en el 2010. Con más 10 años de experiencia a laboral como Senior Analyst Programmer en Qantas Airways Australia.


Rosa Paccotacya Yanque

Magíster en Ciencia de la Computación en la Universidad Estadual de Campinas, Brasil, en el laboratorio Recod.AI. Actualmente es profesora en la Universidad Nacional de San Agustín y en la Universidad Católica San Pablo.


Julissa Giuliana Villanueva Llerena

Doctora y Magíster en Ciencia de la Computación de la Universidad de Sao Paulo (Brasil). Actualmente, ejerce como profesora en la Universidad Católica San Pablo y desarrolla soluciones innovadoras mediante inteligencia artificial. Además, tiene experiencia en proyectos de aprendizaje supervisado, data science, modelos probabilísticos y procesamiento del lenguaje natural.

Metodología

  • El dictado de los cursos será de forma virtual síncrona. La asistencia a las clases virtuales es de carácter obligatorio.
  • La inasistencia a clases por curso tiene máximo del 30%, alumnos con inasistencias superiores al 30% en un curso reprobaran de forma automática.
  • Las grabaciones estarán disponibles para la revisión por los alumnos.
  • La participación de los alumnos es necesaria para lograr los objetivos de aprendizaje.

Requisitos de admisión

  • Ficha de datos (personales, profesional, académicos, entre otros).
  • Comprobante de pago.
  • Conocimiento de programación en python.

Calendario

Calendario
Fecha de inicio 22 de agosto de 2024
Fecha de fin 10 de octubre de 2024
Horario Jueves y viernes de 19:00 a 21:15h
Duración 15 sesiones
Horas académicas 45 horas académicas
Lugar Google Meet

Inversión

  • Precio: S/ 440.00
  • Pronto pago: S/.400.00 hasta el 12 de agosto de 2024
  • Descuentos:
    • 5% de descuento corporativo (2 personas).
    • 10% de descuento corporativo (3 personas a más).
    • 20% de descuento para alumnos y exalumnos UCSP.
  • Cierre de Inscripciones: 20 de agosto de 2024.

Certificación

Certificado virtual otorgado por la Dirección de Formación Continua de la Escuela de Postgrado y el Departamento de Ciencia de la Computación.

Organiza