Diplomado en Data Science
- Fecha de inicio: 6 de septiembre de 2024
- Modalidad a distancia: Google Meet y Plataforma Moodle
Presentación
El crecimiento dramático en escala y complejidad de los datos está afectando la forma como se toman las decisiones en las organizaciones. Todo lo que hacemos genera datos y cada nueva tecnología usada para capturar estos datos trae aún más posibilidades para extraer conocimiento, aprender y crear oportunidades de mejora. En ese contexto, Data Science surge como la disciplina que propone formas efectivas y éticas de usar datos, y desarrolla técnicas escalables para su análisis y transformación en conocimiento.
Conscientes de esto y del avance tecnológico y cultural en que está inmerso el Perú y de la importancia que tiene su desarrollo en nuestra sociedad, la Universidad Católica San Pablo (UCSP), a través de su Departamento de Ciencia de la Computación, presenta la quinta versión del Diplomado en Data Science.
Este diplomado tiene como objetivo brindar una sólida formación teórica y práctica en los fundamentos estadísticos, computacionales, de aprendizaje de máquina, y visualización de datos. Asimismo, se enfatiza en la construcción de modelos predictivos escalables para el análisis de datos y toma de decisiones en las organizaciones. Con la ayuda de estas habilidades, los egresados de este diplomado estarán en la capacidad de responder, basado en el análisis de datos computacional, a cuestiones importantes relacionadas al desarrollo estratégico de cualquier negocio u organización.
Objetivos
- Formación sólida en métodos modernos para el análisis de datos.
- Acceso a un mercado laboral en franco crecimiento para profesionales con estas habilidades.
- Oportunidad de crecimiento profesional dentro de su organización.
- Posibilidad de desarrollar proyectos de análisis de datos a gran escala (Big Data).
Dirigido principalmente a
Dirigido a bachilleres (Ciencia de la Computación, Ingeniería de Sistemas y las otras ingenierías, educación, matemática, estadística, minería, finanzas, administración, ventas, manufactura, áreas biomédica, entre otras) con conocimientos de lenguajes de programación, e interesados en analizar datos de forma computacional y transformarlos en información útil para una mejor toma de decisiones y por ende crear un valor añadido en las organizaciones.
Metodología
- Clases magistrales.
- Método del caso (análisis de situaciones reales).
- Investigación, trabajo en equipo y debates.
Creditaje
25 créditos.
Plan de estudios
El diplomado está estructurado en 5 módulos:
- Python para Data Science: El objetivo del curso es realizar un estudio profundo del lenguaje de programación Python en tareas de análisis de datos. En ese sentido, se estudiarán: conceptos avanzados de Python, consultas estructuradas con Hive, la Importación de datos relacionales con Sqoop, la Ingestión de datos de streaming con Flume. Asimismo, se utilizarán Dataframes y librerías de Python para la construcción de aplicaciones distribuidas de Data Science. Al final del curso, los estudiantes tendrán una visión más profunda del uso de Python para analizar y explorar grandes volúmenes de datos proveniente de casos reales.
- Aprendizaje Estadístico: El objetivo del curso es proporcionar las bases estadísticas para el modelado predictivo al abordar problemas de análisis de datos. Entre los tópicos avanzados que serán estudiados están: la simulación computacional de fenómenos aleatorios, muestreo de Monte Carlo, la generación de variables aleatorias, análisis exploratorio de datos y el reconocimiento de patrones estadísticos. Asimismo, se estudiarán ejemplos aplicados a casos reales y conjuntos de datos en varias áreas de negocios, incluyendo marketing, recursos humanos, finanzas y operaciones.
- Data Science y Big Data: Este curso tiene como objetivo presentar un panorama general de un proyecto de Data Science. Se enfocan las cinco facetas principales de una investigación usando datos: 1) colecta de datos, discusión, limpieza y sampling para obtener el conjunto de datos adecuado 2) gestión de datos para su acceso de forma rápida y confiable 3) análisis exploratorio de datos 4) predicción 5) comunicación y sumarización de resultados a través de visualización Asimismo, se introducirán tópicos avanzados de Big Data tales como: MapReduce, Hadoop, Procesamiento en memoria con Spark y Análisis distribuido. Todo esto con el fin de llevar a cabo un proyecto de análisis masivo y escalable en las organizaciones.
- Machine Learning y Deep Learning: Este curso abordará la forma de crear modelos predictivos para problemas de análisis de datos desde la perspectiva de Machine Learning y Deep Learning. El curso inicialmente cubrirá conceptos de: Regresión Multilineal, Regresión Logística y Redes Neuronales Multicapa. En una etapa posterior serán abordados problemas de clasificación y regresión usando Deep Learning. Técnicas como Word Embeddings, Language Modeling, Redes Neuronales Convolucionales y Redes Neuronales Recurrentes serán aplicados en casos de estudio para la detección de fraudes, la segmentación de clientes o la predicción del tiempo de inactividad de una máquina.
- Visualización de Datos: Este curso tiene como objetivo estudiar herramientas visuales avanzadas para interpretar datos durante el proceso de descubrimiento de conocimiento, en apoyo a la toma de decisiones. Los tópicos abordados incluyen: la creación de Chart analíticos, limpieza de datos para visualización, procesamiento de datos multidimensionales. Asimismo, se estudiarán los tipos de analíticos visuales de acuerdo a su naturaleza y criterios para seleccionar la visualización adecuada. La visualización de información, visualización científica y visual analytics serán también estudiados a profundidad. Las aplicaciones de estos gráficos estarán enfocadas en el análisis de datos multidimensionales, temporales, espaciales y de otras naturalezas, que son generadas cada minuto del día.
Cada módulo tiene 40 horas académicas y 80 horas prácticas no lectivas o de trabajo autónomo.
Proceso de evaluación
Síncrono y virtual.
Metodología de evaluación: participación en aula, evaluación constante, exposiciones, y exámenes.
Plana docente
Erick Gómez Nieto
Doctor y Magister en Ciencia de la Computación y Matemática Computacional, Universidade de Sao Paulo (Brasil). Actualmente se desempeña como docente a tiempo completo y director de la escuela profesional de Ciencia de la Computación de la Universidad Católica San Pablo (UCSP). Ha trabajado como investigador en IBM Research e investigador postdoctoral en el Center of Studies for Violence en Brasil. Es especialista y con amplia experiencia en visualización de datos, visual analytics y data science.
Daniel Alexis Gutierrez Pachas
Doctor en Ciencia de la Computación y Matemática Computacional, Universidade de Sao Paulo (Brasil). Maestría en Matemática, Universidade Federal de Juiz de Fora (Brasil). Actualmente es profesor a tiempo completo y director del departamento de Ciencia de la Computación de la Universidad Católica San Pablo. Miembro del Comité Latinoamericano de Matemática Aplicada Computacional e Industrial – CLAMACI. e IEEE-Perú. Líneas de investigación: Sistemas estocásticos, optimización, análisis numérico y Ciencia de datos.
José Eduardo Ochoa Luna
Director del Centro de Investigación e Innovación en Ciencia de la Computación (RICS). Doctor en Ciencia de la Computación, Universidade de Sao Paulo (Brasil). Maestría en Ciencia de la Computación, Universidade Federal de Mato Grosso do Sul (Brasil). Actualmente se desempeña como director del Centro de Investigación e Innovación en Ciencia de la Computación (RICS) del Departamento de Ciencia de la Computación de la UCSP. Ha desarrollado diversos proyectos de análisis de datos en social media, usando técnicas de procesamiento de lenguaje natural y Deep Learning.
Rosa Paccotacya
Magíster en Ciencia de la Computación en la Universidad Estadual de Campinas, Brasil, en el laboratorio Recod. bajo la orientación de la Prof. Sandra Ávila. Su investigación se centró en la IA explicable para el análisis del cáncer de piel, con el objetivo de comprender y validar los mecanismos internos de los modelos de caja negra para garantizar predicciones confiables. Ha sido investigadora en diferentes proyectos de investigación aplicada usando Inteligencia Artificial. Actualmente es profesora en la Universidad Nacional de San Agustín y en la Universidad Católica San Pablo. Sus intereses de investigación son: AI for Social good, Responsible AI, fairness, accountability, Explainable AI, y Computer Vision.
Gina Muñoz
Magíster en Ciencia de Computación, Universidad Católica San Pablo, Arequipa. Bachiller en Ciencia de la Computación, Universidad Católica San Pablo, Arequipa. Actualmente, es profesora en la Universidad Católica San Pablo. Áreas de investigación interés: Visual Analytics, Machine Learning, Big Data.
Johan Llamoza
Maestría en Física, Universidad Pontificia Católica del Perú. Pregrado en Física, Universidad Nacional de Ingeniería. Especialista en cálculo numérico y computación de alto rendimiento. Sus áreas de interés son ecuaciones de reacción difusión, análisis de redes, ciencia de datos.
Actualmente se desarrolla como Machine Learning Engineer y Data Scientist en Interbank desarrollando proyectos en Ciencia de Datos, con énfasis en modelos predictivos, usos de análisis de redes, procesamiento de lenguaje natural, visualización de datos, y computación en la nube (AWS) usando metodología MLOps.
* La Escuela de Postgrado UCSP podrá realizar cambios en la plana docente designada al dictado de los respectivos cursos al tratarse de casos fortuitos o de fuerza mayor.
Calendario
Calendario | |
Fecha de Inicio | 6 de septiembre de 2024 |
Fecha de Fin | 11 de abril de 2025 |
Duración | 8 meses |
Horario | Clases quincenales, los días:
|
Lugar | Google Meet y Plataforma Moodle |
* La Escuela de Postgrado se reserva el derecho de cambiar la plataforma virtual.
* La Escuela de Postgrado UCSP se reserva el derecho de cancelar o postergar el programa si no alcanza el mínimo de alumnos matriculados hasta 7 (siete) días hábiles anteriores a la fecha indicada para el inicio del programa.
Tiempo de dedicación al programa
Horas teóricas: | 200 |
Horas prácticas: | 400 |
Horas presenciales: | 0 |
Horas no presenciales: | 600 |
* Horas lectivas: 200, Horas no lectivas: 400
Inversión
- Preventa: S/ 4,500 hasta el 31 de julio de 2024 (cupos limitados).
- Precio al contado: S/ 4,970.
- Precio total: S/ 5,440 fraccionado en cuotas de:
- Cuota Inicial de S/ 680.
- 7 cuotas de S/ 680.
- Cierre de inscripciones: 30 de agosto de 2024.
- Descuentos:
- 4600 precio descuento corporativo (>=3 personas).
* Para ver las orientaciones para devolución de pagos darle clic aquí.
* Aceptamos pagos con todas las tarjetas.
* Los descuentos no son acumulables.
* Los descuentos a la comunidad UCSP, antiguos alumnos y corporativo no aplica en pronto pago.
* El monto de matrícula es de S/ 200, está incluída en todas las modalidades de pago y es única al momento de la admisión.
CERTIFICACIÓN
Diploma de Postgrado en Data Science otorgado por la Universidad Católica San Pablo.
* Diploma de postgrado con firmas emitidas en medios digitales.
* Para obtener el diploma de Postgrado, el estudiante debe acreditar el grado académico de bachiller, cumplir con 25 créditos académicos aprobados en el programa de estudios, aprobar todos los cursos con nota mayor o igual a 12 y no tener obligaciones económicas pendientes de pago con la universidad.
Requisitos de admisión
INSCRIPCIÓN
- Ficha de inscripción correctamente llenada.
- Documento de identidad:
- Peruanos: Copia simple de DNI.
- Extranjeros: Copia simple del carné de extranjería, pasaporte o documento de identidad oficial de su país de origen.
- Documento académico:
- Peruanos: Reporte SUNEDU, en caso de no contar con el reporte, copia legalizada del diploma de bachiller.
- Extranjeros: Copia legalizada del diploma de bachiller por la autoridad competente en el país de origen.
MATRÍCULA
- Compromiso de honor firmado.
- Contrato de prestación de servicios firmado.
* La información que el postulante ingrese en la inscripción es su responsabilidad, la UCSP presume su veracidad.
* Se considera apto para matrícula al postulante que cumpla con todos los requisitos de admisión.
* Si el postulante realiza el pago con anterioridad al proceso de admisión y se comprueba el no cumplimiento de algún requisito de admisión, no se considerará la matrícula.
Condiciones de permanencia y culminación
- Reglamento de Admisión para la Escuela de Postgrado: https://ucsp.edu.pe/transparencia/reglamento-de-admision-para-la-escuela-de-postgrado/
- Reglamento de Estudiantes de la Escuela de Postgrado: https://ucsp.edu.pe/transparencia/reglamento-de-estudiantes-de-la-escuela-de-postgrado/
- Reglamento General de Grados y Títulos: https://ucsp.edu.pe/archivos/transparencia/R-VICE-08-Reglamento-General-de-Grados-y-Titulos.pdf
- Disposiciones particulares de Grados y Títulos de la Escuela de Postgrado: https://ucsp.edu.pe/transparencia/disposiciones-particulares-de-grados-y-titulos-de-la-escuela-de-postgrado/
Requerimientos tecnológicos
- Contar con PC o Laptop.
- Cámara web (interna o externa) con mínimo de 720p de resolución.
- Micrófono (interno o externo).
- Acceso a internet – la velocidad recomendada es de 4 Mbps para descarga y 1 Mbps para subida o superior.
- Navegador Google Chrome o Firefox actualizado.
Solicita información
Para inscripciones comunicarse con:
Daniela Andrea Cuadros Meza
Asesora Educativa
Correo
dacuadros@ucsp.edu.pe
Para consultas sobre el contenido técnico de los temas del diplomado:
Dr. Erick Gomez Nieto
Coordinador del Diplomado
Correo
emgomez@ucsp.edu.pe
Universidad Católica San Pablo
Campus San Lázaro
Edificio newman, Primer nivel
Quinta Vivanco s/n
Urb. Campiña Paisajista,
Arequipa – Perú
Programas relacionados
Fecha de inicio: 19 de julio de 2024 Esta maestría tiene como objetivo brindar una sólida formación teórica y práctica en los fundamentos matemáticos, estadísticos, computacionales, de Inteligencia Artificial (Machine Learning) y visualización de datos, que permitan desarrollar proyectos de Ciencia de Datos que impacten positivamente en las organizaciones.