Titulación Oficial   
Calidad Europea   

Universidad Internacional del Talento: Licenciaturas y Maestrías SEP, Diplomados y Maestrías con Doble Titulación Oficial y Europea. ¡Aplica para tu Beca!

Presentación de Master Data Science

El aprendizaje automático y el análisis de datos es un área muy solicitada hoy en día. Hay cada vez más datos disponibles, tanto en las empresas como en la ciencia, y pueden utilizarse para extraer beneficios económicos, generar nuevos conocimientos y producir nuevos resultados. Para ello se necesitan expertos en el trabajo con datos y en la construcción de modelos complejos basados en ellos.

Con el Máster en Data Science se pretende formar a especialistas en tres áreas:

  • Científico de datos es un especialista en aprendizaje automático con conocimientos de enfoques y métodos modernos, capaz de resolver tanto tareas tradicionales pero importantes para el negocio (previsión de la demanda, predicción de la pérdida de clientes, análisis de datos de texto, segmentación, etc.) como formulaciones más modernas (construcción de sistemas de preguntas y respuestas, análisis de imágenes, generación de ejemplos realistas, etc.).
  • Machine Learning Engineer es un especialista en la interfaz de la ciencia de los datos y el desarrollo que entiende y utiliza profesionalmente las tecnologías modernas para recopilar, almacenar y analizar grandes conjuntos de datos, es capaz de escribir un código eficaz y diseñar sistemas complejos relacionados con los servicios basados en el aprendizaje automático.
  • Un investigador en Data Science es un especialista en aprendizaje automático que está familiarizado con los resultados más avanzados, entiende los fundamentos teóricos del aprendizaje automático y es capaz de comprometerse a mejorar los métodos existentes.
    Este programa está diseñado para aquellos que quieren entender la ciencia de los datos, adquirir experiencia práctica en la resolución de un gran número de problemas del mundo real y están interesados en iniciar una carrera en este campo.
Leer más
MÁS INFORMACIÓN

Temario


Herramientas analíticas y nociones de Big Data

Fundamentos básicos de Big Data

  • ¿Qué es? Múltiples definiciones. Poner énfasis en que los mismos datos se convierten en big data en función de lo que se quiera hacer con ellos. Ejemplo: 100M registros, hacer una media = no big data, entrenar un modelo complejo = big data.
  • Principio de funcionamiento: MapReduce. Ejemplos clásicos para entender el concepto (contar palabras en un texto, etc.).
  • Framework Open Source para computación distribuida. Basado en el whitepaper de Google sobre MapReduce de 2004 y GFS (Google File System).
  • Concepto de Data Lake
  • Concepto ETL, ELT
  • La importancia del metadato y el data governance para la analítica.
  • Los Datalabs en un modelo de integración analítica con el Data Lake y el Gobierno del dato.

Infraestructura Big Data

Infraestructura Big Data

  • Hadoop: Almacenamiento y procesamiento distribuido
  • Herramientas de obtención de datos: Sqoop , Flume y Nifi.
  • Motores de consulta SQL:
    • Hive e impala:
      • Principio de funcionamiento.
      • Sintaxis y funciones propias de HiveQL e Impala.
  • Introducción y principio de funcionamiento.
  • Spark Core.
  • DataFrames & Spark SQL.
  • Configuración y ejecución
  • Buenas prácticas.
  • Interfaces:
    • Web (Hue,Oozie Ambari,Cloudera Manager).
  • Bases de datos NoSQL:
    • Hbase, Cassandra, MongoDB y Neo4J
  • Procesamiento de datos en Streaming: Kafka y Spark Streaming

Lenguajes de programación de un data science

Lenguajes de programación de un data science

  • Python: lenguaje vehicular del máster.
    • Principios, sintaxis y buenas prácticas. Casos típicos de utilización.
      • Declaración de variables.
      • Control de flujo (condicionales, bucles, etc.).
      • Input / Ouput (lectura y escritura de ficheros, salida por pantalla, etc.).
      • Orientación a objetos.
      • Distribución del código (módulos, paquetes y librerías).
    • Gestión de entornos: Anaconda, virtualenv.
    • Notebooks analíticos: Jupyter (Notebook, Lab). ¿Por qué utilizarlos? Casos típicos de uso.
    • Entornos de desarrollo: PyCharm, Spyder. ¿Qué ofrece un entorno de desarrollo frente a un editor de texto?
  • R: todavía es muy utilizado en estadística y por perfiles provenientes de ciencias puras, se darían algunas nociones del mismo.
    • Principios y sintaxis. Casos típicos de utilización.
    • IDE’s: RStudio.
  • Control de versiones con Git.
    • Fundamentos del control de versiones.
    • Conceptos básicos (branch, commit, pull, push, merge).
    • Metodologías de versionado: Gitflow.

Estudio y Modelado del Dato

Análisis inicial del dato

  • Análisis exploratorio.
  • Localización de dato atípico y métodos de detección de outliers.
  • Realización de estadísticos descriptivos.
  • Evaluación de la calidad del dato.
  • Tipologías de datos: categóricos, numéricos, ordinales, temporales (fechas).

El modelo de datos en tres capas.

  • Capa raw.
  • Capa Master.
  • Capa de consumo.
  • Caso Práctico: Construir un modelo en tres capas a partir del análisis anterior.

Explotación eficiente del dato mediante herramientas de BI y Data Discovery.

  • Cómo explotar un modelo de datos sin sobrecargar el sistema.
  • Herramientas de reporting. (Spotfire, PBI…).

Diseño de un Modelo Escalable

Prototipado de modelos

  • Preprocesamiento
  • Feature selection
  • Prototipado en local

Elección del juego de algoritmos óptimo

  • Aprendizaje supervisado:
    • Modelos lineales:
      • Regresión lineal.
      • Regresión logística.
      • Máquinas de Soporte Vectorial.
    • Modelos basados en árboles:
      • Árbol de decisión.
      • Random Forest.
      • Gradient Boosting.
    • Redes neuronales:
      • Principio de funcionamiento. Perceptrón.
      • Aprendizaje profundo. Se explicaría muy por encima.
    • Regresión vs. Clasificación.
  • Aprendizaje no supervisado:
    • Clusterización.
      • Jerárquica.
    • Detección de anomalías.
  • Técnicas de reducción de la dimensionalidad:
    • t-SNE.
  • Análisis de series temporales.
  • Entrenamiento:
    • Nociones básicas para entrenar un modelo correctamente:
      • División en conjunto de entrenamiento, validación y test. Concepto de Data Leakage.
      • Bias, Variance y Overfitting. Cómo detectarlos y prevenirlos. Curvas de entrenamiento.
      • Validación cruzada.
    • Optimización automática de hiperparámetros:
      • Grid Search.
      • Random Search.
      • Basados en gradiente.
    • Elección óptima del algoritmo:
      • Según la tipología de los datos.
      • Según el número de observaciones.

Según el objetivo del modelo.

Herramientas de un Data Science: Librerías

Librerías para Machine Learning

  • scikit-learn: exclusiva para Python. Librería genérica de Machine Learning. Funcionamiento en local con opción a distribuir. Idónea para prototipado.
  • XGboost: tiene API en múltiples lenguajes. Modelo de boosting muy probado y ampliamente utilizado. Open Source desarrollado para competir en Kaggle.
  • LightGBM: tiene API en múltiples lenguajes. Modelo de boosting muy probado y ampliamente utilizado. Desarrollado por Microsoft, Open Source.
  • catboost: API en múltiples lenguajes. Modelo de boosting especializado en datos con variables categóricas. Desarrollada por Yandex.
  • Spark ML: API en múltiples lenguajes, distribuida de forma nativa con el motor de Spark.
  • TensorFlow: librería de referencia para el desarrollo de redes neuronales, tiene API en múltiples lenguajes aunque la de Python es la más ampliamente usada.
  • Keras: API de Python consistente en una capa de abstracción para el manejo de las librerías de TensorFlow, CNTK y Theano a la hora de realizar modelos de redes neuronales
  • fbprophet:es una librería en Python y R que implementa un procedimiento para pronosticar datos de series temporales basados ??en un modelo aditivo en el que las tendencias no lineales se ajustan a la estacionalidad anual, semanal y diaria, más los efectos festivos
  • H2O: framework para el aprendizaje automático desarrollado por H2O.ai en Java. Tiene API en múltiples lenguajes e introduce el concepto de AutoML para la generación automática de modelos.
  • Caret: exclusiva para R. Desarrollo de modelos de aprendizaje automático en general.

Librerías para interactuar con entornos Big Data

  • impyla: cliente python para implementaciones de HiveServer2 con motores de búsqueda distribuida como Impala o Hive.
  • Apache Arrow: API para múltiples lenguajes (C++, Python, Ruby…) para almacenamiento de datos representados de forma columnar. Permite intercambiar de forma nativa datos entre diferentes plataformas (Python, R, Hadoop, Spark, etc.).
  • HdfsCLI: API de WebHDFS para Python.
  • Ibis: toolbox para conectar Python con distintos componentes de Hadoop como HDFS.
  • PySpark: API de Python para manejo de Spark.

Librerías para tratamiento de datos en memoria y cálculo numérico

  • NumPy: principal librería de álgebra lineal en Python.
  • pandas: principal herramienta para el tratamiento de datos tabulares en Python.
  • Dask: distribución de tareas analíticas en Python de forma nativa.
  • dplyr: exclusiva de R. Soporte a la manipulación de datos.
  • tidyR: exclusiva de R. Tratamiento de datos tabulares.

Visualización

  • Matplotlib: principal librería de visualización en Python.
  • folium: librería para visualización geográfica en Python.
  • seaborn: librería a alto nivel de visualización estadística basada en Matplotlib.
  • Basadas en D3: Bokeh, Plotly. Visualización general. Gráficos interactivos usando Javascript.
  • Para Big Data (visualización de millones / billones de registros): datashader.

Orquestación

  • Oozie: orquestador incluido con las distribuciones de Hadoop. Basado en configuración mediante archivos .xml.
  • Airflow: herramienta de creación de data pipelines programada en Python muy flexible. Soporte para gran cantidad de tecnologías (Spark, Hive, HDFS, etc.). Definición mediante DAGs en archivos Python.
  • Luigi: Es una alternativa a Airflow. Herramienta de creación de pipelines en batch. Lo que busca al igual que el resto de herramientas de orquestación es automatizar de forma visual los distintos procesos que se realizan en el flujo del programa.

Casos de uso y trabajo fin de master

Profesorado de Master Data Science

Contamos con un claustro de alto nivel académico y directivo, con más de 15 años de experiencia docente y profesional


Pedro Muñoz Botas

Pedro Muñoz Botas

LinkedIn
David Adrián Cañones Castellano

David Adrián Cañones Castellano

LinkedIn
Fernando Agudo Tarancón

Fernando Agudo Tarancón

LinkedIn
Alfieri Olcese

Alfieri Olcese

LinkedIn

Titulación de Master Data Science


Titulaciones Académicas

Por su calidad y exhaustiva supervisión académica, el Centro de Estudios Superiores Maranatha (CESUMA), se distingue en el ámbito universitario de postgrado  internacional. De ahí que sea necesario realizar todas las pruebas de formación permanente con evaluación periódica para obtener el título de Máster.

Con la aprobación de cada una de las secciones del programa, el alumno recibirá un título propio del CESUMA, acreditando que ha obtenido la aprobación de todas las pruebas académicas. La obtención de este título de máster cuenta con el reconocimiento académico y profesional de la institución y del programa, lo que supone la garantía y la confirmación de que los estudios que adquieras tienen un alto prestigio en el mercado laboral actual.

Título Propio CESUMA - Universidad Internacional del Talento

Titulo Propio CESUMA - Universidad Internacional del Talento

Título CEUPE - Centro Europeo de Postgrado

Titulo Propio CEUPE - Centro Europeo de Postgrado

 

MÁS INFORMACIÓN

Objetivos del Máster


Los objetivos fundamentales del Master en Data Science son: 

  • Conocer en profundidad una arquitectura Big Data así como todas las herramientas necesarias para el procesamiento/explotación de los datos.
  • Utilizar el valor de aplicar Big Data para obtener los mejores resultados a través la ciencia de datos (Data Science), a través de las herramientas imprescindibles de un científico de datos.
  • Adquirir conocimientos necesarios sobre el uso, análisis y la explotación de los datos.
  • Tomar decisiones fundadas en el análisis de Big Data, Analítica Web y Data Science

Los alumnos que finalizan este programa tienen la ventaja competitiva de saber que se encuentran ante uno de los sectores con mayor presente y futuro del mercado profesional. Tal es así que actualmente existe una oferta de empleo profesional que no es capaz de ser cubierta por los profesionales que existen en el sector. 

  • Científico de datos (data scientist)
  • Analista de datos
  • Analista de macrodatos
  • Responsable, jefe de proyecto o analista de sistemas de información de inteligencia de negocio
  • Emprendedor de negocios basados en el análisis de datos y en productos y servicios basados en datos

El Máster está dirigido a:

  • Estudiantes y profesionales que quieran desarrollar o fortalecer las capacidades técnicas y analíticas necesarias para una carrera de éxito en Big Data o Data Science.
  • Perfiles que, teniendo parte de esas capacidades analíticas, deseen fortalecer sus capacidades técnicas para poder desarrollar una carrera en la industria del Big Data obteniendo una visión más completa (end to end).
  • En general, el público objetivo será personal técnico con conocimientos básicos en programación e interpretación de conceptos matemáticos.

ANEXO AL PROGRAMA MÁSTER, UN CURSO DE IDIOMAS

Las necesidades del mercado laboral exigen, hoy en día, un profesional cada vez más competitivo. Es por esto que en CESUMA quisimos volcarnos de lleno en una formación en la que nuestro programa especializado, impartido en español, estuviera integrado en paralelo con el estudio del inglés de negocios para reforzar el perfil profesional de nuestros alumnos.

CESUMA ofrece una de las herramientas de aprendizaje de idiomas online más innovadoras y potentes del mercado, que permite a los estudiantes estudiar un idioma en un año, centrándose en el idioma elegido con un fuerte enfoque académico: comercial, jurídico, de marketing, conversacional, profesional, etc.

Cuando finalices el curso de idiomas elegido, podrás recibir un certificado con el número de horas, las fechas de realización y el contenido que has completado.

CURSO DE IDIOMAS 1 AÑO GRATIS

 

En caso de que se elija el inglés, la metodología de aprendizaje permite que, tras la finalización de los niveles, podrás solicitar el acceso al certificado TOEIC, que hoy en día es el certificado de negocios más reconocido a nivel internacional.

Además, conviene aprender un tercer idioma de los establecidos en el mundo profesional, como el alemán, el portugués (de Brasil), el francés, el italiano y el ruso. Para los que ya hablan inglés y quieren aprender otro idioma, en CESUMA les damos acceso a estos otros idiomas.

Si quieres saber más sobre la herramienta de aprendizaje que te vamos a ofrecer con este máster, te facilitamos este enlace, que te ayudará mucho: VIDEO DEMOSTRACION

A menos que exista una oferta promocional incluida en la admisión al programa del máster, la contratación de este módulo es independiente.

HERRAMIENTA DE NETWORKING Y DESARROLLO PROFESIONAL

Comprometidos con la preparación integral de nuestros alumnos en el mercado laboral, CEUPE es la única Escuela de Negocios que apuesta por un nuevo servicio exclusivo, capaz de fortalecer el perfil profesional de cada estudiante. Desde el Departamento de Orientación Profesional, y en colaboración con las principales agencias de colocación y outplacement, consultoras de selección de personal y coaches especializados en la rama empresarial, se ha desarrollado una Herramienta con la que, a lo largo de su formación, el alumno podrá contar para mejorar su desarrollo profesional y empleabilidad.

CESUMA, comprometida con la preparación integral de nuestros alumnos para el mercado laboral, es la única universidad de postgrado que ofrece novedosos servicios exclusivos que pueden potenciar el desarrollo profesional de cada alumno. El departamento de orientación profesional y en colaboración con las principales agencias de empleo y recolocación, consultores de selección de personal y formadores empresariales especializados, han desarrollado una Herramienta, a través de la cual el estudiante puede aspirar a mejorar su desarrollo profesional y su empleabilidad a lo largo de sus estudios.

CURSO HERRAMIENTA DE NETWORKING Y DESARROLLO PROFESIONAL

Dicha herramienta está diseñada para mejorar y profesionalizar al estudiante en tres áreas principales:

  • Búsqueda activa de empleo, en la que como alumno tendrás acceso a las principales bolsas de trabajo internacionales.
  • Modificación profesional con herramientas para desarrollar una estrategia directa y eficaz que gira en torno a la preparación del CV, las entrevistas y las dinámicas de grupo o networking.
  • El desarrollo de la carrera profesional, en el que podrás utilizar el aprendizaje interactivo vinculado al coaching profesional activo o al employer branding para perfiles con mayor experiencia profesional. 

Dicha herramienta está integrada en el campus virtual, en el que su uso resulta sencillo para nuestros estudiantes. Elaborado y estructurado intuitivamente por un equipo de consultores profesionales, garantiza una formación constantemente actualizada para un aprendizaje flexible y eficaz. Como apoyo encontrarás tutoriales, foros, vídeos, bases de datos, documentación digital e impresa, conferencias en línea y grabadas, así como otros apoyos para el trabajo. VIDEO INFORMATIVO

Empleabilidad


Director/a Departamento de Datos
Director/a Departamento de Datos
Analista de Datos
Analista de Datos
Jefe/a de Proyecto Inteligencia de Negocio
Jefe/a de Proyecto Inteligencia de Negocio
Adjunto/a a dirección tecnológica
Adjunto/a a dirección tecnológica
Emprendedor/a Servicios de Datos Externos
Emprendedor/a Servicios de Datos Externos
Auditor/a análisis de Macrodatos
Auditor/a análisis de Macrodatos
Datos de interés

Datos de Interés


Requisitos de Acceso
REQUISITOS DE ACCESO
Titulación Universitaria.
Acceso a un años en idiomas
ACCESO A UN AÑO EN IDIOMAS
1 año a elegir entre 7 idiomas.
Servicio de Orientación Profesional
SERVICIO DE ORIENTACIÓN PROFESIONAL
Inmersión en programa de networking y desarrollo profesional.
Formas de Pago
FORMAS
DE PAGO
Paga desde cualquier plataforma con 0% de interés. Becas de hasta el 65%.
Programas con titulación oficial universitaria
PROGRAMAS CON TITULACIÓN OFICIAL UNIVERSITARIA
Títulos con Reconocimiento de Validez Oficial de Estudios (RVOE).

Servicios Académicos


Campus Online Interactivo
CAMPUS ONLINE INTERACTIVO
24x7 Aprendizaje interactivo
Comunidad Cesuma
COMUNIDAD CESUMA
+38 países participantes
Master Class
MASTER
CLASS
Profesionales en activo desde tu casa
Open Class
OPEN
CLASS
+ de 30 especializaciones durante todo el año
Biblioteca Digital
BIBLIOTECA DIGITAL
+ 100.000 ejemplares de todas las disciplinas
Atención al Alumno
ATENCIÓN AL ALUMNO
Coordinadores y Coaches académicos
Blog Cesuma
BLOG
CESUMA
+10.000 contenidos en abierto
Videoteca Virtual
VIDEOTECA VIRTUAL
+1000 videos académicos guionizados

Metodología


Innovadora
Innovadora
Con los formatos de e-learning más innovadores de la educación online global
Abierta
Abierta
Abierta a un concepto de comunicación integral y tridireccional Tutor+Alumno+Coordinador
Adaptada
Adaptada
Pensada para compatibilizar el aprendizaje donde, cuando y como quieras con tus otras responsabilidades
Sencilla e Intuitiva
Sencilla e Intuitiva
Un modelo académico donde te acompañaremos en todo momento para que estudiar no sea a un problema
Práctica
Práctica
Tutores profesionales, casos prácticos reales, propuestas orientadas hacia el mercado profesional
MÁS INFORMACIÓN

Ayudas al Estudio


La realización de un programa de postgrado de alto nivel, como el Máster en Terapia de Lenguaje, supone un compromiso económico que a veces puede ser difícil de asumir.

CESUMA-Universidad Internacional del Talento dota una gran parte de sus recursos financieros a fin de:

  • Ofrecer a sus alumnos Programas de BECAS a las que pueden optar si reúnen los requisitos exigidos.
  • Facilitar flexibilidad en los pagos que el alumno debe afrontar, ofreciendo la posibilidad de fraccionarlos sin intereses.
  • Los Programas Masters cuentan con una financiación interna a través de la cual no cobran al alumno ningún tipo de interés ni existe intermediación bancaria.
  • Todos sus programas contemplan su abono en cómodos plazos para que el alumno no tenga que realizar importantes desembolsos. Es importante consultar al orientador académico que informará con detalle sobre las condiciones del programa seleccionado.

PAGO EN CUOTAS SIN INTERESES

CESUMA ofrece a sus alumnos flexibilidad en los pagos que deben afrontar, ofreciendo la posibilidad de fraccionarlos sin intereses y sin intermediación bancaria. Es importante consultar con el orientador académico que informará con detalle de las ayudas dependiendo del programa formativo que se seleccione.

MÁS INFORMACIÓN

Programas que te pueden interesar


Diplomado en Business Intelligence
Duración: 6 meses | 15 ECTS
Maestría en Inteligencia Artificial y Educación Digital
Duración: 4 cuatrimestres: 1 año 4 meses
Maestría en Dirección y Gestión Educativa
Duración: 4 cuatrimestres: 1 año 4 meses | 75 ECTS
1