Titulación Oficial   
Calidad Europea   

Universidad Internacional del Talento: Licenciaturas y Maestrías SEP, Diplomados y Maestrías con Doble Titulación Oficial y Europea. ¡Aplica para tu Beca!

Master Data Science

Titulación Europea + Titulación propiaTitulación Europea + Titulación propia
Becas al estudioBecas al estudio
MasterclassMasterclass
Pagos congeladosPagos congelados
Clasificaciones internacionalesClasificaciones internacionales
Ficha del Programa
Área: Tecnología - Sistemas
Duración: 12 meses
Evaluación: Frecuente análisis de casos prácticos
Financiación: Pago en cuotas mensuales sin intereses
Descarga PDF

VALORACIÓN ACADÉMICA
Hoy en día, CESUMA es un centro muy prestigioso de estudios de postgrado, lo que se refleja en la firma de convenios académicos con universidades españolas y con instituciones profesionales de notable valor profesional. En el apartado de Títulación, conocerás las titulaciones que podrías obtener como alumno de un determinado programa académico.

REQUISITOS DE ACCESO
Titulo Universitario 

ACCESO A UN AÑO EN IDIOMAS
Un beneficio adicional del programa es que tienes la posibilidad de estudiar un año de alguno de los siguientes idiomas: portugués (de Brasil), francés, inglés americano, inglés británico, alemán, italiano y ruso 

SERVICIOS DE ORIENTACIÓN PROFESIONAL
Además de un título de máster, te ofrecemos la inmersión en un programa de networking y desarrollo profesional para mejorar tus oportunidades de participación en el ámbito laboral y en el crecimiento de la empresa en la que te desarrolles 

FORMA DE PAGO
Al realizar tu pago al contado, obtendrás un descuento del 8%. 
Pagos a plazo sin intereses ni intervención bancaria

ELIGE CÓMO QUIERES ESTUDIAR

modalidades de estudio

SOLICITA INFORMACION
Conoce nuestra Maestría

El aprendizaje automático y el análisis de datos es un área muy solicitada hoy en día. Hay cada vez más datos disponibles, tanto en las empresas como en la ciencia, y pueden utilizarse para extraer beneficios económicos, generar nuevos conocimientos y producir nuevos resultados. Para ello se necesitan expertos en el trabajo con datos y en la construcción de modelos complejos basados en ellos.

Con el Máster en Data Science se pretende formar a especialistas en tres áreas:

  • Científico de datos es un especialista en aprendizaje automático con conocimientos de enfoques y métodos modernos, capaz de resolver tanto tareas tradicionales pero importantes para el negocio (previsión de la demanda, predicción de la pérdida de clientes, análisis de datos de texto, segmentación, etc.) como formulaciones más modernas (construcción de sistemas de preguntas y respuestas, análisis de imágenes, generación de ejemplos realistas, etc.).
  • Machine Learning Engineer es un especialista en la interfaz de la ciencia de los datos y el desarrollo que entiende y utiliza profesionalmente las tecnologías modernas para recopilar, almacenar y analizar grandes conjuntos de datos, es capaz de escribir un código eficaz y diseñar sistemas complejos relacionados con los servicios basados en el aprendizaje automático.
  • Un investigador en Data Science es un especialista en aprendizaje automático que está familiarizado con los resultados más avanzados, entiende los fundamentos teóricos del aprendizaje automático y es capaz de comprometerse a mejorar los métodos existentes.
    Este programa está diseñado para aquellos que quieren entender la ciencia de los datos, adquirir experiencia práctica en la resolución de un gran número de problemas del mundo real y están interesados en iniciar una carrera en este campo.
Temario de la Maestría

Herramientas analíticas y nociones de Big Data

Fundamentos básicos de Big Data

  • ¿Qué es? Múltiples definiciones. Poner énfasis en que los mismos datos se convierten en big data en función de lo que se quiera hacer con ellos. Ejemplo: 100M registros, hacer una media = no big data, entrenar un modelo complejo = big data.
  • Principio de funcionamiento: MapReduce. Ejemplos clásicos para entender el concepto (contar palabras en un texto, etc.).
  • Framework Open Source para computación distribuida. Basado en el whitepaper de Google sobre MapReduce de 2004 y GFS (Google File System).
  • Concepto de Data Lake
  • Concepto ETL, ELT
  • La importancia del metadato y el data governance para la analítica.
  • Los Datalabs en un modelo de integración analítica con el Data Lake y el Gobierno del dato.

Infraestructura Big Data

Infraestructura Big Data

  • Hadoop: Almacenamiento y procesamiento distribuido
  • Herramientas de obtención de datos: Sqoop , Flume y Nifi.
  • Motores de consulta SQL:
    • Hive e impala:
      • Principio de funcionamiento.
      • Sintaxis y funciones propias de HiveQL e Impala.
  • Introducción y principio de funcionamiento.
  • Spark Core.
  • DataFrames & Spark SQL.
  • Configuración y ejecución
  • Buenas prácticas.
  • Interfaces:
    • Web (Hue,Oozie Ambari,Cloudera Manager).
  • Bases de datos NoSQL:
    • Hbase, Cassandra, MongoDB y Neo4J
  • Procesamiento de datos en Streaming: Kafka y Spark Streaming

Lenguajes de programación de un data science

Lenguajes de programación de un data science

  • Python: lenguaje vehicular del máster.
    • Principios, sintaxis y buenas prácticas. Casos típicos de utilización.
      • Declaración de variables.
      • Control de flujo (condicionales, bucles, etc.).
      • Input / Ouput (lectura y escritura de ficheros, salida por pantalla, etc.).
      • Orientación a objetos.
      • Distribución del código (módulos, paquetes y librerías).
    • Gestión de entornos: Anaconda, virtualenv.
    • Notebooks analíticos: Jupyter (Notebook, Lab). ¿Por qué utilizarlos? Casos típicos de uso.
    • Entornos de desarrollo: PyCharm, Spyder. ¿Qué ofrece un entorno de desarrollo frente a un editor de texto?
  • R: todavía es muy utilizado en estadística y por perfiles provenientes de ciencias puras, se darían algunas nociones del mismo.
    • Principios y sintaxis. Casos típicos de utilización.
    • IDE’s: RStudio.
  • Control de versiones con Git.
    • Fundamentos del control de versiones.
    • Conceptos básicos (branch, commit, pull, push, merge).
    • Metodologías de versionado: Gitflow.

Estudio y Modelado del Dato

Análisis inicial del dato

  • Análisis exploratorio.
  • Localización de dato atípico y métodos de detección de outliers.
  • Realización de estadísticos descriptivos.
  • Evaluación de la calidad del dato.
  • Tipologías de datos: categóricos, numéricos, ordinales, temporales (fechas).

El modelo de datos en tres capas.

  • Capa raw.
  • Capa Master.
  • Capa de consumo.
  • Caso Práctico: Construir un modelo en tres capas a partir del análisis anterior.

Explotación eficiente del dato mediante herramientas de BI y Data Discovery.

  • Cómo explotar un modelo de datos sin sobrecargar el sistema.
  • Herramientas de reporting. (Spotfire, PBI…).

Diseño de un Modelo Escalable

Prototipado de modelos

  • Preprocesamiento
  • Feature selection
  • Prototipado en local

Elección del juego de algoritmos óptimo

  • Aprendizaje supervisado:
    • Modelos lineales:
      • Regresión lineal.
      • Regresión logística.
      • Máquinas de Soporte Vectorial.
    • Modelos basados en árboles:
      • Árbol de decisión.
      • Random Forest.
      • Gradient Boosting.
    • Redes neuronales:
      • Principio de funcionamiento. Perceptrón.
      • Aprendizaje profundo. Se explicaría muy por encima.
    • Regresión vs. Clasificación.
  • Aprendizaje no supervisado:
    • Clusterización.
      • Jerárquica.
    • Detección de anomalías.
  • Técnicas de reducción de la dimensionalidad:
    • t-SNE.
  • Análisis de series temporales.
  • Entrenamiento:
    • Nociones básicas para entrenar un modelo correctamente:
      • División en conjunto de entrenamiento, validación y test. Concepto de Data Leakage.
      • Bias, Variance y Overfitting. Cómo detectarlos y prevenirlos. Curvas de entrenamiento.
      • Validación cruzada.
    • Optimización automática de hiperparámetros:
      • Grid Search.
      • Random Search.
      • Basados en gradiente.
    • Elección óptima del algoritmo:
      • Según la tipología de los datos.
      • Según el número de observaciones.

Según el objetivo del modelo.

Herramientas de un Data Science: Librerías

Librerías para Machine Learning

  • scikit-learn: exclusiva para Python. Librería genérica de Machine Learning. Funcionamiento en local con opción a distribuir. Idónea para prototipado.
  • XGboost: tiene API en múltiples lenguajes. Modelo de boosting muy probado y ampliamente utilizado. Open Source desarrollado para competir en Kaggle.
  • LightGBM: tiene API en múltiples lenguajes. Modelo de boosting muy probado y ampliamente utilizado. Desarrollado por Microsoft, Open Source.
  • catboost: API en múltiples lenguajes. Modelo de boosting especializado en datos con variables categóricas. Desarrollada por Yandex.
  • Spark ML: API en múltiples lenguajes, distribuida de forma nativa con el motor de Spark.
  • TensorFlow: librería de referencia para el desarrollo de redes neuronales, tiene API en múltiples lenguajes aunque la de Python es la más ampliamente usada.
  • Keras: API de Python consistente en una capa de abstracción para el manejo de las librerías de TensorFlow, CNTK y Theano a la hora de realizar modelos de redes neuronales
  • fbprophet:es una librería en Python y R que implementa un procedimiento para pronosticar datos de series temporales basados ??en un modelo aditivo en el que las tendencias no lineales se ajustan a la estacionalidad anual, semanal y diaria, más los efectos festivos
  • H2O: framework para el aprendizaje automático desarrollado por H2O.ai en Java. Tiene API en múltiples lenguajes e introduce el concepto de AutoML para la generación automática de modelos.
  • Caret: exclusiva para R. Desarrollo de modelos de aprendizaje automático en general.

Librerías para interactuar con entornos Big Data

  • impyla: cliente python para implementaciones de HiveServer2 con motores de búsqueda distribuida como Impala o Hive.
  • Apache Arrow: API para múltiples lenguajes (C++, Python, Ruby…) para almacenamiento de datos representados de forma columnar. Permite intercambiar de forma nativa datos entre diferentes plataformas (Python, R, Hadoop, Spark, etc.).
  • HdfsCLI: API de WebHDFS para Python.
  • Ibis: toolbox para conectar Python con distintos componentes de Hadoop como HDFS.
  • PySpark: API de Python para manejo de Spark.

Librerías para tratamiento de datos en memoria y cálculo numérico

  • NumPy: principal librería de álgebra lineal en Python.
  • pandas: principal herramienta para el tratamiento de datos tabulares en Python.
  • Dask: distribución de tareas analíticas en Python de forma nativa.
  • dplyr: exclusiva de R. Soporte a la manipulación de datos.
  • tidyR: exclusiva de R. Tratamiento de datos tabulares.

Visualización

  • Matplotlib: principal librería de visualización en Python.
  • folium: librería para visualización geográfica en Python.
  • seaborn: librería a alto nivel de visualización estadística basada en Matplotlib.
  • Basadas en D3: Bokeh, Plotly. Visualización general. Gráficos interactivos usando Javascript.
  • Para Big Data (visualización de millones / billones de registros): datashader.

Orquestación

  • Oozie: orquestador incluido con las distribuciones de Hadoop. Basado en configuración mediante archivos .xml.
  • Airflow: herramienta de creación de data pipelines programada en Python muy flexible. Soporte para gran cantidad de tecnologías (Spark, Hive, HDFS, etc.). Definición mediante DAGs en archivos Python.
  • Luigi: Es una alternativa a Airflow. Herramienta de creación de pipelines en batch. Lo que busca al igual que el resto de herramientas de orquestación es automatizar de forma visual los distintos procesos que se realizan en el flujo del programa.

Casos de uso y trabajo fin de master

Objetivos de la Maestría

Los objetivos fundamentales del Master en Data Science son: 

  • Conocer en profundidad una arquitectura Big Data así como todas las herramientas necesarias para el procesamiento/explotación de los datos.
  • Utilizar el valor de aplicar Big Data para obtener los mejores resultados a través la ciencia de datos (Data Science), a través de las herramientas imprescindibles de un científico de datos.
  • Adquirir conocimientos necesarios sobre el uso, análisis y la explotación de los datos.
  • Tomar decisiones fundadas en el análisis de Big Data, Analítica Web y Data Science
Salidas Profesionales de la Maestría

Los alumnos que finalizan este programa tienen la ventaja competitiva de saber que se encuentran ante uno de los sectores con mayor presente y futuro del mercado profesional. Tal es así que actualmente existe una oferta de empleo profesional que no es capaz de ser cubierta por los profesionales que existen en el sector. 

  • Científico de datos (data scientist)
  • Analista de datos
  • Analista de macrodatos
  • Responsable, jefe de proyecto o analista de sistemas de información de inteligencia de negocio
  • Emprendedor de negocios basados en el análisis de datos y en productos y servicios basados en datos
Destinatarios de la Maestría

El Máster está dirigido a:

  • Estudiantes y profesionales que quieran desarrollar o fortalecer las capacidades técnicas y analíticas necesarias para una carrera de éxito en Big Data o Data Science.
  • Perfiles que, teniendo parte de esas capacidades analíticas, deseen fortalecer sus capacidades técnicas para poder desarrollar una carrera en la industria del Big Data obteniendo una visión más completa (end to end).
  • En general, el público objetivo será personal técnico con conocimientos básicos en programación e interpretación de conceptos matemáticos.
Ayudas al Estudio

La realización de un programa de postgrado de alto nivel, como el Máster en Terapia de Lenguaje, supone un compromiso económico que a veces puede ser difícil de asumir.

CESUMA-Universidad Internacional del Talento dota una gran parte de sus recursos financieros a fin de:

  • Ofrecer a sus alumnos Programas de BECAS a las que pueden optar si reúnen los requisitos exigidos.
  • Facilitar flexibilidad en los pagos que el alumno debe afrontar, ofreciendo la posibilidad de fraccionarlos sin intereses.
  • Los Programas Masters cuentan con una financiación interna a través de la cual no cobran al alumno ningún tipo de interés ni existe intermediación bancaria.
  • Todos sus programas contemplan su abono en cómodos plazos para que el alumno no tenga que realizar importantes desembolsos. Es importante consultar al orientador académico que informará con detalle sobre las condiciones del programa seleccionado.

PAGO EN CUOTAS SIN INTERESES

CESUMA ofrece a sus alumnos flexibilidad en los pagos que deben afrontar, ofreciendo la posibilidad de fraccionarlos sin intereses y sin intermediación bancaria. Es importante consultar con el orientador académico que informará con detalle de las ayudas dependiendo del programa formativo que se seleccione.

Fernando Agudo Tarancón
Fernando Agudo Tarancón
Big Data Architect at Pragsis Bidoop & VP Product
LinkedIn

Fernando Agudo es diplomado en informática por la Universidad de Alicante especializado en las tecnologías Big Data. Hace más de 8 años empezó a trabajar como responsable técnico en el área de Big Data en una de las empresas pioneras de estas tecnologías en España: Pragsis.

Durante este periodo de tiempo se ha ido especializando en las diferentes distribuciones de Hadoop (Cloudera, Hortonworks, MapR) obteniendo múltiples certificaciones en el área de Big Data(Desarrollador Hadoop, Administrador Hadoop, Spark, etc…)

Actualmente su puesto es de “Big Data Architect at Pragsis-Bidoop” compaginando sus tareas de arquitecto con tareas de docencia: Es profesor certificado por Cloudera para impartir los cursos oficiales y ocupa el cargo de CEO en Formación Hadoop.

Entre otras de sus muchas tareas destaca la de “VP Product Manager” de AnalyticMate.

Alfieri Olcese
Alfieri Olcese
Big Data Business Consultant at PRAGSIS BIDOOP
LinkedIn

Ingeniero de Sistemas de la Universidad de Lima – Perú.  Master MBA en Dirección y Administración de Empresa en el Instituto Europeo de Estudios Empresariales. Certificado Scrum Manager-Autoridad en Estratecno. 

Sólida experiencia en empresas multinacionales líderes en Outsourcing y Tecnologías de Información. Amplia experiencia en proyectos de gestión y desarrollo BIG DATA, Business Intelligence, logísticos y en Medios de Pago Transaccional en el sector bancario y sanitario, gestión de proyectos llave en mano de Services Desk, HelpDesk, contingencias y administración de Data Center. 

Actualmente Big Data Business Consultant en Pragsis Biddop (España) y  Coordinador de proyecto de formación elearning CEUPE-Formación Hadoop (España-latinoamerica), entre otras principales empresas que ha laborado: UNISYS DEL PERÚ, BANCO CITIBANK N.A. (Perú), GRUPO SANDOVAL – DINET (Perú) , IBM DEL PERU, Formación Integral y desarollo Empresarial - FIDE (Perú).

En la docencia destaca su experiencia en  centros de extensión de tecnología en la Universidad de Ingeniería (UNI-Perú) y la Universidad Nacional Mayor de San Marcos (UNMSM-Perú). 

David Adrián Cañones Castellano
David Adrián Cañones Castellano
LEAD DATA SCIENTIST & PARTNER @ WHITEBOX
LinkedIn

Ingeniero Industrial por la Universidad de Sevilla y MBA por la Escuelade Organización Industrial con especialidad en Finanzas. Actualmente LEAD DATA SCIENTIST & PARTNER @ WHITEBOX, ha trabajado en proyectos de investigación premiados con fondos europeos del Horizonte 2020, así como para importantes clientes de los sectores editorial, financiero, telecomunicaciones y energético. Experto en aprendizaje automático y modelización estadística, contribuye activamente al desarrollo de proyectos open source relacionados con el tratamiento y análisis de datos.

Pedro Muñoz Botas
Pedro Muñoz Botas
Data Scientist - White Box
LinkedIn

Llcenciado en Ingeniería Aeronáutica y máster en Matemática Avanzada por la Universidad Politécnica de Madrid. 

Actualmente trabaja como Data Scientist en su propia empresa WhiteBox. Anteriormente ha desempeñado este rol en varias empresas de consultoría hasta dar el paso de formar su propia firma. 

Su stack tecnológico abarca varias ramas del Machine Learning entre las que se encuentran Computer Vision o NLP, teniendo especial importancia el Reinforcement Learning, área en la que es campeón de España de la AWS Deepracer. 

Entre sus clientes se encuentran importantes empresas españolas como Iberdrola o Ferrovial, así como varias startups de San Francisco.

Por su calidad y exhaustiva supervisión académica, el Centro de Estudios Superiores Maranatha (CESUMA), se distingue en el ámbito universitario de postgrado  internacional. De ahí que sea necesario realizar todas las pruebas de formación permanente con evaluación periódica para obtener el título de Máster.

Con la aprobación de cada una de las secciones del programa, el alumno recibirá un título propio del CESUMA, acreditando que ha obtenido la aprobación de todas las pruebas académicas. La obtención de este título de máster cuenta con el reconocimiento académico y profesional de la institución y del programa, lo que supone la garantía y la confirmación de que los estudios que adquieras tienen un alto prestigio en el mercado laboral actual.

Título Propio CESUMA - Universidad Internacional del Talento

Titulo Propio CESUMA - Universidad Internacional del Talento

Título CEUPE - Centro Europeo de Postgrado

Titulo Propio CEUPE - Centro Europeo de Postgrado

 

ANEXO AL PROGRAMA MÁSTER, UN CURSO DE IDIOMAS

Las necesidades del mercado laboral exigen, hoy en día, un profesional cada vez más competitivo. Es por esto que en CESUMA quisimos volcarnos de lleno en una formación en la que nuestro programa especializado, impartido en español, estuviera integrado en paralelo con el estudio del inglés de negocios para reforzar el perfil profesional de nuestros alumnos.

CESUMA ofrece una de las herramientas de aprendizaje de idiomas online más innovadoras y potentes del mercado, que permite a los estudiantes estudiar un idioma en un año, centrándose en el idioma elegido con un fuerte enfoque académico: comercial, jurídico, de marketing, conversacional, profesional, etc.

Cuando finalices el curso de idiomas elegido, podrás recibir un certificado con el número de horas, las fechas de realización y el contenido que has completado.

CURSO DE IDIOMAS 1 AÑO GRATIS

 

En caso de que se elija el inglés, la metodología de aprendizaje permite que, tras la finalización de los niveles, podrás solicitar el acceso al certificado TOEIC, que hoy en día es el certificado de negocios más reconocido a nivel internacional.

Además, conviene aprender un tercer idioma de los establecidos en el mundo profesional, como el alemán, el portugués (de Brasil), el francés, el italiano y el ruso. Para los que ya hablan inglés y quieren aprender otro idioma, en CESUMA les damos acceso a estos otros idiomas.

Si quieres saber más sobre la herramienta de aprendizaje que te vamos a ofrecer con este máster, te facilitamos este enlace, que te ayudará mucho: VIDEO DEMOSTRACION

A menos que exista una oferta promocional incluida en la admisión al programa del máster, la contratación de este módulo es independiente.

HERRAMIENTA DE NETWORKING Y DESARROLLO PROFESIONAL

Comprometidos con la preparación integral de nuestros alumnos en el mercado laboral, CEUPE es la única Escuela de Negocios que apuesta por un nuevo servicio exclusivo, capaz de fortalecer el perfil profesional de cada estudiante. Desde el Departamento de Orientación Profesional, y en colaboración con las principales agencias de colocación y outplacement, consultoras de selección de personal y coaches especializados en la rama empresarial, se ha desarrollado una Herramienta con la que, a lo largo de su formación, el alumno podrá contar para mejorar su desarrollo profesional y empleabilidad.

CESUMA, comprometida con la preparación integral de nuestros alumnos para el mercado laboral, es la única universidad de postgrado que ofrece novedosos servicios exclusivos que pueden potenciar el desarrollo profesional de cada alumno. El departamento de orientación profesional y en colaboración con las principales agencias de empleo y recolocación, consultores de selección de personal y formadores empresariales especializados, han desarrollado una Herramienta, a través de la cual el estudiante puede aspirar a mejorar su desarrollo profesional y su empleabilidad a lo largo de sus estudios.

CURSO HERRAMIENTA DE NETWORKING Y DESARROLLO PROFESIONAL

Dicha herramienta está diseñada para mejorar y profesionalizar al estudiante en tres áreas principales:

  • Búsqueda activa de empleo, en la que como alumno tendrás acceso a las principales bolsas de trabajo internacionales.
  • Modificación profesional con herramientas para desarrollar una estrategia directa y eficaz que gira en torno a la preparación del CV, las entrevistas y las dinámicas de grupo o networking.
  • El desarrollo de la carrera profesional, en el que podrás utilizar el aprendizaje interactivo vinculado al coaching profesional activo o al employer branding para perfiles con mayor experiencia profesional. 

Dicha herramienta está integrada en el campus virtual, en el que su uso resulta sencillo para nuestros estudiantes. Elaborado y estructurado intuitivamente por un equipo de consultores profesionales, garantiza una formación constantemente actualizada para un aprendizaje flexible y eficaz. Como apoyo encontrarás tutoriales, foros, vídeos, bases de datos, documentación digital e impresa, conferencias en línea y grabadas, así como otros apoyos para el trabajo. VIDEO INFORMATIVO

SOLICITA INFORMACIÓN
He leído y acepto el aviso legal

Maestrías que te pueden interesar

Duración: 12 meses | 60 Créditos
Titulación: Titulación Profesional Europea
Sector profesional: Tecnología
Professional Certificate: Big Data Analytics Expert
Duración: 12 meses | 60 Créditos
Titulación: Titulación Profesional Europea
Sector profesional: Tecnología
Professional Certificate: Expert in Information and Security Systems
Duración: 6 meses | 15 Créditos
Titulación: Titulación Profesional
Sector profesional: Tecnología
Professional Certificate: Digital Information Expert

logo sep secretaria de educación pública
UNITED NATIONS GLOBAL COMPACT
logo sep
logo unesco
1