RESPONSABLE EXPERTO DE DATA

Gratis

TEMARIO

MÓDULO 1: INTRODUCCIÓN: LA IMPORTANCIA DEL DATO (6 horas)

  1. CONCIENCIACIÓN SOBRE LA IMPORTANCIA DE LA CIENCIA DEL DATO EN TODOS LOS SECTORES Y LOS NEGOCIOS.
  2. CONOCIMIENTO DE MODELOS DE NEGOCIO BASADOS EN DATOS.
    • Nuevos modelos de negocio en torno al dato.
    • Tipología de datos y cómo se obtienen.
    • Maneras de rentabilizar el dato.
    • Data Business Model Canvas.
  3. ADQUISICIÓN DE CONOCIMIENTOS EN BIG DATA E INTELIGENCIA ARTIFICIAL (IA).
    • Estado actual.
    • Posible evolución futura.
  4. DOMINIO DE CONCEPTOS BÁSICOS.
    • Qué es Big Data.
    • Qué es Machine Learning.
    • Qué es Deep Learning.
  5. CONCIENCIACIÓN SOBRE EL PODER DE LOS DATOS EN LA TOMA DE DECISIONES Y EN MODELOS DE NEGOCIO.
  6. VISIÓN TRANSVERSAL DE CÓMO DATA SCIENCE IMPULSA LAS DIFERENTES ÁREAS DE LA ORGANIZACIÓN.

 

MÓDULO 2: NOCIONES INICIALES DE PYTHON, DATA ENGINEERING Y ESTADÍSTICA (24 horas)

  1. DESARROLLO DE LOS FUNDAMENTOS DE BIG DATA.
    • Qué es Big Data.
    • Perfiles técnicos: Data Analyst, Engineer, Architect, QA…
    • El proceso de construir un proyecto de Big Data.
    • Arquitecturas de Big Data.
    • Claves del éxito del Big Data.
  2. IDENTIFICACIÓN DE LOS FUNDAMENTOS DEL MACHINE LEARNING.
    • Introducción al Machine Learning: Datos, algoritmos, modelos, producción.
    • Aproximación a los algoritmos: clasificación, predicción y clustering.
    • Creación de modelos de Machine Learning.
    • Claves del aprendizaje automático.
    • Productivización de modelos.
  3. ANÁLISIS DE LOS FUNDAMENTOS DE LA INTELIGENCIA ARTIFICIAL (IA): VISIÓN Y NLP.
    • Introducción al Deep Learning y sus aplicaciones.
    • Redes neuronales y su entrenamiento.
    • Data Science en Computer Vision y NLP.
  4. CONOCIMIENTOS AVANZADOS EN PYTHON CRASH COURSE.
    • Uso de Pycharm y notebooks.
    • Sintaxis del lenguaje: bucles, variables, librerías y funciones.
    • Programación orientada a objetos (POO).
  5. APROXIMACIÓN A LA ARQUITECTURA DE INFORMACIÓN Y SQL.
    • Arquitectura de datos: modelo relacional tradicional, estrella y copo de nieve.
    • Bases de la normalización.
    • Definiciones esenciales: base de datos, tablas, vistas, claves.
  6. CRASH COURSE DE PYTHON PARA DATA ENGINEERS: SQL Y DATAFRAMES.
    • Consulta, cruce, inserción y borrado de datos.
    • Uso de DataFrames.
  7. DIFERENCIACIÓN ENTRE ETL/ELT Y PREPROCESO DE DATOS.
    • ETL vs ELT.
    • Pipelines de datos y workflow.
    • Automatización de procesos.
  8. APLICACIÓN DEL ANÁLISIS EXPLORATORIO.
    • Objetivos y naturaleza iterativa del análisis exploratorio.
  9. UTILIZACIÓN DE HERRAMIENTAS Y LIBRERÍAS DE VISUALIZACIÓN.
    • Análisis descriptivo gráfico y basado en estadísticos.
  10. REALIZACIÓN DE ANÁLISIS UNIVARIANTE Y MULTIVARIANTE.
  11. CONOCIMIENTO DE LA ESTADÍSTICA DESCRIPTIVA.
  • Media, mediana, varianza, desviación, sesgos y homogeneidad.
  1. APROXIMACIÓN BREVE AL ÁLGEBRA LINEAL.
  • Operaciones con matrices y propiedades.
  1. ANÁLISIS DE CORRELACIÓN DE VARIABLES.
  2. DEDUCCIÓN ESTADÍSTICA Y CONTRASTE DE HIPÓTESIS.

 

MÓDULO 3: CONOCIMIENTO AVANZADO DE MACHINE LEARNING & ARTIFICIAL INTELLIGENCE (100 horas)

  1. APROXIMACIÓN A LA MODELIZACIÓN.
  2. IDENTIFICACIÓN DE MODELOS DE REGRESIÓN.
  3. CLASIFICACIÓN DE MODELOS DE ÁRBOLES.
  4. ALGORITMOS ALTERNATIVOS DE CLASIFICACIÓN.
  5. EAGER Y LAZY CLASSIFIERS.
  6. UTILIZACIÓN DE CLUSTERING.
  7. APROXIMACIÓN AL MÉTODO CIENTÍFICO.
  8. EVALUACIÓN Y OPTIMIZACIÓN DE MODELOS.
  9. CREACIÓN DE INGENIERÍA DE VARIABLES.
  10. ENSAMBLADO DE MODELOS.
  11. GESTIÓN DEL CICLO DE VIDA DE LOS MODELOS.
  12. INTERPRETABILIDAD.
  13. MODELOS HEURÍSTICOS DE OPTIMIZACIÓN.
  14. ALGORITMOS GENÉTICOS.
  15. UTILIZACIÓN DE SERIES TEMPORALES Y FORECASTING.
  16. GESTIÓN DE PROYECTOS DE DATA SCIENCE.

 

MÓDULO 4: APLICACIONES DEL DEEP LEARNING (36 horas)

  1. APROXIMACIÓN A REDES NEURONALES ARTIFICIALES (ANN).
  2. CAMPOS DE APLICACIÓN DE ANN.
  3. SHALLOW & DEEP NEURAL NETWORKS. INTRODUCCIÓN A CNN.
  4. DISEÑO DE REDES NEURONALES: ANN, CNN Y RNN.

 

MÓDULO 5: ENTORNOS BIG DATA & CLOUD (14 horas)

  1. PRINCIPIOS DE COMPUTACIÓN DISTRIBUIDA.
  2. DATAFRAMES Y DATA PIPELINES EN SPARK.
  3. MODELOS DE MACHINE LEARNING EN SPARK.
  4. DESPLIEGUE DE PIPELINES EN SPARK.
  5. MODELOS CON PROVEEDORES CLOUD MACHINE LEARNING.

 

MÓDULO 6: VISUALIZACIÓN DE LOS DATOS (30 horas)

  1. STORYTELLING A TRAVÉS DE LOS DATOS.
  2. USO DEL STORYTELLING CON DATOS.
  3. BUSINESS INTELLIGENCE Y DATA VISUALIZATION.
  4. HERRAMIENTA POWERBI.
  5. HERRAMIENTA TABLEAU.

 

MÓDULO 7: HABILIDADES Y COMPETENCIAS DE GESTIÓN, PERSONALES Y SOCIALES PARA EL ENTORNO DIGITAL (30 horas)

  1. IMPULSO DE HABILIDADES DIGITALES.
  2. COMPETENCIAS PARA EL NUEVO ENTORNO DIGITAL.
  3. HERRAMIENTAS IMPRESCINDIBLES PARA EL ENTORNO DIGITAL.
  4. TRABAJO EN EQUIPO Y PRODUCTIVIDAD EN REMOTO.
  5. LIDERAZGO PARTICIPATIVO Y GESTIÓN DEL CAMBIO.
  6. COMUNICACIÓN Y NEGOCIACIÓN EN ENTORNOS DIGITALES.
  7. COMPETENCIAS PARA EL ENTORNO DIGITAL.
  8. GESTIÓN DE LA MARCA PERSONAL Y STORYTELLING.
  9. CAPACIDAD DE SÍNTESIS Y CRÍTICA SOBRE LOS DATOS.
  10. CONOCIMIENTOS TÉCNICOS: INFORMÁTICA, MATEMÁTICAS Y ESTADÍSTICA.
  11. HABILIDADES DE COMUNICACIÓN PARA EXPLICAR RESULTADOS A PERFILES NO TÉCNICOS.

Número de proyecto: C20I1/2024/122 -C20I1/2024/121-C20I1/2024/165 

*Formación modular destinada a la cualificación y recualificación de la población activa, en el marco del componente 20, plan estratégico de impulso de la Formación Profesional, por la Unión Europea-Next Generation EU- según Orden 223/2022 de 21 de Noviembre de la Consejeria de Economia, Empresas y Empleo en el ámbito territorial de CLM.

Abrir chat
Hola
¿En qué podemos ayudarte?