Curso para profesionales de la ciencia de los datos

Introducción

La ciencia de datos es la práctica de extraer conocimientos de cantidades masivas de datos, utilizando métodos como la estadística, el aprendizaje automático, la minería de datos y el análisis predictivo.

IBM SkillsBuild para el mundo académico

Visión general SA DA Practitioner

Este curso te reta a asumir los diferentes roles que intervienen en un equipo de ciencia de datos, resolviendo escenarios del mundo real de extremo a extremo en diferentes industrias.

Objetivos

Profesionales de la ciencia de datos

Utilizar métodos y herramientas avanzados de ciencia de datos, aprovechando las ciencias estadísticas, las tecnologías de aprendizaje automático y los conjuntos de datos específicos del sector, para aplicar modelos de datos únicos que puedan resolver problemas difíciles en todos los sectores.

Objetivos de aprendizaje:

  • Comprender la evolución y relevancia de la ciencia de datos en el mundo actual
  • Explorar casos de uso de la industria de la ciencia de datos de principio a fin utilizando el ciclo de vida del análisis de datos.
  • Comprender el método científico empleado en los proyectos y las funciones clave del equipo de ciencia de datos.
  • Adquirir experiencia técnica en el uso de marcos populares de ciencia de datos de código abierto, incluidos los cuadernos Jupyter y Python.
  • Obtenga una ventaja competitiva utilizando la plataforma de bajo código basada en la nube para Data Science-IBM Watson Studio
  • Comprender las prácticas de ingeniería de datos y modelado de datos mediante aprendizaje automático
  • Explore los casos prácticos de la industria de la ciencia de datos: transporte, automoción, recursos humanos, aeroespacial, banca y sanidad.
  • Experiencia de trabajo en equipo y prácticas ágiles de la industria utilizando el pensamiento de diseño
  • Participar en juegos de rol basados en retos para proponer soluciones reales.
Visión general SA DA Objetivo profesional Artículo

La ciencia de datos está revolucionando la forma en que las organizaciones resuelven problemas y obtienen ventajas competitivas.

¿Qué es la ciencia de datos?

En el ámbito de la ciencia de datos, resolver problemas y responder preguntas mediante el análisis de datos es una práctica habitual. A menudo, los científicos de datos construyen un modelo para predecir resultados o descubrir patrones subyacentes, con el objetivo de obtener mejores conocimientos.

Las organizaciones pueden incorporar estos conocimientos para actuar y mejorar los resultados futuros. Existen numerosas tecnologías en rápida evolución para ayudar a analizar los datos y construir modelos. En muy poco tiempo, se ha pasado rápidamente de los ordenadores de sobremesa al alojamiento de almacenes paralelos masivos con enormes volúmenes de datos; de este modo, se está produciendo una transformación palpable de las funcionalidades de análisis en bases de datos relacionales a las herramientas de big data no estructuradas.

El análisis de datos no estructurados o semiestructurados es cada vez más importante para incorporar a los modelos predictivos el sentimiento y otra información útil escrita en lenguaje natural; esto suele dar lugar a mejoras significativas en la calidad y precisión de los modelos.

Los enfoques analíticos emergentes tratan de automatizar los pasos en la construcción y aplicación de modelos, lo que convierte a la tecnología de aprendizaje automático (ML) en una evolución necesaria hacia la ciencia de datos moderna.

El éxito de los proyectos de ML requiere una combinación de algoritmos + datos + equipo, y una infraestructura informática muy potente.

El científico de datos figura entre los tres principales empleos emergentes

Aunque la ciencia de datos como campo existe desde hace varias décadas, el rápido crecimiento de la inteligencia artificial (IA) en las empresas en los últimos cinco años ha generado una demanda de científicos de datos que supera con creces la disponibilidad de profesionales formados. En la actualidad, el 63% de los ejecutivos citan la falta de talento como principal obstáculo para adoptar la tecnología de IA[1]. Esta brecha de talento es una oportunidad para los aspirantes a profesionales y un reto para las empresas que luchan por obtener una ventaja competitiva en el mercado.

Según el informe LinkedIn Emerging Jobs[2], en 2020, el científico de datos ha encabezado la lista de "empleos emergentes" durante tres años consecutivos y se prevé que crezca un 37% anual. Se trata de una especialidad que sigue creciendo significativamente en todos los sectores, lo que se atribuye a la evolución de puestos de trabajo ya existentes y al mayor énfasis en los datos en la investigación académica.

¿Qué habilidades necesita un científico de datos para tener éxito?

La ciencia de datos es un conjunto interdisciplinar de competencias que se encuentran en la intersección de la estadística, la programación informática y los conocimientos especializados. Comprende tres áreas distintas que se solapan:

  • Estadística, para modelizar y resumir conjuntos de datos
  • Informática, para diseñar y utilizar algoritmos de almacenamiento, tratamiento y visualización de datos.
  • Conocimientos especializados, necesarios para formular las preguntas adecuadas y contextualizar las respuestas.
  • Otras destrezas que se suelen pasar por alto son:
    1. Liderazgo
    2. Trabajo en equipo
    3. Comunicación

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring y Manish Goyal. "Shifting toward Enterprise-grade AI: Resolving data and skills gaps to realize value". IBM Institute for Business Value, septiembre de 2018. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn U.S. Emerging Jobs Report", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Estudio de caso

Wunderman Thompson + IBM: Elevando el aprendizaje automático con datos e IA

Wunderman Thompson, el gigante de la publicidad, contrató a IBM para que le ayudara a emplear el aprendizaje automático para descubrir mejor los conocimientos humanos, conocimientos que ayudan a aumentar el retorno de la inversión de sus clientes. Con la ayuda de IBM Watson Studio y herramientas de código abierto, la empresa y sus clientes dedican ahora más tiempo al descubrimiento y la creación de hipótesis y menos a tareas mundanas.
Wunderman Thompson + IBM

Un algoritmo personalizado para detectar posibles fraudes

Gracias al algoritmo de detección de fraudes basado en IA en IBM Cloud, Thélem assurances, una aseguradora con sede en Francia, pudo detectar cinco veces más fraudes potenciales. Esto se tradujo en una reducción de costes, una mayor flexibilidad y la capacidad de anticiparse a cualquier posible fraude. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Herramientas

Este curso utiliza las siguientes herramientas:

  • AutoAI
  • IBM Cloud
  • IBM Refinería de datos
  • Almacenamiento de objetos de IBM
  • Aprendizaje automático de IBM Watson
  • Estudio IBM Watson
  • Reconocimiento visual IBM Watson
  • Cuaderno Jupyter
  • Matplotlib
  • Node.js
  • NumPy
  • Pandas
  • PixieDust
  • Python
  • scikit-learn
  • XGBoost

Requisitos previos

Requisitos previos del instructor

Los facilitadores que imparten este curso lo han realizado previamente y han superado con éxito el examen.

  • Orador ávido con buenas dotes de presentación
  • Habilidades pedagógicas de gestión de grupos
  • Fomentar el pensamiento crítico y la exploración de dominios
  • Experiencia en el manejo de conjuntos de datos y derechos de propiedad intelectual

Requisitos previos del alumno

Personas con un interés activo en solicitar puestos de nivel inicial para trabajar en campos relacionados con la ciberseguridad.

  • Familiaridad con las estadísticas
  • Conocimientos básicos de informática*.

*Conocimientos básicos de informática - Se refiere a los conocimientos necesarios para manejar a nivel de usuario un entorno de sistema operativo gráfico como Microsoft Windows® o Linux Ubuntu®, realizando comandos operativos básicos como lanzar una aplicación, copiar y pegar información, utilizar menús, ventanas y dispositivos periféricos como el ratón y el teclado. Además, los usuarios deben estar familiarizados con los navegadores de Internet, los motores de búsqueda, la navegación por páginas y los formularios.

Credencial digital

Certificado profesional

Certificado IBM Data Science Practitioner

Certificado IBM Data Science Practitioner

Ver placa

Acerca de este certificado

A través de una formación validada impartida por un instructor en ciencia de datos, esta persona ha adquirido las habilidades y la comprensión de los conceptos y tecnologías fundamentales de la ciencia de datos. Ha demostrado competencia y comprensión de los temas técnicos de la ciencia de datos y el pensamiento de diseño. El titular ha adquirido la capacidad de aplicar los conceptos y la tecnología de la ciencia de datos con las herramientas de código abierto aplicables que son relevantes para los escenarios de la ciencia de datos del mundo real, adecuados para fines educativos.

Habilidades

Colaboración, Comunicación, Limpieza de datos, Recopilación de datos, Ingeniería de datos, Operaciones de datos, Refinería de datos, Ciencia de datos, Fundamentos de la ciencia de datos, Metodología de la ciencia de datos, Visualización de datos, Manipulación de datos, Aprendizaje profundo, Design Thinking, Empatía, Diseño de experiencias, IBM Cloud, IBM Watson, Ideación, Aprendizaje automático, Matplotlib, Despliegue de modelos, Visualización de modelos, Comprensión del lenguaje natural, pandas, Personas, Resolución de problemas, Storyboarding, Trabajo en equipo, Casos de uso, Diseño centrado en el usuario, Centrado en el usuario, Experiencia de usuario, Investigación de usuarios, UX, Reconocimiento visual, Watson discovery, Watson Studio.

Criterios

  • Debe asistir a una sesión de formación en una institución de educación superior que aplique el programa IBM Skills Academy.
  • Debe haber completado la formación para profesionales de la ciencia de datos impartida por un instructor.
  • Debe haber obtenido el Insignia de Profesional del Pensamiento de Diseño Empresarial.
  • Debe aprobar el examen para profesionales de la ciencia de datos y completar satisfactoriamente el ejercicio en grupo.

Certificado de instructor

Insignia de Instructor del Certificado IBM Data Science Practitioner

Certificado IBM Data Science Practitioner: Instructor

Ver placa

Acerca de este certificado

A través de un taller dirigido por un instructor de IBM, esta persona ha adquirido habilidades en conceptos de ciencia de datos, tecnología y casos de uso. Ha demostrado su competencia en estos temas: Fundamentos de la ciencia de datos, Recopilación de datos, Comprensión de datos, Modelado y optimización de datos, Pensamiento de diseño para la ciencia de datos y Casos de uso de la industria de la ciencia de datos. El alumno demuestra capacidad para impartir el curso de ciencia de datos aplicando habilidades pedagógicas para dirigir el trabajo en grupo utilizando escenarios basados en retos.

Habilidades

Asesor, Comunicación, Limpieza de datos, Recopilación de datos, Ingeniería de datos, Operaciones de datos, Refinería de datos, Ciencia de datos, Fundamentos de la ciencia de datos, Metodología de la ciencia de datos, Visualización de datos, Manipulación de datos, Aprendizaje profundo, Design Thinking, Empatía, Diseño de experiencias, IBM Cloud, IBM Watson, Ideación, Conferenciante, Machine learning, Matplotlib, Model deployment, Model visualization, Natural language understanding, pandas, Personas, Problem-solving, Storyboarding, Teamwork, Trainer, Use cases, User-centered design, User-centric, User experience, User research, UX, Visual recognition, Watson discovery, Watson Studio.

Criterios

  • Debe ser un instructor designado de una institución de enseñanza superior que haya implantado o esté implantando el programa IBM Skills Academy.
  • Debe haber completado el taller IBM Data science practitioners - Instructors.
  • Debe haber obtenido el Insignia de Profesional del Pensamiento de Diseño Empresarial.
  • Debe cumplir los requisitos del proceso de validación docente de IBM Skills Academy.