Curso para profissionais da ciência dos dados

Introdução

A ciência de dados é a prática de extrair conhecimento de grandes quantidades de dados, usando métodos como estatística, aprendizado de máquina, mineração de dados e análise preditiva.

IBM SkillsBuild para a Academia

Visão geral do profissional de SA DA

Este curso desafia você a assumir as diferentes funções envolvidas em uma equipe de ciência de dados, resolvendo cenários reais de ponta a ponta em diferentes setores.

Objetivos

Profissionais da ciência dos dados

Use métodos e ferramentas avançados de ciência de dados, aproveitando ciências estatísticas, tecnologias de aprendizado de máquina e conjuntos de dados específicos do setor para implementar modelos de dados exclusivos que possam resolver problemas desafiadores em todos os setores.

Objetivos de aprendizagem:

  • Entender a evolução e a relevância da ciência dos dados no mundo de hoje
  • Explorar casos de uso ponta a ponta da indústria de ciência de dados usando o ciclo de vida de análise de dados
  • Compreender o método científico empregado nos projetos e as funções-chave da equipe Data Science
  • Adquirir experiência técnica usando as populares estruturas de código aberto da Data Science, incluindo cadernos Jupyter e Python
  • Obtenha uma vantagem competitiva usando a plataforma baseada em nuvem de baixo código para ciência de dados - IBM Watson Studio
  • Entender engenharia de dados e práticas de modelagem de dados usando a aprendizagem de máquinas
  • Explorar estudos de caso da indústria da ciência dos dados: transporte, automotivo, recursos humanos, aeroespacial, bancos e saúde
  • Experimente o trabalho em equipe e as práticas ágeis da indústria usando design thinking
  • Envolver-se em cenários baseados em desafios para propor soluções do mundo real.
Visão geral SA DA Praticante Objetivo Artigo

A ciência de dados está revolucionando a maneira como as organizações resolvem problemas e obtêm vantagem competitiva.

O que é ciência de dados?

No domínio da ciência de dados, a solução de problemas e a resposta a perguntas por meio da análise de dados é uma prática padrão. Muitas vezes, os cientistas de dados constroem um modelo para prever resultados ou descobrir padrões subjacentes, com o objetivo de obter melhores percepções.

As organizações podem incorporar esses insights para agir e melhorar os resultados futuros. Há inúmeras tecnologias em rápida evolução para ajudar a analisar dados e criar modelos. Em um período notavelmente curto, houve um rápido progresso dos desktops para a hospedagem de enormes armazéns paralelos com grandes volumes de dados; dessa forma, há uma transformação palpável das funcionalidades analíticas em bancos de dados relacionais para ferramentas de Big Data não estruturadas.

A análise de dados não estruturados ou semiestruturados está se tornando cada vez mais importante para incorporar sentimentos e outras informações úteis escritas em linguagem natural em modelos preditivos; isso geralmente leva a melhorias significativas na qualidade e na precisão do modelo.

As abordagens analíticas emergentes buscam automatizar as etapas de criação e aplicação de modelos, tornando a tecnologia de aprendizado de máquina (ML) uma evolução necessária para a ciência de dados moderna.

Projetos de ML bem-sucedidos exigem uma combinação de algoritmos + dados + equipe e uma infraestrutura de computação muito avançada.

Cientista de dados está entre os três principais empregos emergentes

Embora a ciência de dados como um campo exista há várias décadas, o rápido crescimento da inteligência artificial (IA) nos negócios nos últimos cinco anos gerou uma demanda por cientistas de dados que ultrapassa em muito a disponibilidade de profissionais treinados. Atualmente, 63% dos executivos citam a falta de talentos como a principal barreira para a adoção da tecnologia de IA[1]. Essa lacuna de talentos é uma oportunidade para os aspirantes a profissionais e um desafio para as empresas que buscam uma vantagem competitiva no mercado.

De acordo com o relatório de empregos emergentes do LinkedIn[2], em 2020, o cientista de dados liderou a lista de "empregos emergentes" por três anos consecutivos e deverá crescer 37% ao ano. É uma especialidade que continua a crescer significativamente em todos os setores, atribuída à evolução de empregos existentes anteriormente e à maior ênfase em dados na pesquisa acadêmica.

Que habilidades um cientista de dados precisa ter para ser bem sucedido?

A ciência de dados é um conjunto interdisciplinar de habilidades encontradas na interseção de estatística, programação de computadores e especialização de domínio. Ela compreende três áreas distintas e sobrepostas:

  • Estatísticas, para modelar e resumir conjuntos de dados
  • Informática, para projetar e usar algoritmos para armazenar, processar e visualizar dados
  • Domínio especializado, necessário para formular as perguntas certas e colocar as respostas em contexto
  • Outras habilidades que muitas vezes faltam são:
    1. Liderança
    2. Trabalho em equipe
    3. Comunicação

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring e Manish Goyal. "Shifting towards Enterprise-grade AI: Resolvendo lacunas de dados e habilidades para perceber valor". IBM Institute for Business Value, setembro de 2018. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn U.S. Emerging Jobs Report", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Estudo de caso

Wunderman Thompson + IBM: Elevating Machine learning with data and AI

Gigante publicitário, Wunderman Thompson contratou a IBM para ajudar a empregar o aprendizado de máquinas para melhor descoberta de insights humanos - insights que ajudam a aumentar o ROI para seus clientes. Com a ajuda do IBM Watson Studio e de ferramentas open-source, a empresa e seus clientes passam agora mais tempo na descoberta e criação de hipóteses e menos tempo em tarefas rotineiras.
Wunderman Thompson + IBM

Um algoritmo personalizado para detectar possíveis fraudes

Com AI no algoritmo de detecção de fraudes da IBM Cloud, Thélem garante que uma seguradora sediada na França foi capaz de detectar cinco vezes mais fraudes potenciais. Isto resultou em custos reduzidos, maior flexibilidade e a capacidade de prevenir qualquer possível fraude. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Ferramentas

Este curso utiliza as seguintes ferramentas:

  • AutoAI
  • Nuvem IBM
  • Refinaria de Dados IBM
  • Armazenamento de objetos IBM
  • Aprendizagem da máquina IBM Watson
  • Estúdio IBM Watson
  • Reconhecimento Visual IBM Watson
  • Caderno Jupyter
  • Matplotlib
  • Nó.js
  • NumPy
  • Pandas
  • PixieDust
  • Python
  • scikit-learn
  • XGBoost

Pré-requisitos

Pré-requisitos do instrutor

Os facilitadores que ministram este curso já fizeram o curso anteriormente e foram aprovados no exame.

  • Ávido orador com boa capacidade de apresentação
  • Habilidades pedagógicas de gestão de grupos
  • Incentivar o pensamento crítico e a exploração de domínios
  • Experiência no manuseio de conjuntos de dados e direitos autorais de PI

Pré-requisitos dos alunos

Indivíduos com interesse ativo em se candidatar a empregos de nível básico para trabalhar em áreas relacionadas à segurança cibernética.

  • Familiaridade com estatísticas
  • Habilidades básicas de alfabetização em TI*

*Alfabetização básica em TI - Refere-se às habilidades necessárias para operar no nível do usuário um ambiente de sistema operacional gráfico, como o Microsoft Windows® ou o Linux Ubuntu®, executando comandos operacionais básicos, como iniciar um aplicativo, copiar e colar informações, usar menus, janelas e dispositivos periféricos, como mouse e teclado. Além disso, os usuários devem estar familiarizados com navegadores de Internet, mecanismos de busca, navegação em páginas e formulários.

Credencial digital

Certificado de Praticante

Certificado IBM Data Science Practitioner

Certificado IBM Data Science Practitioner

Veja o crachá

Sobre este certificado

Por meio de um treinamento validado e conduzido por instrutor de ciência de dados, esse portador de credencial adquiriu as habilidades e a compreensão dos conceitos e tecnologias fundamentais da ciência de dados. Ele demonstrou proficiência e compreensão dos tópicos técnicos da ciência de dados e design thinking. O portador da credencial adquiriu a capacidade de aplicar os conceitos e a tecnologia da ciência de dados com as ferramentas de código aberto aplicáveis que são relevantes para cenários de ciência de dados do mundo real, adequados para fins educacionais.

Habilidades

Colaboração, Comunicação, Limpeza de dados, Coleta de dados, Engenharia de dados, Operações de dados, Refinaria de dados, Ciência de dados, Fundamentos de ciência de dados, Metodologia de ciência de dados, Visualização de dados, Processamento de dados, Aprendizado profundo, Design Thinking, Empatia, Design de experiência, IBM Cloud, IBM Watson, Ideação, Aprendizado de máquina, Matplotlib, Implementação de modelo, Visualização de modelo, Compreensão de linguagem natural, pandas, Personas, Solução de problemas, Storyboarding, Trabalho em equipe, Casos de uso, Design centrado no usuário, Centrado no usuário, Experiência do usuário, Pesquisa do usuário, UX, Reconhecimento visual, Watson discovery, Watson Studio.

Critérios

  • Deve participar de uma sessão de treinamento em uma instituição de ensino superior implementando o programa da IBM Skills Academy.
  • Deve ter completado o treinamento de profissionais das ciências de dados liderados por instrutores.
  • Deve ter ganho o Empresa Design Thinking Distintivo do Praticante.
  • Deve passar no exame de profissionais da ciência dos dados e completar satisfatoriamente o exercício de grupo.

Certificado do instrutor

Certificado de instrutor do IBM Data Science Practitioner Badge

Certificado de profissional de ciência de dados da IBM: Instrutor

Veja o crachá

Sobre este certificado

Por meio de um workshop conduzido por um instrutor da IBM, esse portador de credencial adquiriu habilidades em conceitos de ciência de dados, tecnologia e casos de uso. Ele demonstrou proficiência nos seguintes tópicos: Fundamentos da ciência de dados, Coleta de dados, Compreensão de dados, Modelagem e otimização de dados, Design Thinking para ciência de dados e Casos de uso do setor de ciência de dados. O aluno demonstra capacidade de ensinar o curso de ciência de dados aplicando habilidades pedagógicas para conduzir o trabalho em grupo usando cenários baseados em desafios.

Habilidades

Conselheiro, Comunicação, Limpeza de dados, Coleta de dados, Engenharia de dados, Operações de dados, Refinaria de dados, Ciência de dados, Fundamentos da ciência de dados, Metodologia da ciência de dados, Visualização de dados, Processamento de dados, Aprendizado profundo, Design Thinking, Empatia, Design de experiência, IBM Cloud, IBM Watson, Ideação, Palestrante, Aprendizado de máquina, Matplotlib, Implementação de modelo, Visualização de modelo, Compreensão de linguagem natural, Pandas, Personas, Solução de problemas, Storyboarding, Trabalho em equipe, Instrutor, Casos de uso, Design centrado no usuário, Centrado no usuário, Experiência do usuário, Pesquisa do usuário, UX, Reconhecimento visual, Watson discovery, Watson Studio.

Critérios

  • Deve ser um instrutor designado de uma instituição de ensino superior que tenha ou esteja implementando o programa da Academia de Habilidades IBM.
  • Deve ter completado a oficina IBM Data science practitioners - Instructors.
  • Deve ter ganho o Empresa Design Thinking Distintivo do Praticante.
  • Deve cumprir os requisitos do processo de validação de ensino da IBM Skills Academy.