Corso per professionisti della scienza dei dati

Introduzione

La scienza dei dati è la pratica di estrarre conoscenza da enormi quantità di dati, utilizzando metodi come la statistica, l'apprendimento automatico, il data mining e l'analisi predittiva.

IBM SkillsBuild per il mondo accademico

Panoramica del professionista SA DA

Questo corso vi sfida ad assumere i diversi ruoli coinvolti in un team di data science, risolvendo scenari reali end-to-end in diversi settori.

Obiettivi

Professionisti della scienza dei dati

Utilizzare metodi e strumenti avanzati di scienza dei dati, sfruttando le scienze statistiche, le tecnologie di apprendimento automatico e i set di dati specifici del settore, per implementare modelli di dati unici in grado di risolvere problemi impegnativi in tutti i settori.

Obiettivi di apprendimento:

  • Comprendere l'evoluzione e la rilevanza della scienza dei dati nel mondo di oggi.
  • Esplorare i casi d'uso end-to-end del settore della scienza dei dati utilizzando il ciclo di vita dell'analisi dei dati.
  • Comprendere il metodo scientifico utilizzato nei progetti e i ruoli chiave del team Data Science.
  • Acquisire competenze tecniche utilizzando i più diffusi framework open-source per la scienza dei dati, tra cui Jupyter notebook e Python.
  • Ottenere un vantaggio competitivo utilizzando la piattaforma low-code basata su cloud per Data Science-IBM Watson Studio
  • Comprendere le pratiche di ingegneria dei dati e di modellazione dei dati utilizzando l'apprendimento automatico.
  • Esplora i casi di studio del settore della scienza dei dati: trasporti, automotive, risorse umane, aerospaziale, bancario e sanitario.
  • Esperienza di lavoro in team e pratiche agili di settore che utilizzano il design thinking
  • Impegnarsi in scenari basati su sfide di ruolo per proporre soluzioni reali.
Panoramica SA DA Practitioner Obiettivo Articolo

La scienza dei dati sta rivoluzionando il modo in cui le organizzazioni risolvono i problemi e ottengono vantaggi competitivi.

Che cos'è la scienza dei dati?

Nell'ambito della scienza dei dati, la risoluzione di problemi e la risposta a domande attraverso l'analisi dei dati è una pratica standard. Spesso gli scienziati dei dati costruiscono un modello per prevedere i risultati o scoprire i modelli sottostanti, con l'obiettivo di ottenere una migliore comprensione.

Le organizzazioni possono incorporare questi dati per agire e migliorare i risultati futuri. Esistono numerose tecnologie in rapida evoluzione che aiutano ad analizzare i dati e a costruire modelli. In un tempo straordinariamente breve, si è passati rapidamente dai desktop all'hosting di enormi magazzini paralleli con enormi volumi di dati; in questo modo, si assiste a una trasformazione palpabile dalle funzionalità analitiche all'interno dei database relazionali agli strumenti per i big data non strutturati.

L'analisi dei dati non strutturati o semi-strutturati sta diventando sempre più importante per incorporare il sentiment e altre informazioni utili scritte in linguaggio naturale nei modelli predittivi; questo spesso porta a miglioramenti significativi nella qualità e nell'accuratezza del modello.

Gli approcci analitici emergenti cercano di automatizzare le fasi di costruzione e applicazione dei modelli, rendendo la tecnologia di apprendimento automatico (ML) un'evoluzione necessaria per la moderna scienza dei dati.

I progetti di ML di successo richiedono una combinazione di algoritmi + dati + team e un'infrastruttura informatica molto potente.

Il Data Scientist è tra le prime tre professioni emergenti

Sebbene la scienza dei dati come campo esista da diversi decenni, la rapida crescita dell'intelligenza artificiale (IA) nelle aziende negli ultimi cinque anni ha generato una domanda di data scientist che supera di gran lunga la disponibilità di professionisti formati. Oggi, il 63% dei dirigenti cita la mancanza di talenti come principale ostacolo all'adozione della tecnologia AI[1]. Questa carenza di talenti è un'opportunità per gli aspiranti professionisti e una sfida per le aziende che cercano di ottenere un vantaggio competitivo sul mercato.

Secondo il rapporto LinkedIn Emerging Jobs[2], per tre anni consecutivi il Data Scientist è in cima alla lista dei "lavori emergenti" e si prevede una crescita annua del 37%. Si tratta di una specializzazione che continua a crescere in modo significativo in tutti i settori, grazie all'evoluzione di lavori già esistenti e alla maggiore enfasi sui dati nella ricerca accademica.

Di quali competenze ha bisogno un Data Scientist per avere successo?

La scienza dei dati è un insieme di competenze interdisciplinari che si trovano all'intersezione tra statistica, programmazione informatica e competenze di dominio. Comprende tre aree distinte e sovrapposte:

  • Statistica, per modellare e sintetizzare le serie di dati.
  • Informatica, per progettare e utilizzare algoritmi per memorizzare, elaborare e visualizzare i dati.
  • Competenza nel settore, necessaria per formulare le domande giuste e contestualizzare le risposte.
  • Altre competenze che spesso mancano sono:
    1. Leadership
    2. Lavoro di squadra
    3. Comunicazione

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring e Manish Goyal. "Shifting towards Enterprise-grade AI: Resolving data and skills gaps to realize value". IBM Institute for Business Value, settembre 2018. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn U.S. Emerging Jobs Report", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Studio di caso

Wunderman Thompson + IBM: Elevare l'apprendimento automatico con i dati e l'IA

Il gigante della pubblicità Wunderman Thompson si è affidato a IBM per utilizzare l'apprendimento automatico per una migliore scoperta delle intuizioni umane - intuizioni che contribuiscono ad aumentare il ROI per i clienti. Con l'aiuto di IBM Watson Studio e di strumenti open-source, l'azienda e i suoi clienti dedicano ora più tempo alla scoperta e alla creazione di ipotesi e meno tempo a compiti banali.
Wunderman Thompson + IBM

Un algoritmo personalizzato per rilevare potenziali frodi

Grazie all'algoritmo di rilevamento delle frodi guidato dall'AI su IBM Cloud, Thélem assurances, una compagnia assicurativa con sede in Francia, è stata in grado di rilevare un numero di potenziali frodi cinque volte superiore. Ciò ha comportato una riduzione dei costi, una maggiore flessibilità e la capacità di prevenire ogni possibile frode. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Strumenti

Questo corso utilizza i seguenti strumenti:

  • AutoAI
  • IBM Cloud
  • Raffineria di dati IBM
  • Archiviazione a oggetti IBM
  • Apprendimento automatico IBM Watson
  • Studio IBM Watson
  • Riconoscimento visivo IBM Watson
  • Quaderno Jupyter
  • Matplotlib
  • Node.js
  • NumPy
  • Panda
  • PixieDust
  • Pitone
  • scikit-learn
  • XGBoost

Prerequisiti

Prerequisiti dell'istruttore

I facilitatori che tengono questo corso hanno frequentato il corso in precedenza e superato con successo l'esame.

  • Abile oratore con buone capacità di presentazione
  • Capacità di gestione pedagogica dei gruppi
  • Incoraggiare il pensiero critico e l'esplorazione del dominio
  • Esperienza nella gestione di set di dati e diritti d'autore

Prerequisiti dell'allievo

Persone con un interesse attivo a candidarsi per lavori entry-level in settori legati alla cybersecurity.

  • Familiarità con le statistiche
  • Competenze informatiche di base*

*Alfabetizzazione informatica di base - Si riferisce alle competenze necessarie per operare a livello utente in un ambiente di sistema operativo grafico come Microsoft Windows® o Linux Ubuntu®, eseguendo comandi operativi di base come l'avvio di un'applicazione, il copia e incolla di informazioni, l'utilizzo di menu, finestre e periferiche come mouse e tastiera. Inoltre, gli utenti devono avere familiarità con i browser Internet, i motori di ricerca, la navigazione delle pagine e i moduli.

Credenziale digitale

Certificato di praticante

Certificato IBM Data Science Practitioner

Certificato IBM Data Science Practitioner

Vedere il badge

Informazioni su questo certificato

Attraverso la formazione con istruttore di Data Science convalidata, il titolare della credenziale ha acquisito le competenze e la comprensione dei concetti e delle tecnologie fondamentali della Data Science. Ha dimostrato competenza e comprensione degli argomenti tecnici della Data Science e del design thinking. Il candidato ha acquisito la capacità di applicare i concetti e la tecnologia della scienza dei dati con gli strumenti open source applicabili e rilevanti per gli scenari della scienza dei dati del mondo reale, adatti a scopi didattici.

Competenze

Collaborazione, Comunicazione, Pulizia dei dati, Raccolta dei dati, Ingegneria dei dati, Operazioni sui dati, Raffinazione dei dati, Scienza dei dati, Fondamenti della scienza dei dati, Metodologia della scienza dei dati, Visualizzazione dei dati, Gestione dei dati, Deep learning, Design Thinking, Empatia, Progettazione dell'esperienza, IBM Cloud, IBM Watson, Ideazione, Machine learning, Matplotlib, Distribuzione di modelli, Visualizzazione di modelli, Comprensione del linguaggio naturale, Panda, Personas, Problem-solving, Storyboarding, Lavoro di squadra, Casi d'uso, Progettazione centrata sull'utente, Centrata sull'utente, Esperienza dell'utente, Ricerca dell'utente, UX, Riconoscimento visivo, Watson discovery, Watson Studio.

Criteri

  • Deve partecipare a una sessione di formazione presso un istituto di istruzione superiore che attua il programma IBM Skills Academy.
  • Deve aver completato il corso di formazione per professionisti della scienza dei dati con istruttore.
  • Deve aver guadagnato il Distintivo per praticanti del pensiero progettuale d'impresa.
  • Deve superare l'esame Data science practitioners e completare in modo soddisfacente l'esercitazione di gruppo.

Certificato di istruttore

Badge per istruttori del certificato IBM Data Science Practitioner

Certificato IBM Data Science Practitioner: Istruttore

Vedere il badge

Informazioni su questo certificato

Attraverso un workshop guidato da un istruttore IBM, chi ha ottenuto la credenziale ha acquisito competenze su concetti, tecnologie e casi d'uso della scienza dei dati. Ha dimostrato competenza in questi argomenti: Fondamenti della scienza dei dati, Raccolta dei dati, Comprensione dei dati, Modellazione e ottimizzazione dei dati, Design Thinking per la scienza dei dati e Casi d'uso del settore della scienza dei dati. Il candidato dimostra di essere in grado di insegnare il corso di scienza dei dati applicando le competenze pedagogiche per guidare il lavoro di gruppo utilizzando scenari basati su sfide.

Competenze

Consulente, Comunicazione, Pulizia dei dati, Raccolta dei dati, Ingegneria dei dati, Operazioni sui dati, Raffinazione dei dati, Scienza dei dati, Fondamenti della scienza dei dati, Metodologia della scienza dei dati, Visualizzazione dei dati, Gestione dei dati, Deep learning, Design Thinking, Empatia, Progettazione dell'esperienza, IBM Cloud, IBM Watson, Ideazione, Docente, Machine learning, Matplotlib, Distribuzione di modelli, Visualizzazione di modelli, Comprensione del linguaggio naturale, Panda, Personas, Problem-solving, Storyboarding, Lavoro di squadra, Formatore, Casi d'uso, Progettazione centrata sull'utente, Centrata sull'utente, Esperienza dell'utente, Ricerca dell'utente, UX, Riconoscimento visivo, Watson discovery, Watson Studio.

Criteri

  • Deve essere un istruttore designato da un istituto di istruzione superiore che ha o sta implementando il programma IBM Skills Academy.
  • Deve aver completato il workshop IBM Data science practitioners - Instructors.
  • Deve aver guadagnato il Distintivo per praticanti del pensiero progettuale d'impresa.
  • Deve soddisfare i requisiti del processo di convalida dell'insegnamento IBM Skills Academy.