Kurs dla praktyków data science

Wstęp

Nauka o danych to praktyka wydobywania wiedzy z ogromnych ilości danych przy użyciu metod takich jak statystyka, uczenie maszynowe, eksploracja danych i analiza predykcyjna.

IBM SkillsBuild dla środowisk akademickich

Przegląd SA DA Practitioner

Ten kurs stanowi wyzwanie do podjęcia różnych ról w zespole data science, rozwiązując kompleksowe scenariusze z różnych branż.

Cele

Praktycy nauki o danych

Korzystaj z zaawansowanych metod i narzędzi Data Science, wykorzystując nauki statystyczne, technologie uczenia maszynowego i zbiory danych specyficzne dla branży, aby wdrażać unikalne modele danych, które mogą rozwiązywać trudne problemy we wszystkich branżach.

Cele kształcenia:

  • Zrozumienie ewolucji i znaczenia Data science w dzisiejszym świecie
  • Poznaj kompleksowe przypadki użycia w branży Data Science z wykorzystaniem cyklu życia analizy danych
  • Zrozumienie metody naukowej stosowanej w projektach oraz kluczowych ról zespołu Data Science
  • Zdobądź wiedzę techniczną z wykorzystaniem popularnych open-source'owych frameworków Data Science, w tym Jupyter notebooks i Python.
  • Zdobądź przewagę konkurencyjną dzięki niskokodowej platformie chmurowej dla Data Science-IBM Watson Studio
  • Zrozumienie praktyk inżynierii danych i modelowania danych z wykorzystaniem uczenia maszynowego
  • Poznaj studia przypadków branży Data Science: transport, motoryzacja, zasoby ludzkie, lotnictwo, bankowość i opieka zdrowotna
  • Doświadczenie w pracy zespołowej i zwinnych praktykach branżowych z wykorzystaniem design thinking
  • Zaangażuj się w odgrywanie scenariuszy opartych na wyzwaniach, aby zaproponować rzeczywiste rozwiązania.
Przegląd SA DA Practitioner Cel Artykuł

Nauka o danych rewolucjonizuje sposób, w jaki organizacje rozwiązują problemy i uzyskują przewagę konkurencyjną.

Co to jest Data science?

W dziedzinie Data Science rozwiązywanie problemów i odpowiadanie na pytania poprzez analizę danych jest standardową praktyką. Często naukowcy zajmujący się danymi konstruują model w celu przewidywania wyników lub odkrywania podstawowych wzorców w celu uzyskania lepszego wglądu.

Organizacje mogą wykorzystać te spostrzeżenia do działania i poprawy przyszłych wyników. Istnieje wiele szybko rozwijających się technologii, które pomagają analizować dane i tworzyć modele. W niezwykle krótkim czasie nastąpił szybki postęp od komputerów stacjonarnych do hostowania ogromnych równoległych hurtowni z ogromnymi ilościami danych; w ten sposób następuje namacalna transformacja od funkcji analitycznych w relacyjnych bazach danych do nieustrukturyzowanych narzędzi Big Data.

Analityka nieustrukturyzowanych lub częściowo ustrukturyzowanych danych staje się coraz ważniejsza, aby włączyć sentyment i inne przydatne informacje zapisane w języku naturalnym do modeli predykcyjnych; często prowadzi to do znacznej poprawy jakości i dokładności modelu.

Pojawiające się podejścia analityczne dążą do automatyzacji etapów budowania i stosowania modeli, czyniąc technologię uczenia maszynowego (ML) niezbędną ewolucją w kierunku nowoczesnej nauki o danych.

Udane projekty ML wymagają połączenia algorytmów + danych + zespołu i bardzo wydajnej infrastruktury obliczeniowej.

Data Scientist plasuje się w pierwszej trójce wschodzących zawodów

Chociaż nauka o danych jako dziedzina istnieje od kilku dekad, szybki rozwój sztucznej inteligencji (AI) w biznesie w ciągu ostatnich pięciu lat wygenerował zapotrzebowanie na naukowców zajmujących się danymi, które znacznie przewyższa dostępność wyszkolonych specjalistów. Obecnie 63% kadry kierowniczej wymienia brak talentów jako główną przeszkodę w przyjęciu technologii AI[1]. Ta luka talentów jest szansą dla aspirujących profesjonalistów i wyzwaniem dla firm dążących do uzyskania przewagi konkurencyjnej na rynku.

Według raportu LinkedIn Emerging Jobs[2], w 2020 roku Data Scientist znalazł się na szczycie listy "Emerging Jobs" przez trzy lata z rzędu i przewiduje się, że będzie rósł w tempie 37% rocznie. Jest to specjalizacja, która nadal rozwija się znacząco we wszystkich branżach, co przypisuje się ewolucji wcześniej istniejących zawodów i zwiększonemu naciskowi na dane w badaniach akademickich.

Jakie umiejętności potrzebuje Data scientist, aby odnieść sukces?

Data Science to interdyscyplinarny zestaw umiejętności, które można znaleźć na przecięciu statystyki, programowania komputerowego i wiedzy specjalistycznej. Obejmuje trzy odrębne i nakładające się na siebie obszary:

  • Statystyka, do modelowania i podsumowywania zbiorów danych
  • Informatyka, aby zaprojektować i wykorzystać algorytmy do przechowywania, przetwarzania i wizualizacji danych
  • Wiedza z zakresu danej dziedziny, niezbędna do formułowania właściwych pytań i umieszczania odpowiedzi w kontekście
  • Inne często pomijane umiejętności to:
    1. Przywództwo
    2. Praca zespołowa
    3. Komunikacja

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring i Manish Goyal. "Shifting toward Enterprise-grade AI: Resolving data and skills gaps to realize value". IBM Institute for Business Value, wrzesień 2018. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn U.S. Emerging Jobs Report", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Studium przypadku

Wunderman Thompson + IBM: Elevating Machine learning with data and AI

Gigant branży reklamowej, Wunderman Thompson, zaangażował IBM do pomocy w wykorzystaniu uczenia maszynowego w celu lepszego odkrywania ludzkich spostrzeżeń - spostrzeżeń, które pomagają zwiększyć ROI dla klientów. Z pomocą IBM Watson Studio i narzędzi open-source, firma i jej klienci spędzają teraz więcej czasu na odkrywaniu i tworzeniu hipotez, a mniej na prozaicznych zadaniach.
Wunderman Thompson + IBM

Indywidualny algorytm wykrywania potencjalnych oszustw

Dzięki algorytmowi wykrywania oszustw napędzanemu przez AI na IBM Cloud, Thélem assurances, firma ubezpieczeniowa z Francji była w stanie wykryć pięć razy więcej potencjalnych oszustw. Spowodowało to zmniejszenie kosztów, większą elastyczność i możliwość uprzedzenia wszelkich możliwych oszustw. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Narzędzia

Kurs wykorzystuje następujące narzędzia:

  • AutoAI
  • IBM Cloud
  • IBM Data Refinery
  • IBM Object Storage
  • IBM Watson Uczenie maszynowe
  • IBM Watson Studio
  • IBM Watson Rozpoznawanie wizualne
  • Jupyter Notebook
  • Matplotlib
  • Node.js
  • NumPy
  • Pandy
  • PixieDust
  • Python
  • scikit-learn
  • XGBoost

Wymagania wstępne

Wymagania wstępne instruktora

Instruktorzy prowadzący ten kurs uczestniczyli w nim wcześniej i pomyślnie zdali egzamin.

  • Zapalony mówca z dobrymi umiejętnościami prezentacji
  • Pedagogiczne umiejętności zarządzania grupą
  • Zachęcanie do krytycznego myślenia i eksploracji dziedziny
  • Doświadczenie w obsłudze zbiorów danych i praw autorskich IP

Wymagania wstępne dla uczących się

Osoby aktywnie zainteresowane ubieganiem się o pracę na poziomie podstawowym w dziedzinach związanych z cyberbezpieczeństwem.

  • Znajomość statystyki
  • Podstawowe umiejętności informatyczne*

*Podstawowe umiejętności informatyczne - odnoszą się do umiejętności wymaganych do obsługi na poziomie użytkownika graficznego środowiska systemu operacyjnego, takiego jak Microsoft Windows® lub Linux Ubuntu®, wykonywania podstawowych poleceń operacyjnych, takich jak uruchamianie aplikacji, kopiowanie i wklejanie informacji, korzystanie z menu, okien i urządzeń peryferyjnych, takich jak mysz i klawiatura. Ponadto użytkownicy powinni być zaznajomieni z przeglądarkami internetowymi, wyszukiwarkami, nawigacją po stronach i formularzami.

Legitymacja cyfrowa

Certyfikat Practitioner

Certyfikat IBM Data Science Practitioner

Certyfikat IBM Data Science Practitioner

Zobacz odznakę

O tym certyfikacie

Dzięki zweryfikowanemu szkoleniu prowadzonemu przez instruktora Data Science, ten zdobywca poświadczeń nabył umiejętności i zrozumienie podstawowych koncepcji i technologii Data Science. Wykazał się biegłością i zrozumieniem tematów technicznych Data Science i myślenia projektowego. Zdobywca zdobył umiejętność stosowania koncepcji i technologii Data Science z odpowiednimi narzędziami open source, które są istotne dla rzeczywistych scenariuszy Data Science, odpowiednich do celów edukacyjnych.

Umiejętności

Współpraca, Komunikacja, Czyszczenie danych, Gromadzenie danych, Inżynieria danych, Operacje na danych, Rafinacja danych, Nauka o danych, Podstawy nauki o danych, Metodologia nauki o danych, Wizualizacja danych, Uczenie głębokie, Myślenie projektowe, Empatia, Projektowanie doświadczeń, IBM Cloud, IBM Watson, Ideation, Machine learning, Matplotlib, Model deployment, Model visualization, Natural language understanding, pandas, Personas, Problem-solving, Storyboarding, Teamwork, Use cases, User-centered design, User-centric, User experience, User research, UX, Visual recognition, Watson discovery, Watson Studio.

Kryteria

  • Musi wziąć udział w szkoleniu w szkole wyższej realizującej program IBM Skills Academy.
  • Musi mieć ukończone instruktorskie szkolenie Data science practitioners.
  • Musi zdobyć Odznaka Enterprise Design Thinking Practitioner.
  • Musi zdać egzamin Data science practitioners i zadowalająco ukończyć ćwiczenia grupowe.

Certyfikat instruktora

Odznaka instruktorska IBM Data Science Practitioner Certificate

Certyfikat IBM Data Science Practitioner: Instruktor

Zobacz odznakę

O tym certyfikacie

Dzięki warsztatom prowadzonym przez instruktorów IBM, ten zdobywca poświadczeń zdobył umiejętności w zakresie koncepcji nauki o danych, technologii i przypadków użycia. Wykazał się biegłością w następujących tematach: Podstawy nauki o danych, Gromadzenie danych, Zrozumienie danych, Modelowanie i optymalizacja danych, Myślenie projektowe w nauce o danych oraz Przypadki użycia w branży nauki o danych. Zdobywca wykazuje zdolność do nauczania kursu nauki o danych poprzez stosowanie umiejętności pedagogicznych do kierowania pracą grupową przy użyciu scenariuszy opartych na wyzwaniach.

Umiejętności

Doradca, Komunikacja, Czyszczenie danych, Gromadzenie danych, Inżynieria danych, Operacje na danych, Rafinacja danych, Nauka o danych, Podstawy nauki o danych, Metodologia nauki o danych, Wizualizacja danych, Uczenie głębokie, Myślenie projektowe, Empatia, Projektowanie doświadczeń, IBM Cloud, IBM Watson, Ideacja, Wykładowca, Uczenie maszynowe, Matplotlib, Wdrażanie modeli, Wizualizacja modeli, Rozumienie języka naturalnego, pandy, Personas, Rozwiązywanie problemów, Storyboarding, Praca zespołowa, Trener, Przypadki użycia, Projektowanie zorientowane na użytkownika, User-centric, User experience, User research, UX, Rozpoznawanie wizualne, Watson discovery, Watson Studio.

Kryteria

  • Musi być wyznaczonym instruktorem z instytucji szkolnictwa wyższego, która posiada lub wdraża program IBM Skills Academy.
  • Musi mieć ukończone warsztaty IBM Data science practitioners - Instructors.
  • Musi zdobyć Odznaka Enterprise Design Thinking Practitioner.
  • Musi spełniać wymagania procesu walidacji nauczania IBM Skills Academy.