Перейти до основного вмісту

Курс практиків науки про дані

Введення

Наука про дані - це практика вилучення знань з величезних масивів даних за допомогою таких методів, як статистика, машинне навчання, інтелектуальний аналіз даних та предиктивна аналітика.

IBM SkillsBuild для академічних кіл

Огляд ЮА DA Практикуючий юрист

Цей курс пропонує вам взяти на себе різні ролі в команді з науки про дані, вирішуючи комплексні реальні сценарії в різних галузях.

Цілей

Фахівці з науки про дані

Використовуйте передові методи та інструменти науки про дані, використовуючи статистичні науки, технології машинного навчання та галузеві набори даних, щоб впроваджувати унікальні моделі даних, які можуть вирішувати складні проблеми в усіх галузях.

Цілі навчання:

  • Зрозумійте еволюцію та актуальність науки про дані у сучасному світі
  • Ознайомтеся з наскрізними випадками використання в галузі науки про дані, використовуючи життєвий цикл аналізу даних
  • Зрозумійте науковий метод, який використовується в проектах, і ключові ролі команди Data Science
  • Отримайте технічний досвід, використовуючи популярні фреймворки Data Science з відкритим кодом, включаючи ноутбуки Jupyter та Python
  • Отримайте конкурентну перевагу за допомогою хмарної платформи з низьким рівнем коду для Data Science - IBM Watson Studio
  • Зрозумійте методи інженерії даних та моделювання даних за допомогою машинного навчання
  • Дослідіть тематичні дослідження галузі науки про дані: транспорт, автомобілебудування, людські ресурси, аерокосмічна промисловість, банківська справа та охорона здоров'я
  • Досвід командної роботи та гнучких галузевих практик з використанням дизайн-мислення
  • Беріть участь у рольових сценаріях на основі викликів, щоб запропонувати реальні рішення.
Огляд SA DA Практикуючий юрист Мета статті

Наука про дані революціонізує те, як організації вирішують проблеми та отримують конкурентні переваги.

Що таке наука про дані?

У галузі Data Science вирішення проблем і відповіді на питання за допомогою аналізу даних є стандартною практикою. Часто дослідники даних будують моделі для прогнозування результатів або виявлення основних закономірностей з метою отримання кращого розуміння.

Організації можуть використовувати ці знання, щоб діяти і покращувати майбутні результати. Існує безліч технологій, що швидко розвиваються, які допомагають аналізувати дані та будувати моделі. За надзвичайно короткий час відбувся стрімкий перехід від настільних комп'ютерів до хостингу масивних паралельних сховищ з величезними обсягами даних; таким чином, відбувся відчутний перехід від аналітичних функцій у реляційних базах даних до неструктурованих інструментів для роботи з великими даними.

Аналітика неструктурованих або напівструктурованих даних стає все більш важливою для включення настроїв та іншої корисної інформації, написаної природною мовою, в моделі прогнозування; це часто призводить до значного покращення якості та точності моделей.

Нові підходи до аналітики прагнуть автоматизувати етапи побудови та застосування моделей, що робить технологію машинного навчання (ML) необхідним кроком на шляху до сучасної науки про дані.

Успішні ML-проекти вимагають поєднання алгоритмів + даних + команди та дуже потужної обчислювальної інфраструктури.

Data Scientist входить до трійки найкращих нових робочих місць

Хоча наука про дані як галузь існує вже кілька десятиліть, стрімке зростання штучного інтелекту (ШІ) в бізнесі за останні п'ять років призвело до того, що попит на науковців про дані значно перевищує кількість кваліфікованих фахівців. Сьогодні 63% керівників називають брак талантів основною перешкодою для впровадження технології штучного інтелекту[1]. Цей дефіцит талантів є можливістю для професіоналів-початківців і викликом для компаній, які прагнуть отримати конкурентну перевагу на ринку.

Згідно зі звітом LinkedIn Emerging Jobs[2], у 2020 році Data Scientist очолив список "нових робочих місць" три роки поспіль і, за прогнозами, буде зростати на 37% щорічно. Це спеціальність, яка продовжує значно зростати в усіх галузях, що пов'язано з еволюцією раніше існуючих робочих місць та посиленням уваги до даних в академічних дослідженнях.

Які навички потрібні вченому з даних, щоб бути успішним?

Наука про дані - це міждисциплінарний набір навичок, що знаходиться на перетині статистики, комп'ютерного програмування та галузевої експертизи. Вона складається з трьох окремих областей, що перетинаються:

  • Статистика, моделювання та підсумовування наборів даних
  • Інформатика, для проектування та використання алгоритмів для зберігання, обробки та візуалізації даних
  • Доменна експертиза, необхідна для формулювання правильних питань і розміщення відповідей в контексті
  • Інші навички, які часто пропускаються:
    1. Керівництво
    2. Спільної роботи
    3. Зв'язок

[1] Франческо Бренна, Джорджо Данесі, Гленн Фінч, Брайан Герінг і Маніш Гоял. «Перехід до штучного інтелекту корпоративного рівня: усунення прогалин у даних та навичках для усвідомлення цінності». IBM Institute for Business Value, вересень 2018 року. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "Звіт про нові робочі місця в США LinkedIn", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Тематичне дослідження

Вундерман Томпсон + IBM: підвищення рівня машинного навчання за допомогою даних та штучного інтелекту

Рекламний гігант, Вундерман Томпсон залучив IBM, щоб допомогти використовувати машинне навчання для кращого відкриття людських ідей – ідей, які допомагають підвищити рентабельність інвестицій для своїх клієнтів. За допомогою IBM Watson Studio і інструментів з відкритим кодом компанія і її клієнти тепер витрачають більше часу на відкриття і створення гіпотез і менше часу на повсякденні завдання.
Вундерман Томпсон + IBM

Індивідуальний алгоритм для виявлення потенційного шахрайства

Завдяки штучному інтелекту на алгоритмі виявлення шахрайства на основі IBM Cloud, запевняє Thélem, французька страхова компанія змогла виявити в п'ять разів більше потенційного шахрайства. Це призвело до зниження витрат, більшої гнучкості та можливості запобігти будь-якому можливому шахрайству. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Інструмент

У цьому курсі використовуються такі інструменти:

  • АвтоАІ
  • Хмара IBM
  • IBM Data Refinery
  • Зберігання об'єктів IBM
  • IBM Watson Машинне навчання
  • Студія IBM Watson
  • Візуальне розпізнавання IBM Watson
  • Зошит Юпітера
  • Матплотліб
  • Вузол.js
  • NumPy
  • Панди
  • PixieDust
  • Пітон
  • scikit-learn
  • XGBoost

Передумови

передумови інструктора

Фасилітатори, які проводять цей курс, пройшли його раніше та успішно склали іспит.

  • Завзятий спікер з хорошими презентаційними навичками
  • Педагогічні навички управління групою
  • Заохочуйте критичне мислення та дослідження доменів
  • Досвід роботи з наборами даних та авторськими правами на інтелектуальну власність

передумови учня

Особи, які активно зацікавлені в отриманні роботи початкового рівня для роботи в галузях, пов'язаних з кібербезпекою.

  • Знайомство зі статистикою
  • Базові навички ІТ-грамотності*

*Базова ІТ-грамотність - стосується навичок, необхідних для роботи на рівні користувача в середовищі графічної операційної системи, такої як Microsoft Windows® або Linux Ubuntu®, виконання основних операційних команд, таких як запуск програми, копіювання та вставка інформації, використання меню, вікон та периферійних пристроїв, таких як миша та клавіатура. Крім того, користувачі повинні бути знайомі з інтернет-браузерами, пошуковими системами, навігацією по сторінках та формами.

Цифрові облікові дані

Сертифікат практикуючого фахівця

Сертифікат IBM Data Science Practitioner

Сертифікат IBM Data Science Practitioner

Переглянути бейдж

Про цей сертифікат

Завдяки сертифікованому навчанню з Data Science під керівництвом викладача, учасники здобули навички та розуміння основних концепцій і технологій науки про дані. Вони продемонстрували знання та розуміння технічних питань науки про дані та дизайн-мислення. Здобувач отримав здатність застосовувати концепції та технології науки про дані з відповідними інструментами з відкритим кодом, які відповідають реальним сценаріям науки про дані, придатним для освітніх цілей.

Навички

Співпраця, Комунікація, Очищення даних, Збір даних, Інженерія даних, Операції з даними, Переробка даних, Наука про дані, Основи науки про дані, Методологія науки про дані, Візуалізація даних, Суперечки з даними, Глибоке навчання, Дизайн-мислення, Емпатія, Дизайн досвіду, IBM Cloud, IBM Watson, Ідея, Машинне навчання, Matplotlib, Розгортання моделей, Візуалізація моделей, Розуміння природної мови, Панди, Персони, Вирішення проблем, Розкадрування, Командна робота, Варіанти використання, Користувацький дизайн, Користувацький досвід, Користувацьке дослідження, UX, Візуальне розпізнавання, Watson discovery, Watson Studio.

Критерії

  • Повинен бути присутнім на тренінгу у вищому навчальному закладі, що реалізує програму IBM Skills Academy.
  • Повинен був пройти навчання практиків науки про дані, очолюваних інструктором.
  • Мабуть, заслужив Значок практика корпоративного дизайн-мислення.
  • Повинен скласти іспит з практиків Data science і задовільно виконати групову вправу.

Сертифікат інструктора

Сертифікат IBM Data Science Practitioner, значок інструктора IBM Data Science Practitioner

Сертифікат IBM Data Science Practitioner: Інструктор

Переглянути бейдж

Про цей сертифікат

Під час семінару під керівництвом інструктора IBM учасники здобули навички з концепцій, технологій та прикладів використання даних в науці про дані. Вони продемонстрували високий рівень володіння цими темами: Основи науки про дані, збір даних, розуміння даних, моделювання та оптимізація даних, дизайн-мислення для науки про дані та галузеві приклади використання науки про дані. Здобувач демонструє здатність викладати курс з науки про дані, застосовуючи педагогічні навички для управління груповою роботою з використанням сценаріїв, заснованих на проблемах.

Навички

Консультант, Комунікація, Очищення даних, Збір даних, Інженерія даних, Операції з даними, Обробка даних, Наука про дані, Основи науки про дані, Методологія науки про дані, Візуалізація даних, Суперечки з даними, Глибоке навчання, Дизайн-мислення, Емпатія, Дизайн досвіду, IBM Cloud, IBM Watson, Ідея, Лектор, Машинне навчання, Matplotlib, Розгортання моделей, Візуалізація моделей, Розуміння природної мови, Панди, Персони, Вирішення проблем, Розкадрування, Робота в команді, Тренер, Варіанти використання, Користувацько-орієнтований дизайн, Користувацький досвід, Користувацькі дослідження, UX, Візуальне розпізнавання, Watson discovery, Watson Studio.

Критерії

  • Повинен бути призначеним інструктором з вищого навчального закладу, який має або реалізує програму IBM Skills Academy.
  • Повинен був пройти семінар IBM Data science практиків – інструкторів.
  • Мабуть, заслужив Значок практика корпоративного дизайн-мислення.
  • Повинен відповідати вимогам IBM Skills Academy процес перевірки викладання.