Перейти к основному содержанию

Курс для практикующих специалистов по науке о данных

Введение

Наука о данных - это практика извлечения знаний из огромных массивов данных с помощью таких методов, как статистика, машинное обучение, интеллектуальный анализ данных и предиктивная аналитика.

IBM SkillsBuild для академических кругов

Обзор SA DA Практик

В рамках этого курса вам предстоит взять на себя различные роли в команде специалистов по науке о данных, решая сквозные реальные задачи в различных отраслях.

Цели

Практикующие специалисты в области науки о данных

Использовать передовые методы и инструменты Data science, применяя статистические науки, технологии машинного обучения и отраслевые наборы данных, для реализации уникальных моделей данных, позволяющих решать сложные задачи во всех отраслях.

Цели обучения:

  • Понять эволюцию и актуальность науки о данных в современном мире
  • Изучите сквозные примеры использования Data Science в отрасли, используя жизненный цикл анализа данных
  • Понимание научного метода, используемого в проектах, и ключевых ролей команды Data Science
  • Приобретение технического опыта использования популярных фреймворков Data Science с открытым исходным кодом, включая блокноты Jupyter и Python
  • Получите конкурентное преимущество с помощью облачной платформы для Data Science с низким содержанием кода - IBM Watson Studio
  • Понимание методов инженерии данных и моделирования данных с использованием машинного обучения
  • Изучите тематические исследования в области Data Science: транспорт, автомобилестроение, управление персоналом, аэрокосмическая промышленность, банковское дело и здравоохранение.
  • Опыт командной работы и применения гибких отраслевых практик с использованием проектного мышления
  • Участвуйте в ролевых играх по сценариям, основанным на задачах, чтобы предложить реальные решения.
Обзор SA DA Практик Цель Статья

Наука о данных революционизирует способы решения проблем и получения конкурентных преимуществ.

Что такое наука о данных?

В области Data Science решение проблем и ответы на вопросы с помощью анализа данных являются стандартной практикой. Часто ученые, занимающиеся изучением данных, строят модель для предсказания результатов или обнаружения скрытых закономерностей с целью получения более глубоких знаний.

Организации могут использовать эти данные для принятия мер и улучшения будущих результатов. Существует множество быстро развивающихся технологий, помогающих анализировать данные и строить модели. За удивительно короткое время произошел стремительный переход от настольных компьютеров к хостингу массивных параллельных хранилищ с огромными объемами данных; таким образом, происходит ощутимая трансформация от аналитических функций в реляционных базах данных к инструментам для работы с неструктурированными большими данными.

Аналитика неструктурированных или полуструктурированных данных приобретает все большее значение для включения настроений и другой полезной информации, записанной на естественном языке, в прогностические модели; это часто приводит к значительному повышению качества и точности моделей.

Появляющиеся подходы к аналитике направлены на автоматизацию этапов построения и применения моделей, что делает технологию машинного обучения (ML) необходимой эволюцией на пути к современной Data science.

Для успешных ML-проектов требуется сочетание алгоритмов + данные + команда, а также очень мощная вычислительная инфраструктура.

Data Scientist входит в тройку лучших новых профессий

Хотя наука о данных как область существует уже несколько десятилетий, стремительный рост искусственного интеллекта (ИИ) в бизнесе в последние пять лет вызвал спрос на специалистов по изучению данных, значительно превышающий доступность подготовленных профессионалов. Сегодня 63% руководителей называют нехватку кадров главным препятствием для внедрения технологий ИИ[1]. Этот дефицит кадров - возможность для начинающих специалистов и проблема для компаний, стремящихся получить конкурентное преимущество на рынке.

Согласно отчету LinkedIn Emerging Jobs[2], в 2020 г. специалист по изучению данных уже три года подряд возглавляет список "новых рабочих мест" и, по прогнозам, будет расти на 37% в год. Эта специальность продолжает активно развиваться во всех отраслях, что объясняется эволюцией ранее существовавших профессий и усилением внимания к данным в научных исследованиях.

Какие навыки необходимы специалисту по анализу данных для успешной работы?

Наука о данных - это междисциплинарный набор навыков, возникающих на стыке статистики, компьютерного программирования и знаний о предметной области. Она включает в себя три различные и частично пересекающиеся области:

  • Статистика, для моделирования и обобщения массивов данных
  • Информатика, чтобы разрабатывать и использовать алгоритмы для хранения, обработки и визуализации данных
  • Экспертные знания, необходимые для формулирования правильных вопросов и включения ответов в контекст
  • Часто упускаются и другие навыки:
    1. Лидерство
    2. Работа в команде
    3. Общение

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring and Manish Goyal. "Shifting toward Enterprise-grade AI: Resolving data and skills gaps to realize value". IBM Institute for Business Value, сентябрь 2018 года. https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn U.S. Emerging Jobs Report", LinkedIn, 2020. https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

Тематическое исследование

Wunderman Thompson + IBM: Повышение эффективности машинного обучения с помощью данных и ИИ

Рекламный гигант Wunderman Thompson привлек IBM для использования машинного обучения в целях более эффективного обнаружения человеческих инсайтов - инсайтов, которые помогают повысить рентабельность инвестиций для их клиентов. С помощью IBM Watson Studio и инструментов с открытым исходным кодом компания и ее клиенты теперь тратят больше времени на поиск и создание гипотез и меньше времени на выполнение рутинных задач.
Wunderman Thompson + IBM

Настроенный алгоритм для выявления потенциального мошенничества

Благодаря алгоритму обнаружения мошенничества на основе искусственного интеллекта на IBM Cloud, французская страховая компания Thélem assurances смогла обнаружить в пять раз больше потенциальных случаев мошенничества. Это привело к снижению затрат, повышению гибкости и возможности упредить любое возможное мошенничество. ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

Инструменты

В этом курсе используются следующие инструменты:

  • AutoAI
  • Облако IBM
  • IBM Data Refinery
  • IBM Object Storage
  • Машинное обучение IBM Watson
  • Студия IBM Watson
  • Визуальное распознавание IBM Watson
  • Блокнот Jupyter
  • Matplotlib
  • Node.js
  • NumPy
  • Панды
  • PixieDust
  • Python
  • scikit-learn
  • XGBoost

Пререквизиты

Пререквизиты преподавателя

Фасилитаторы, проводящие данный курс, ранее проходили этот курс и успешно сдали экзамен.

  • Заядлый оратор с хорошими навыками презентации
  • Навыки управления педагогическими группами
  • Поощряйте критическое мышление и изучение доменов
  • Опыт работы с наборами данных и авторскими правами ИС

Необходимые условия для учащихся

Лица, проявляющие активный интерес к соисканию вакансий начального уровня для работы в областях, связанных с кибербезопасностью.

  • Знакомство со статистикой
  • Базовые навыки ИТ-грамотности*

*Базовая ИТ-грамотность - навыки, необходимые для работы на уровне пользователя в среде графических операционных систем, таких как Microsoft Windows® или Linux Ubuntu®, выполнения основных команд, таких как запуск приложений, копирование и вставка информации, использование меню, окон и периферийных устройств, таких как мышь и клавиатура. Кроме того, пользователи должны быть знакомы с интернет-браузерами, поисковыми системами, навигацией по страницам и формами.

Цифровое удостоверение

Сертификат практикующего специалиста

Сертификат IBM Data Science Practitioner

Сертификат IBM Data Science Practitioner

Видеть значок

О данном сертификате

В ходе подтвержденного обучения под руководством преподавателя по науке о данных слушатель приобрел навыки и понимание основополагающих концепций и технологий науки о данных. Они продемонстрировали навыки и понимание технических тем Data Science и проектного мышления. Слушатель приобрел способность применять концепции и технологии Data Science с использованием применимых инструментов с открытым исходным кодом, которые относятся к реальным сценариям Data Science, пригодным для использования в образовательных целях.

Навыки

Сотрудничество, Коммуникация, Очистка данных, Сбор данных, Инжиниринг данных, Операции с данными, Переработка данных, Наука о данных, Основы науки о данных, Методология науки о данных, Визуализация данных, Сбор данных, Глубокое обучение, Дизайн-мышление, Эмпатия, Проектирование опыта, IBM Cloud, IBM Watson, Идеи, машинное обучение, Matplotlib, развертывание моделей, визуализация моделей, понимание естественного языка, pandas, Personas, решение проблем, Storyboarding, Teamwork, Use cases, User-centered design, User-centric, User experience, User research, UX, Visual recognition, Watson discovery, Watson Studio.

Критерии

  • Должен пройти обучение в высшем учебном заведении, реализующем программу IBM Skills Academy.
  • Должен пройти обучение под руководством инструктора по подготовке практиков в области науки о данных.
  • Должен заслужить Значок практикующего специалиста по корпоративному дизайн-мышлению.
  • Должен сдать экзамен для практикующих специалистов по науке о данных и удовлетворительно выполнить групповое упражнение.

Сертификат инструктора

IBM Data Science Practitioner Certificate Instructor Badge

Сертификат IBM Data Science Practitioner: Инструктор

Видеть значок

О данном сертификате

В ходе семинара, проведенного под руководством инструктора IBM, этот обладатель сертификата приобрел навыки в области концепций, технологий и примеров использования науки о данных. Они продемонстрировали свои знания по следующим темам: Основы науки о данных, Сбор данных, Понимание данных, Моделирование и оптимизация данных, Дизайн-мышление для науки о данных и Примеры использования науки о данных в промышленности. Участник демонстрирует способность преподавать курс по науке о данных, применяя педагогические навыки для организации групповой работы с использованием сложных сценариев.

Навыки

Консультант, Коммуникация, Очистка данных, Сбор данных, Инженерия данных, Операции с данными, Переработка данных, Наука о данных, Основы науки о данных, Методология науки о данных, Визуализация данных, Обработка данных, Глубокое обучение, Дизайн-мышление, Эмпатия, Проектирование опыта, IBM Cloud, IBM Watson, Идеология, Лектор, Машинное обучение, Matplotlib, развертывание моделей, визуализация моделей, понимание естественного языка, pandas, Personas, решение проблем, Storyboarding, Teamwork, Trainer, Use cases, User-centered design, User-centric, User experience, User research, UX, Visual recognition, Watson discovery, Watson Studio.

Критерии