数据科学从业人员课程

简介

数据科学是利用统计学、机器学习、数据挖掘和预测分析等方法,从海量数据中提取知识的实践。

IBM SkillsBuild for Academia

SA DA从业人员概述

本课程让您挑战数据科学团队中的不同角色,解决不同行业的端到端真实场景。

目标

数据科学工作者

使用先进的数据科学方法和工具,利用统计科学、机器学习技术和特定行业的数据集,实施独特的数据模型,解决各行各业的难题。

学习目标。

  • 了解数据科学在当今世界的演变和相关性
  • 利用数据分析生命周期探索端到端的数据科学行业使用案例
  • 了解项目中采用的科学方法,以及数据科学团队的关键作用
  • 掌握使用流行的开源数据科学框架的技术专长,包括Jupyter笔记本和Python
  • 使用基于低代码的数据科学云平台获得竞争优势--IBM Watson Studio
  • 了解使用机器学习的数据工程和数据建模实践
  • 探索数据科学行业案例:交通、汽车、人力资源、航空航天、银行和医疗保健
  • 体验团队合作和使用设计思维的敏捷行业实践
  • 参与基于挑战的角色扮演,提出真实世界的解决方案。
概述SA DA从业人员的目标条款

数据科学正在彻底改变组织解决问题和获得竞争优势的方式。

什么是数据科学?

在数据科学领域,通过数据分析解决问题和回答问题是标准做法。通常,数据科学家会构建一个模型来预测结果或发现潜在的模式,目的是获得更好的洞察力。

各组织可以将这些见解纳入行动,改善未来的成果。有许多快速发展的技术可以帮助分析数据和建立模型。在极短的时间内,从台式机到托管拥有海量数据的大规模并行仓库,已经取得了突飞猛进的发展;这样,从关系数据库中的数据库内分析功能到非结构化大数据工具,已经发生了明显的转变。

对非结构化或半结构化数据进行分析正变得越来越重要,以便将情感和其他以自然语言编写的有用信息纳入预测模型;这通常会显著提高模型的质量和准确性。

新兴的分析方法力求实现模型构建和应用步骤的自动化,这使得机器学习(ML)技术成为现代数据科学的必要发展方向。

成功的 ML 项目需要算法+数据+团队的组合,以及非常强大的计算基础设施。

数据科学家跻身三大新兴职位之列

尽管数据科学作为一个领域已经存在了几十年,但在过去的五年里,人工智能(AI)在商业领域的快速发展对数据科学家的需求远远超过了训练有素的专业人员。如今,63% 的高管认为人才缺乏是采用人工智能技术的主要障碍[1]。这种人才缺口对于有抱负的专业人士来说是一个机遇,而对于努力在市场中获得竞争优势的公司来说则是一个挑战。

根据 LinkedIn 的《2020 年新兴职位报告》[2],数据科学家已连续三年荣登 "新兴职位 "榜首,预计年增长率将达到 37%。这是一个在各行各业都持续大幅增长的专业,归因于以前存在的工作的演变和学术研究对数据的日益重视。

数据科学家需要什么技能才能成功?

数据科学是统计学、计算机编程和领域专业知识交汇处的一套跨学科技能。它包括三个不同但相互重叠的领域:

  • 统计学,对数据集进行建模和总结
  • 计算机科学,设计和使用算法来存储、处理和可视化数据
  • 领域的专业知识,是提出正确的问题并将答案放在背景中的必要条件
  • 其他经常被忽略的技能是。
    1. 领导人
    2. 团队合作
    3. 沟通

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring and Manish Goyal."向企业级人工智能转变:解决数据和技能差距以实现价值"。IBM商业价值研究所,2018年9月。 https://ibm.com/downloads/cas/QQ5KZLEL

[2] "LinkedIn美国新兴工作报告",LinkedIn,2020。 https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

案例研究

Wunderman Thompson + IBM。用数据和人工智能提升机器学习

广告巨头Wunderman Thompson与IBM合作,帮助采用机器学习来更好地发现人类的洞察力--这些洞察力有助于提高他们客户的投资回报率。在IBM Watson Studio和开源工具的帮助下,该公司及其客户现在将更多的时间用于发现和创造假设,而将更少的时间用于平凡的任务。
Wunderman Thompson + IBM

一个定制的算法来检测潜在的欺诈行为

通过IBM云上的人工智能驱动的欺诈检测算法,法国的一家保险公司Thélem assurances能够检测出五倍的潜在欺诈。这导致了成本的降低,更大的灵活性,以及预先阻止任何可能的欺诈行为的能力。 ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

工具类

本课程使用以下工具。

  • 傲慢与偏见
  • IBM云计算
  • IBM数据精炼
  • IBM对象存储
  • IBM Watson机器学习
  • IBM Watson工作室
  • IBM Watson视觉识别
  • Jupyter 笔记本
  • 矩阵图(Matplotlib
  • Node.js
  • NumPy
  • 熊猫
  • 小精灵之尘
  • 蟒蛇
  • scikit-learn
  • XGBoost

先决条件

教员的先决条件

讲授本课程的讲师必须曾参加过该课程并顺利通过考试。

  • 热衷于演讲,具有良好的演讲技巧
  • 教学小组管理技能
  • 鼓励批判性思维和领域探索
  • 处理数据集和知识产权版权的经验

学习者的先决条件

有意申请网络安全相关领域初级职位的个人。

  • 熟悉统计学
  • 基本的IT知识技能*。

*基本信息技术素养--指在用户层面操作图形操作系统环境(如 Microsoft Windows® 或 Linux Ubuntu®),执行基本操作指令(如启动应用程序、复制和粘贴信息、使用菜单、窗口以及鼠标和键盘等外围设备)所需的技能。此外,用户还应熟悉互联网浏览器、搜索引擎、页面导航和表格。

数字凭证

执业医师证书

IBM数据科学实践者证书

IBM数据科学实践者证书

查看徽章

关于此证书

通过经过验证的数据科学讲师指导培训,该证书获得者已经掌握了数据科学基础概念和技术的技能和理解。他们已熟练掌握并理解数据科学的技术主题和设计思维。证书获得者已获得将数据科学的概念和技术与适用的开源工具相结合的能力,这些工具与现实世界的数据科学场景相关,适合教育目的。

技能

协作、沟通、数据清理、数据收集、数据工程、数据操作、数据提炼、数据科学、数据科学基础、数据科学方法论、数据可视化、数据整理、深度学习、设计思维、移情、体验设计、IBM Cloud、IBM Watson、构思, 机器学习, Matplotlib, 模型部署, 模型可视化, 自然语言理解, pandas, Personas, 解决问题, 故事板, 团队合作, 用例, 以用户为中心的设计, 以用户为中心, 用户体验, 用户研究, 用户体验, 视觉识别, Watson discovery, Watson Studio.

标准

  • 必须参加实施IBM技能学院计划的高等教育机构的培训课程。
  • 必须完成由教师指导的数据科学从业人员培训。
  • 必须获得 企业设计思维从业者徽章.
  • 必须通过数据科学从业人员考试并圆满完成小组练习。

教员证书

IBM数据科学实践者证书指导员徽章

IBM 数据科学从业者证书:讲师

查看徽章

关于此证书

通过 IBM 讲师指导的研讨会,该证书获得者掌握了数据科学概念、技术和用例方面的技能。他们已熟练掌握了这些主题:数据科学基础、数据收集、数据理解、数据建模与优化、数据科学设计思维以及数据科学行业用例。获得者通过应用教学技能,利用基于挑战的情景推动小组工作,展示了教授数据科学课程的能力。

技能

顾问, 沟通, 数据清理, 数据收集, 数据工程, 数据操作, 数据提炼, 数据科学, 数据科学基础, 数据科学方法论, 数据可视化, 数据整理, 深度学习, 设计思维, 同理心, 体验设计, IBM Cloud, IBM Watson, 构想, 讲师、机器学习、Matplotlib、模型部署、模型可视化、自然语言理解、pandas、角色、解决问题、故事板、团队合作、培训师、用例、以用户为中心的设计、以用户为中心、用户体验、用户研究、用户体验、视觉识别、沃森发现、沃森工作室。

标准

  • 必须是已经或正在实施IBM技能学院项目的高等教育机构的指定讲师。
  • 必须完成IBM数据科学从业人员--指导员研讨会。
  • 必须获得 企业设计思维从业者徽章.
  • 必须满足IBM技能学院教学验证程序的要求。