數據科學從業者課程

介紹

數據科學是使用統計學、機器學習、數據挖掘和預測分析等方法從海量數據中提取知識的實踐。

IBM SkillsBuild 對於學術界

概述 SA DA 從業者

本課程挑戰你扮演數據科學團隊中涉及的不同角色,解決不同行業的端到端真實場景。

目標

數據科學從業者

使用先進的數據科學方法和工具,利用統計科學、機器學習技術和行業特定的數據集,實施獨特的資料模型,以解決所有行業的挑戰性問題。

學習目標:

  • 瞭解當今世界數據科學的發展和相關性
  • 使用數據分析生命週期探索端到端數據科學行業用例
  • 了解專案中使用的科學方法,以及數據科學團隊的關鍵角色
  • 使用流行的開源數據科學框架(包括 Jupyter 筆記本和 Python )獲取技術專業知識
  • 使用面向數據科學的基於雲的低代碼平臺獲得競爭優勢 — IBM Watson Studio
  • 使用機器學習了解數據工程和數據建模實踐
  • 探索數據科學行業案例研究:運輸、汽車、人力資源、航空航太、銀行和醫療保健
  • 使用設計思維體驗團隊合作和敏捷行業實踐
  • 參與基於角色扮演的挑戰場景,提出現實世界的解決方案。
概述 SA DA 從業者目標文章

數據科學正在徹底改變組織解決問題和獲得競爭優勢的方式。

什麼是數據科學?

在數據科學領域,通過數據分析解決問題和回答問題是標準做法。通常,數據科學家構建一個模型來預測結果或發現潛在的模式,目的是獲得更好的見解。

組織可以結合這些見解來採取行動並改善未來的結果。有許多快速發展的技術可以説明分析數據和構建模型。在極短的時間內,從桌面到託管具有大量數據的大規模並行倉庫取得了快速進展;這樣一來,從關係資料庫中的資料庫內分析功能到非結構化大數據工具的轉變是顯而易見的。

對非結構化或半結構化數據的分析變得越來越重要,以將自然語言編寫的情緒和其他有用資訊整合到預測模型中;這通常會導致模型品質和準確性的顯著提高。

新興的分析方法旨在實現模型構建和應用步驟的自動化,使機器學習 (ML) 技術成為向現代數據科學邁進的必要發展。

成功的機器學習專案需要演算法 + 資料 + 團隊的結合,以及非常強大的計算基礎設施。

數據科學家躋身新興職位前三名

儘管數據科學作為一個領域已經存在了幾十年,但在過去五年中,人工智慧 (AI) 在商業中的快速增長產生了對數據科學家的需求,遠遠超過了訓練有素的專業人員。如今,63%的高管認為缺乏人才是採用人工智慧技術的主要障礙[1]。這種人才缺口對於有抱負的專業人士來說是一個機會,對於在市場上尋求競爭優勢的公司來說也是一個挑戰。

根據LinkedIn新興工作報告[2],2020年,數據科學家連續三年位居「新興工作」榜首,預計每年增長37%。這是一個在所有行業中繼續顯著增長的專業,這歸因於以前現有工作的演變以及學術研究中對數據的日益重視。

數據科學家需要哪些技能才能取得成功?

數據科學是一套跨學科的技能,位於統計學、計算機程式設計和領域專業知識的交叉點。它包括三個不同且重疊的區域:

  • 統計,用於建模和匯總數據集
  • 計算機科學,設計和使用演算法來存儲、處理和可視化數據
  • 領域專業知識,這是制定正確問題並將答案置於上下文中所必需的
  • 其他經常錯過的技能是:
    1. 領導
    2. 團隊合作
    3. 通信

[1] 弗朗切斯科·布倫納、喬治·達內西、葛籣·芬奇、布萊恩·戈林和馬尼什·戈亞爾。“轉向企業級 AI:解決數據和技能差距以實現價值。”IBM 商業價值研究院,2018 年 9 月。 https://ibm.com/downloads/cas/QQ5KZLEL

[2] 《LinkedIn美國新興就業報告》,LinkedIn,2020 年。 https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

個案研究

Wunderman Thompson + IBM:利用數據和 AI 提升機器學習

廣告巨頭 Wunderman Thompson 聘請 IBM 説明利用機器學習來更好地發現人類洞察,從而幫助客戶提高投資回報率。在IBM Watson Studio和開源工具的説明下,該公司及其客戶現在花在發現和假設創建上的時間更多,而在日常任務上花費的時間更少。
Wunderman Thompson + IBM

檢測潛在欺詐的定製演算法

借助IBM Cloud驅動的 AI 欺詐檢測演算法 Thélem assurances,一家總部位於法國的保險公司能夠檢測到五倍以上的潛在欺詐行為。這降低了成本,提高了靈活性,並能夠先發制人地防止任何可能的欺詐行為。 ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

工具

本課程使用以下工具:

  • 自動人工智慧
  • IBM Cloud
  • IBM Data Refinery
  • IBM 物件存儲
  • IBM Watson Machine Learning
  • IBM Watson Studio
  • IBM Watson Visual Recognition
  • 朱彼特筆記本
  • Matplotlib
  • 節點.js
  • 數位派
  • 熊貓
  • 小精靈塵埃
  • scikit-learn
  • XGBoost

先決條件

講師先決條件

講授本課程的輔導員之前參加過該課程並成功通過了考試。

  • 具有良好演講技巧的狂熱演講者
  • 教學小組管理技能
  • 鼓勵批判性思維和領域探索
  • 處理數據集和智慧財產權版權的經驗

學習者先決條件

對申請入門級工作以在網路安全相關領域工作有積極興趣的個人。

  • 熟悉統計學
  • 基本的 IT 素養技能*

*基本 IT 素養 – 指在使用者級別操作圖形操作系統環境(如 Microsoft Windows® 或 Linux Ubuntu®)所需的技能,執行基本操作命令,例如啟動應用程式、複製和粘貼資訊、使用功能表、視窗和週邊設備(如滑鼠和鍵盤)。此外,使用者應熟悉互聯網瀏覽器、搜尋引擎、頁面導航和表單。

數字證書

執業證書

IBM 數據科學從業者證書

IBM 數據科學從業者證書

查看徽章

關於此證書

通過經過驗證的數據科學講師指導培訓,該證書獲得者獲得了對數據科學基本概念和技術的技能和理解。他們表現出對數據科學技術主題和設計思維的熟練程度和理解。收入者已經獲得了將數據科學的概念和技術與現實世界數據科學場景相關的適用開源工具應用的能力,這些工具適用於教育目的。

技能

協作、溝通、數據清理、數據收集、數據工程、數據運營、數據精鍊、數據科學、數據科學基礎、數據科學方法、數據可視化、數據整理、深度學習、設計思維、同理心、體驗設計、IBM Cloud、IBM Watson、構思、機器學習、Matplotlib、模型部署、模型可視化、自然語言理解、熊貓、角色、問題解決、故事板、團隊合作、用例、以使用者為中心設計、以使用者為中心、用戶體驗、使用者研究、用戶體驗、視覺識別、Watson 發現、Watson Studio。

標準

  • 必須參加實施IBM技能學院計劃的高等教育機構的培訓課程。
  • 必須完成講師指導的數據科學從業者培訓。
  • 必須已獲得 企業設計思維從業者徽章.
  • 必須通過數據科學從業者考試並圓滿完成小組練習。

講師證書

IBM 數據科學從業者證書講師徽章

IBM 數據科學從業者證書:講師

查看徽章

關於此證書

通過IBM講師指導的研討會,這位證書獲得者獲得了數據科學概念、技術和用例方面的技能。他們精通以下主題:數據科學基礎、數據收集、數據理解、數據建模和優化、數據科學的設計思維以及數據科學行業用例。獲得者通過應用教學技能來使用基於挑戰的場景來推動小組工作,從而展示了教授數據科學課程的能力。

技能

顧問, 溝通, 數據清理, 數據收集, 數據工程, 數據操作, 數據精鍊, 數據科學, 數據科學基礎, 數據科學方法論, 數據可視化, 數據整理, 深度學習, 設計思維, 同理心, 體驗設計, IBM Cloud, IBM Watson, 構思, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 用例, 用例, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 用例, 用例, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 用例, 用例, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 用例, 用例, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 用例, 用例, 講師, 機器學習, Matplotlib, 模型部署, 模型可視化, 自然語言理解, 熊貓, 角色, 解決問題, 故事板, 團隊合作, 培訓師, 以使用者為中心的設計、以使用者為中心、用戶體驗、使用者研究、用戶體驗、視覺識別、Watson 發現、Watson Studio。

標準

  • 必須是已經或正在實施IBM技能學院計劃的高等教育機構的指定講師。
  • 必須完成IBM數據科學從業者 – 講師研討會。
  • 必須已獲得 企業設計思維從業者徽章.
  • 必須滿足IBM技能學院教學驗證過程的要求。