データサイエンスプラクティショナーコース

はじめに

データサイエンスとは、統計学、機械学習、データマイニング、予測分析などの手法を用いて、大量のデータから知識を抽出することである。

IBM SkillsBuild for Academia(IBMスキルズビルド フォー アカデミア

概要 SA DA プラクティショナー

このコースでは、データサイエンスチームに関わるさまざまな役割に挑戦し、さまざまな業界のエンドツーエンドの実世界シナリオを解決します。

目標

データサイエンス実務者

統計科学、機械学習技術、業界固有のデータセットを活用した高度なデータサイエンスの手法とツールを用いて、あらゆる業界の難問を解決する独自のデータモデルを実装する。

学習目標

  • 今日の世界におけるデータサイエンスの進化と関連性を理解する。
  • データ分析のライフサイクルを利用したエンドツーエンドのデータサイエンス業界のユースケースの探求
  • プロジェクトで採用されている科学的手法と、データサイエンスチームの重要な役割を理解する。
  • Jupyter notebooksやPythonなど、オープンソースのデータサイエンスフレームワークを利用した技術的な専門知識の習得
  • データ・サイエンスのためのローコード・クラウド・ベース・プラットフォーム-IBM Watson Studioを使用して競争力を高める
  • 機械学習を用いたデータエンジニアリング、データモデリングの実践を理解する。
  • データサイエンス業界のケーススタディ:運輸、自動車、人事、航空宇宙、銀行、医療を探る
  • デザイン思考を用いたチームワークとアジャイルな業界慣習の経験
  • 課題解決型シナリオのロールプレイングを行い、現実世界の解決策を提案する。
概要 SA DA プラクティショナー オブジェクティブ 記事

データサイエンスは、組織が問題を解決し、競争上の優位性を獲得する方法に革命をもたらしている。

データサイエンスとは?

データサイエンスの領域では、データ分析を通じて問題を解決し、質問に答えることが標準的な手法である。多くの場合、データサイエンティストは、より良い洞察を得ることを目的として、結果を予測したり、根本的なパターンを発見したりするためにモデルを構築する。

組織はこれらの洞察を取り入れて行動し、将来の成果を改善することができる。データを分析し、モデルを構築するためのテクノロジーは急速に進化している。このように、リレーショナル・データベースのデータベース内分析機能から非構造化ビッグデータ・ツールへの明白な変革が起こっている。

非構造化データまたは半構造化データの分析は、自然言語で書かれたセンチメントやその他の有用な情報を予測モデルに組み込むことがますます重要になってきています。

新たなアナリティクス・アプローチは、モデル構築と応用のステップを自動化しようとするもので、機械学習(ML)技術を現代のデータサイエンスに向けた必要な進化にしている。

MLプロジェクトを成功させるには、アルゴリズム+データ+チーム、そして非常に強力なコンピューティング・インフラの組み合わせが必要だ。

データサイエンティスト、新興職種トップ3にランクイン

データサイエンスという分野は数十年前から存在していたが、過去5年間におけるビジネスにおける人工知能(AI)の急速な成長により、訓練された専門家をはるかに上回るデータサイエンティストへの需要が生まれている。現在、エグゼクティブの63%が、AI技術を採用する際の主な障壁として人材不足を挙げている[1]。この人材格差は、プロフェッショナルを目指す人にとってはチャンスであり、市場での競争優位を目指す企業にとっては課題である。

LinkedIn Emerging Jobsレポート[2]によると、2020年、データサイエンティストは3年連続で「Emerging Jobs」リストのトップになり、毎年37%の成長が予測されている。データ・サイエンティストは、あらゆる業界で大きく成長し続けている専門職であり、以前からある職種の進化や、学術研究におけるデータ重視の高まりがその要因となっている。

データサイエンティストが成功するために必要なスキルとは?

データサイエンスは、統計学、コンピュータプログラミング、専門分野の交差点に見られる学際的なスキルセットである。データサイエンスは、3つの異なる重複する領域から構成されている:

  • 統計学、データセットのモデル化と要約のため
  • データの保存、処理、可視化のためのアルゴリズムを設計し使用する、コンピュータサイエンス
  • 正しい問いを立て、その答えを文脈に即して導き出すために必要な領域に関する専門知識
  • その他、見逃しがちなスキルは
    1. リーダーシップ
    2. チームワーク
    3. コミュニケーション

[1] Francesco Brenna, Giorgio Danesi, Glenn Finch, Brian Goehring, Manish Goyal."エンタープライズグレードAIへのシフト:価値を実現するためのデータとスキルのギャップを解消する".IBM Institute for Business Value, September 2018. https://ibm.com/downloads/cas/QQ5KZLEL

[2] 「LinkedIn U.S. Emerging Jobs Report」、LinkedIn、2020年。 https://business.linkedin.com/content/dam/me/business/en-us/talent-solutions/emerging-jobs-report/Emerging_Jobs_Report_U.S._FINAL.pdf

事例紹介

ワンダーマン トンプソン+IBM。データとAIで機械学習を高度化する

広告大手のWunderman Thompsonは、機械学習によるヒューマンインサイトの発見を支援するため、IBMを採用しました。IBM Watson Studioとオープンソースツールの支援により、同社とそのクライアントは、発見と仮説の作成に多くの時間を費やし、平凡なタスクに費やす時間を減らすことができるようになったのです。
ワンダーマン トンプソン+IBM

不正の可能性を検知するためのカスタマイズされたアルゴリズム

IBM Cloudで駆動するAIによる不正検出アルゴリズムにより、フランスに拠点を置く保険会社Thélem assurancesは、5倍もの潜在的な不正を検出することができました。その結果、コストの削減、柔軟性の向上、そして不正の可能性を事前に察知することができるようになったのです。 ibm.com/case-studies/thelem-assurances-hybrid-cloud-services

ツール

このコースでは、以下のツールを使用します。

  • オートアイ
  • IBMクラウド
  • IBM データ・リファイナリー
  • IBMオブジェクト・ストレージ
  • IBM Watson Machine Learning
  • IBM Watson Studio
  • IBM Watson Visual Recognition
  • Jupyterノートブック
  • Matplotlib
  • ノードジッ
  • ナムパイ
  • パンダ
  • ピクシーダスト
  • パイソン
  • スキットラーン
  • XGBoost

前提条件

講師の前提条件

このコースを提供するファシリテーターは、以前にこのコースを受講し、試験に合格しています。

  • プレゼンテーション能力のある熱心なスピーカー
  • 教育的なグループ管理能力
  • 批判的思考と領域の探求を促す
  • データセットやIP著作権の取り扱い経験

学習者の前提条件

サイバーセキュリティ関連分野で働くために、初級職への応募に積極的な関心を持つ個人。

  • 統計学に精通していること
  • 基本的なITリテラシーのスキル*。

*基本的なITリテラシー - Microsoft Windows®やLinux Ubuntu®などのグラフィカル・オペレーティング・システム環境をユーザーレベルで操作し、アプリケーションの起動、情報のコピー&ペースト、メニュー、ウィンドウ、マウスやキーボードなどの周辺機器の使用など、基本的な操作コマンドを実行するために必要なスキルを指します。さらに、インターネット・ブラウザ、検索エンジン、ページ・ナビゲーション、フォームにも精通している必要があります。

デジタル・クレデンシャル

プラクティショナー・サーティフィケート

IBMデータサイエンス・プラクティショナー認定証

IBMデータサイエンス・プラクティショナー認定証

バッジを見る

この証明書について

この資格取得者は、有効なデータサイエンス・インストラクター主導のトレーニングを通じて、データサイエンスの基礎概念および技術に関するスキルと理解を習得している。データサイエンスの技術的トピックとデザイン思考について習熟し、理解している。この資格取得者は、教育目的に適した、実世界のデータサイエンス・シナリオに関連する適用可能なオープンソース・ツールを使用して、データサイエンスの概念と技術を適用する能力を獲得しています。

スキル

コラボレーション, コミュニケーション, データクレンジング, データ収集, データエンジニアリング, データオペレーション, データ精製, データサイエンス, データサイエンスの基礎, データサイエンスの方法論, データ可視化, データ整理, ディープラーニング, デザイン思考, 共感, エクスペリエンスデザイン, IBM Cloud, IBM Watson、アイディエーション, 機械学習, Matplotlib, モデルの展開, モデルの視覚化, 自然言語理解, パンダ, ペルソナ, 問題解決, ストーリーボード, チームワーク, ユースケース, ユーザー中心設計, ユーザー中心, ユーザーエクスペリエンス, ユーザーリサーチ, UX, 視覚認識, Watson discovery, Watson Studio.

基準

  • IBM Skills Academyプログラムを実施している高等教育機関のトレーニングセッションに参加すること。
  • インストラクターによるデータサイエンス実務者研修を修了していること。
  • を獲得している必要があります。 エンタープライズデザイン思考プラクティショナーバッジ.
  • データサイエンス実務者試験に合格し、グループ演習を満足にこなせること。

インストラクター認定証

IBM Data Science Practitioner Certificate インストラクター・バッジ

IBMデータサイエンス・プラクティショナー認定証:インストラクター

バッジを見る

この証明書について

この資格取得者は、IBM インストラクター主導のワークショップを通じて、データ・サイエンスの概念、テクノロジー、およびユース・ケースのスキルを習得した。また、以下のトピックについて習熟していることを証明した:データ・サイエンスの基礎、データ収集、データ理解、データ・モデリングと最適化、データ・サイエンスのためのデザイン思考、データ・サイエンス業界の使用事例。課題ベースのシナリオを使用したグループワークを推進するための教育学的スキルを適用することで、データサイエンスコースを教える能力を実証している。

スキル

アドバイザー, コミュニケーション, データクレンジング, データ収集, データエンジニアリング, データオペレーション, データ精製, データサイエンス, データサイエンス基礎, データサイエンス方法論, データ可視化, データ整理, ディープラーニング, デザイン思考, 共感, エクスペリエンスデザイン, IBM Cloud, IBM Watson, アイデア, 講師、機械学習, Matplotlib, モデルの展開, モデルの視覚化, 自然言語理解, pandas, ペルソナ, 問題解決, ストーリーボード, チームワーク, トレーナー, ユースケース, ユーザー中心設計, ユーザー中心, ユーザーエクスペリエンス, ユーザーリサーチ, UX, 視覚認識, Watson discovery, Watson Studio.

基準

  • IBM Skills Academy プログラムを実施している、または実施中の高等教育機関の指定講師であること。
  • IBMデータサイエンスプラクティショナー - インストラクターワークショップを修了していること。
  • を獲得している必要があります。 エンタープライズデザイン思考プラクティショナーバッジ.
  • IBM Skills Academyのティーチングバリデーションプロセスの要件を満たしていること。