データサイエンティスト育成講座
Python基礎・機械学習入門

研修

プログラム概要

Pythonを使ったデータの処理・分析とグラフ作成、機械学習の基本的なスキルが身につきます。

対象者

AI・機械学習プロジェクトを推進する方

メリット

Pythonの基本的な文法と、機械学習の代表的なアプローチを学んでいただけます。このプログラム終了後には、さらに専門的な講座の受講が可能となります。

受講料

受講人数に応じて、お見積りを作成いたします

受講前提

プログラム経験のある方

学習目標

Pythonによるデータ集計と機械学習の基本的な手法を身につける

カリキュラム

Python基礎講座

演習

・データ分析環境について
 ⚪︎Pythonについて
 ⚪︎Anacondaについて
 ⚪︎Jupyter Notebookとは
 ⚪︎Jupyter Notebookの基本操作
・Python文法基礎
 ⚪︎コメント
 ⚪︎画面への出力
 ⚪︎データ型:数値、文字列、ブール値、リスト、タプル、辞書型
 ⚪︎変数
 ⚪︎演算:加減乗除
 ⚪︎制御文:if文、while文
・ライブラリの読み込み
・Pythonでデータハンドリング
 ⚪︎pandasとは
 ⚪︎Series / DataFrameの利用
 ⚪︎データの確認
 ⚪︎Column / Indexの操作
 ⚪︎データの抽出
 ⚪︎データのソート
 ⚪︎データの結合
 ⚪︎データの集約処理
 ⚪︎重複除外 / 欠損値補完
・Pythonによる可視化 データ可視化の意義
 ⚪︎可視化の目的とグラフ種類
 ⚪︎ヒストグラムの作成
 ⚪︎棒グラフの作成
 ⚪︎散布図の作成
 ⚪︎折れ線グラフの作成
 ⚪︎pandasとMatplotlib
・総合演習:pandas / Matplotlibドリル
・データハンドリング + 可視化ケーススタディ
 ⚪︎新規ユーザー向けプロモーションの影響を分解する
 ⚪︎セグメントユーザー数減少の原因を明らかにする

講義時間

2日間 ※ご要望によって、短縮版、拡大版のご提供が可能です

受講料

6名までの場合:800,000円(税抜)
※受講人数に応じてお見積りいたします
※講座内容はカスタマイズ可能です。カスタマイズの際は別途お見積りいたします。

機械学習入門

演習

・機械学習とは
・機械学習を用いたデータ分析の流れ
・データ前処理
 ⚪︎欠損値補完
 ⚪︎順序特徴量のマッピング
 ⚪︎名義特徴量のエンコーディング
 ⚪︎正規化・標準化
・モデルの評価
 ⚪︎回帰問題の評価(決定係数 / MAE / RMSE)
 ⚪︎分類問題の評価(Confusion Matrix / ROC曲線)
 ⚪︎モデルの過学習
 ⚪︎ホールドアウト / クロスバリデーション
・機械学習の実装
 ⚪︎scikit-learnの概要
 ⚪︎主なモジュール
 ⚪︎モデルの実装
・機械学習の手法(概要)
・回帰分析の手法
 ⚪︎単回帰、重回帰、罰則項を利用した回帰
 ⚪︎Lasso回帰 / Ridge回帰 / Elastic Net
 ⚪︎SVMを利用した回帰(SVR)
・分類の手法
 ⚪︎ロジスティック回帰、決定木、Random Forest、XGBoost
 ⚪︎クラスタリング
  ⚪︎K-Means、DBSCAN、混合ガウス、階層クラスタリング
 ⚪︎次元削減・圧縮
  ▪︎主成分分析(PCA)、Non-negative Matrix Factrization(NMF)
  ▪︎t-SNE、UMAP
・精度向上のテクニック
 ⚪︎パラメータチューニング
 ⚪︎特徴選択(Lassoを利用 / Random https://datumstudio.jp/analytics-education/Forestを利用)
 ⚪︎グループ演習:タイタニックデータを用いた生存者予測
・不均衡データ分析の概要
 ⚪︎不均衡データ分析の難しさ
 ⚪︎不均衡データ分析へのアプローチ
 ⚪︎不均衡データ分析の実践
  ▪︎imbalanced-learn
  ▪︎Random undersampling、Cluster-based undersampling
  ▪︎Random oversampling、SMOTE、SMOTEENN、SMOTETomek
  ▪︎コスト関数の調整
・グループ演習

講義時間

3日間 ※ご要望によって、短縮版、拡大版のご提供が可能です

受講料

6名までの場合:1,500,000円(税抜)
※受講人数に応じてお見積りいたします
※講座内容はカスタマイズ可能です。カスタマイズの際は別途お見積りいたします。