データサイエンティスト育成講座Python基礎・機械学習入門
プログラム概要
Pythonを使ったデータの処理・分析とグラフ作成、機械学習の基本的なスキルが身につきます。
対象者
|
AI・機械学習プロジェクトを推進する方
|
メリット
|
Pythonの基本的な文法と、機械学習の代表的なアプローチを学んでいただけます。このプログラム終了後には、さらに専門的な講座の受講が可能となります。
|
受講料
|
受講人数に応じて、お見積りを作成いたします
|
受講前提
|
プログラム経験のある方
|
学習目標
|
Pythonによるデータ集計と機械学習の基本的な手法を身につける
|
カリキュラム
Python基礎講座
演習
|
・データ分析環境について
⚪︎Pythonについて
⚪︎Anacondaについて
⚪︎Jupyter Notebookとは
⚪︎Jupyter Notebookの基本操作
・Python文法基礎
⚪︎コメント
⚪︎画面への出力
⚪︎データ型:数値、文字列、ブール値、リスト、タプル、辞書型
⚪︎変数
⚪︎演算:加減乗除
⚪︎制御文:if文、while文
・ライブラリの読み込み
・Pythonでデータハンドリング
⚪︎pandasとは
⚪︎Series / DataFrameの利用
⚪︎データの確認
⚪︎Column / Indexの操作
⚪︎データの抽出
⚪︎データのソート
⚪︎データの結合
⚪︎データの集約処理
⚪︎重複除外 / 欠損値補完
・Pythonによる可視化 データ可視化の意義
⚪︎可視化の目的とグラフ種類
⚪︎ヒストグラムの作成
⚪︎棒グラフの作成
⚪︎散布図の作成
⚪︎折れ線グラフの作成
⚪︎pandasとMatplotlib
・総合演習:pandas / Matplotlibドリル
・データハンドリング + 可視化ケーススタディ
⚪︎新規ユーザー向けプロモーションの影響を分解する
⚪︎セグメントユーザー数減少の原因を明らかにする
|
講義時間
|
2日間 ※ご要望によって、短縮版、拡大版のご提供が可能です
|
受講料
|
6名までの場合:800,000円(税抜)※受講人数に応じてお見積りいたします
※講座内容はカスタマイズ可能です。カスタマイズの際は別途お見積りいたします。
|
機械学習入門
演習
|
・機械学習とは
・機械学習を用いたデータ分析の流れ
・データ前処理
⚪︎欠損値補完
⚪︎順序特徴量のマッピング
⚪︎名義特徴量のエンコーディング
⚪︎正規化・標準化
・モデルの評価
⚪︎回帰問題の評価(決定係数 / MAE / RMSE)
⚪︎分類問題の評価(Confusion Matrix / ROC曲線)
⚪︎モデルの過学習
⚪︎ホールドアウト / クロスバリデーション
・機械学習の実装
⚪︎scikit-learnの概要
⚪︎主なモジュール
⚪︎モデルの実装
・機械学習の手法(概要)
・回帰分析の手法
⚪︎単回帰、重回帰、罰則項を利用した回帰
⚪︎Lasso回帰 / Ridge回帰 / Elastic Net
⚪︎SVMを利用した回帰(SVR)
・分類の手法
⚪︎ロジスティック回帰、決定木、Random Forest、XGBoost
⚪︎クラスタリング
⚪︎K-Means、DBSCAN、混合ガウス、階層クラスタリング
⚪︎次元削減・圧縮
▪︎主成分分析(PCA)、Non-negative Matrix Factrization(NMF)
▪︎t-SNE、UMAP
・精度向上のテクニック
⚪︎パラメータチューニング
⚪︎特徴選択(Lassoを利用 / Random https://datumstudio.jp/analytics-education/Forestを利用)
⚪︎グループ演習:タイタニックデータを用いた生存者予測
・不均衡データ分析の概要
⚪︎不均衡データ分析の難しさ
⚪︎不均衡データ分析へのアプローチ
⚪︎不均衡データ分析の実践
▪︎imbalanced-learn
▪︎Random undersampling、Cluster-based undersampling
▪︎Random oversampling、SMOTE、SMOTEENN、SMOTETomek
▪︎コスト関数の調整
・グループ演習
|
講義時間
|
3日間 ※ご要望によって、短縮版、拡大版のご提供が可能です
|
受講料
|
6名までの場合:1,500,000円(税抜)※受講人数に応じてお見積りいたします
※講座内容はカスタマイズ可能です。カスタマイズの際は別途お見積りいたします。
|