コース概要 このコースをクリップ
データ分析 ~応用~
コースコード | AI022 |
---|---|
受講料 |
198,000円(税込) /180,000円(税抜) |
講習日数 | 2日間 |
開始日 (申込締切前) |
遠隔ライブ 7月22日 |
データ分析におけるモデルの精度向上施策(特徴量生成・選択、アルゴリズム選択、ハイパーパラメータチューニング、モデルのアンサンブル)を実習形式で学びます。
機械学習のデファクトスタンダードであるJupyter Notebook上で、Python(pandas、numpy、scikit-learn)を使い学習します。
- データ分析における精度向上施策(特徴量生成・選択、アルゴリズム選択、ハイパーパラメータチューニング、モデルのアンサンブル)を理解し、実行できる。
以下いずれかのコースを修了、または同等知識をお持ちの方。
・データ分析 ~基礎~(旧名:NEC Advanced Analytics Platform データ分析 ~基礎~)
・データサイエンティスト養成ブートキャンプ
1日目 | AM | 1.はじめに ・本教育の目的とゴール ・演習で使うデータ ・Pythonライブラリ一覧 2.基礎研修のおさらい ・データ分析の流れ(データ入手、データ観察・加工、モデル作成・評価、考察) ・データ入手~観察 目的変数の推移の確認、ヒストグラム、棒グラフ ・データ加工 データ結合、データ型変更、欠損値対応、転置、二値化、正規化/標準化 ・モデルの作成と評価 データ分割(ホールドアウト法、交差検証) Leakage、過学習 数値予測の評価指標(MAE、RMSE、決定係数、MAPE) 判別の評価指標(混同行列、正解率、適合率、再現率、F値、AUC、ROC曲線、Lift値) 精度向上施策の流れ(特徴量設計、アルゴリズム、パラメータチューニング、アンサンブル) 3.特徴量生成・選択 ・精度向上のためのプロセス 仮説を立てる、仮説を検証する、データセットに適応する ・数値データの加工 標準化、カテゴリ化、二値化、差分計算、比率計算、切り上げ・切り捨て クリッピング、Min-max normalization、標準化、対数化 ・カテゴリデータの加工 カテゴリ値の集約、カテゴリ値の組み合わせ、OneHotEncoding(ダミー変数化) LabelEncoding、CountEncoding、TargetEncoding ・時系列データの加工 トレンド(移動平均)の算出、周期性の算出 ・特徴量選択の目的と方法 Filter Method、Wrapper Method、Embedded Method |
PM | 4.機械学習アルゴリズム ・機械学習の分類 教師あり学習、教師なし学習、半教師あり学習、強化学習 ・教師あり学習の代表的なアルゴリズム 線形モデル、K近傍モデル、決定木モデル、ランダムフォレストモデル 勾配ブースティング決定木モデル、SVM(サポートベクターマシン) ニューラルネットワーク 5.ハイパーパラメータチューニング ・ハイパーパラメータとは ・ハイパーパラメータ探索の方法例 Grid Search、Random Search、SMBO 6.モデルのアンサンブル ・モデルのアンサンブルとは ・代表的なアンサンブルの手法 Bagging、Boosting、Stacking | |
2日目 | AM | 6.演習 ・ベースラインから精度向上施策を図る実践演習 データの観察、分析実行、結果の考察 精度向上施策の検討、施策の実施、結果の考察 |
PM | 6.演習 ・ベースラインから精度向上施策を図る実践演習 データの観察、分析実行、結果の考察 精度向上施策の検討、施策の実施、結果の考察 |
■遠隔ライブ受講について■
<■本コース受講にあたっては、事前の準備が必須となります。>
お申込みの前に、事前準備をご確認ください。また、ご受講の際は、研修開始前までにご準備ください。
◎事前準備
◆遠隔ツール :Zoom
Zoomに関する準備手順は、Zoom受講マニュアルよりご確認ください。
※本研修ではZoomの機能中、「チャット」、「名前の変更」を使用いたします。
また、Zoomの利用に際し、下記が必要となりますので、あらかじめご用意ください。
1.インターネットに直接接続ができるPC
2.Zoomで使用可能なマイク(質問用として使用することがあります)
3.Zoomで使用可能なWebカメラ ※推奨
◆演習用ソフトウェア:
以下のいずれかのWebブラウザの準備をお願いします。
Edge、Chrome、Firefox の最新から3つ以内のメジャーバージョン
演習ではMicrosoft Office(Excel、PowerPoint)を用いて成果物を作成します。
Microsoft Office(Excel、PowerPoint)がインストールされているPCの使用を推奨します。
◆教材 :電子教材
研修当日の開始時に配布します。(研修開始7日前以降に事前送付する場合もございます。)
※本研修では、電子テキスト+Zoom講師画面共有での説明が行われるため、サブディスプレイのご利用をお勧めいたします(必須ではありません)。
◆その他の準備 :ファイル共有
本コースでは、ファイル共有のためにOneDriveを利用します。
研修開始前に、OneDrive(テストフォルダ)へのアクセスが可能かどうかご確認ください。
◆グループワーク:有り
==============================
本研修はNEC アナリティクスコンサルティング統括部との連携案件となります。
そのため、受講者データを同事業部と共有させていただきます。
共有する情報は、本アンケートにご記入頂いた回答、受講コース名、会社名、所属、お名前、電話番号、E-mailアドレス、職種の項目になります。