コースコード:DB247

Cloudera Apache Hadoop 管理者向けトレーニング

コース概要

マシン実習

本番環境や検証環境でClouderaのHadoop分散クラスターの管理を行う方のために、Hadoopや関連エコシステムの概要、インストール、設定、管理、運用までを紹介します。ハンズオン演習では、クラスターの構築から、設定、監視などさまざまな運用タスクを行います。

受講料 

360,800円(税込)/328,000円(税抜)

開始日(申込締切前)

東京 1/6、3/9

講習日数

4日間

到達目標

  • ・ Cloudera Enterprise Data Hubでの重要な機能とコンポーネントを説明できる。
  • ・ Cloudera Managerを利用して、クラスターの構築、設定項目の設定および変更ができる。
  • ・ Hadoop分散ファイルシステムと関連ツールの使い方を説明できる。
  • ・ Apache Sparkの概要と導入方法を説明できる。
  • ・ クラスターの計画、ハードウェア、オンプレミスまたはクラウドのデプロイについて説明できる。
  • ・ SQL(HiveやImpala)の概要を理解し、導入できる。
  • ・ クラスターのリソース管理、運用、監視ができる。

対象者

分散基盤の構築、運用を行いたいシステム管理者

前提知識

基本的なLinuxの経験をお持ちの方。Apache Hadoop の事前知識は必要ありません。

研修コースマップ

デジタルトランスフォーメーション(DX)

  • データ分析基盤

コース内容

1日目
AM
1.Cloudera Enterprise Data Hub
・Cloudera Enterprise Data Hub
・CDHの概要
・Cloudera Managerの概要
・Hadoopの管理者の責務
2.Cloudera ManagerとCDHのインストール
・Clusterのインストールの概要
・Cloudera Managerのインストール
・CDHのインストール
・CDHクラスターサービス
PM
3.Cloudera クラスターの設定
・概要
・構成の設定
・サービス構成の変更
・設定ファイル
・ロールインスタンスの管理
・新しいサービスの追加
・ホストの追加と削除
4.Hadoop 分散ファイルシステム
・概要
・HDFSのトポロジーと役割
・編集ログとチェックポイント処理
・HDFSのパフォーマンスとフォールトトレランス
・HDFSとHadoopセキュリティの概要
・HDFSのWebユーザーインターフェイス
・HDFSコマンドラインインターフェイスの使用
・その他のコマンドラインユーティリティ
2日目
AM
5.HDFSのデータ取り込み
・データ取り込みの概要
・ファイル形式
・ファイル転送またはRESTインターフェイスを用いたデータ取り込み
・Apache Sqoopを使用したリレーショナルデータベースからのデータのインポート
・Apache Flumeを使用した外部ソースからのデータのインポート
・データインポートのベストプラクティス
6.HiveとImpala
・Apache Hive
・Apache Impala
PM
7.YARNとMapReduce
・YARNの概要
・YARNでアプリケーションの実行
・YARNアプリケーションの表示
・YARNアプリケーションのログ
・MapReduceアプリケーション
・YARNのメモリとCPUの設定
8.Apache Spark
・Spark概要
・Sparkアプリケーション
・YARNでSparkアプリケーションを実行する方法
・Sparkアプリケーションの監視
3日目
AM
9.クラスターの計画
・一般的な計画に関する考慮事項
・適切なハードウェアの選択
・ネットワークの考慮事項
・仮想化オプション
・クラウドデプロイのオプション
・ノードの設定
10.高度なクラスター設定
・サービスポートの設定
・HDFSとMapReduceのチューニング
・HDFS高可用性の有効化
PM
11.リソース管理
・静的サービスプールを使用したcgroupsの設定
・フェアスケジューラー
・動的リソースプールの設定
・Impalaクエリのスケジューリング
12.クラスターのメンテナンス
・HDFSのステータスを確認
・クラスター間でデータをコピーする
・HDFSのデータの再バランス
・HDFSのディレクトリスナップショット
・クラスターのアップグレード
4日目
AM
13.クラスターの監視
・Cloudera Managerの監視機能
・ヘルステスト
・イベントとアラート
・チャートとレポート
・モニタリングの推奨事項
14.クラスターのトラブルシューティング
・概要
・トラブルシューティングのツール
・設定ミスの例
PM
15.Hueのインストールと管理
・概要
・Hueの管理と設定
16.セキュリティ
・Hadoopセキュリティのコンセプト
・Kerberosを使用したHadoopでの認証
・Hadoopでの認可
・Hadoopでの暗号化
・Hadoopクラスターのセキュア化
カリキュラムのタイムスケジュールは受講者の理解度などに応じて変更されることがございますのでご了承ください。

留意事項・備考

・本コースはCloudera Universityとの提携コースのため、コース実施およびメール送信に必要とするご受講者の個人情報を米国Cloudera Inc.、Cloudera株式会社およびその他の協力会社(会場提供元など)に提供します。
・本コースは、電子テキストを使用します。
・電子テキストはご受講時に教室でダウンロードし、データをお持ち帰りいただけます。
・キャンセル期限はコース開催の11営業日前までとさせていただきます。
・やむを得ず、本コースが中止となった場合、開催5営業日前までにご連絡いたします。

開催スケジュール詳細・お申込

「カートに追加」欄の追加をクリックすると、web申込が可能です。
申込期限およびキャンセル期限は、各締切日の16:30です。

◎・・・6名様以上、空いております。
○・・・1~5名様の空きがございます。
△・・・キャンセル待ちとなります。(ただし、備考欄に注記がある場合はキャンセル待ちではありませんので、注記をご参照ください)
週2回空席状況を更新します。◎○でも、既に満席の場合はご了承下さい。詳細な空席状況は研修申込センターにお問い合せください。

[スケジュール更新日付:2019年10月24日]

地区 開催番号 会場名 開始日~終了日 日数 講習時間 申込締切日 空席
状況
備考 カートに追加
キャンセル締切日
東京 DB247702A Cloudera会場(新宿オークタワー) 2020/01/06~
2020/01/09
4日間 09:30~
17:30
2019/12/09 ※注 追加
2019/12/09
DB247703A Cloudera会場(新宿オークタワー) 2020/03/09~
2020/03/12
4日間 09:30~
17:30
2020/02/17 ※注 追加
2020/02/17
おすすめ情報