コース概要

Apache Spark とは

  • ビッグデータ処理における Spark の役割。
  • Spark のアーキテクチャとその構成要素。

Apache Spark のセットアップ

  • ハードウェアとソフトウェアの要件。
  • スタンドアロンモードとクラスターモードのインストール手順。
  • システム管理者向けの設定ベストプラクティス。

Spark クラスタの管理

  • クラスタ管理ツールと技術。
  • Spark アプリケーションとクラスタ リソースの監視。
  • セキュリティ設定とユーザ管理。

パフォーマンス調整と最適化

  • リソース割り当てとスケジューリング。
  • 最適なパフォーマンスのための Spark のチューニング。
  • 一般的なボトルネックの特定と解決。

トラブルシューティングと問題解決

  • 一般的な Spark 管理上の課題。
  • トラブルシューティング用の診断ツールと技術。
  • 一般的な問題の段階的な解決方法。
  • 健全な Spark 環境を維持するためのベストプラクティス。

高度な管理トピック

  • 他のビッグデータツールとの統合。
  • 高可用性と災害復旧の確保。
  • Spark クラスタのアップグレードとスケーリング。

まとめと次回のステップ

要求

  • ネットワーク構成と管理に関する基本的な知識。
  • Linux オペレーティングシステムとコマンドラインインターフェースの操作に慣れていること。
  • 分散コンピューティングシステムやビッグデータ管理について学ぶ興味があること。

対象者

  • システム管理者
 35 時間

参加者の人数


参加者1人当たりの料金

お客様の声 (5)

今後のコース

関連カテゴリー