セッション概要

Apache Hadoopによる大規模データ処理では、ScalaやJava,Python,R,SQLといった言語で柔軟かつ高度なデータ処理を可能にするSparkや、Hadoopの分散ファイルシステム上で動く分散KVSに相当するHBase、データローダやジョブスケジューラなど、様々な周辺ミドルウェアを組み合わせて利用します。本講演では、これらのHadoopエコシステムと呼ばれる製品群のパッケージングを提供するApache Bigtopの取り組みについて、開発中の最新バージョンであるBigtop 3.2でのアップデートや、Hadoop開発コミュニティの動向を含めてご紹介します。

講師

岩崎 正剛

岩崎 正剛

(日本Hadoopユーザー会、株式会社NTTデータ)

関 堅吾

関 堅吾

(日本Hadoopユーザー会、株式会社NTTデータ)

セッション情報

担当:
株式会社NTTデータ
対象者:
データ処理基盤の開発や運用に興味がある方
前提知識:
Linuxに関する基礎的な知識がある方
カテゴリー:
ビッグデータ/並列分散処理基盤/アナリティクス
Google Calendar

資料

Apache Bigtop 3.2(仮)(外部リンク)