セッション概要
Apache Hadoopによる大規模データ処理では、ScalaやJava,Python,R,SQLといった言語で柔軟かつ高度なデータ処理を可能にするSparkや、Hadoopの分散ファイルシステム上で動く分散KVSに相当するHBase、データローダやジョブスケジューラなど、様々な周辺ミドルウェアを組み合わせて利用します。本講演では、これらのHadoopエコシステムと呼ばれる製品群のパッケージングを提供するApache Bigtopの取り組みについて、開発中の最新バージョンであるBigtop 3.2でのアップデートや、Hadoop開発コミュニティの動向を含めてご紹介します。
講師
岩崎 正剛
(日本Hadoopユーザー会、株式会社NTTデータ)
関 堅吾
(日本Hadoopユーザー会、株式会社NTTデータ)
セッション情報
- 担当:
- 株式会社NTTデータ
- 対象者:
- データ処理基盤の開発や運用に興味がある方
- 前提知識:
- Linuxに関する基礎的な知識がある方
- カテゴリー:
- ビッグデータ/並列分散処理基盤/アナリティクス