セッション概要

OSSベースの分散処理基盤としてApache Hadoopが誕生して10余年が経ち、大規模並列分散処理の領域において、これまでに多種多様なソフトウェアが開発されてきました。

本セッションでは、それらのソフトウェアがどのような経緯で誕生し、どのように使われるのかをお話ししつつ、近年注目を集めているデータ分析を指向したストレージレイヤSWであるDelta Lakeについてもご紹介します。

講師

利光 宏平

利光 宏平

(株式会社NTTデータ)

セッション情報

担当:
株式会社NTTデータ
レベル:
入門編
対象者:
ビッグデータを活用するための基盤に興味のある方
前提知識:
特になし
カテゴリー:
ビッグデータ/並列分散処理基盤
Google Calendar

資料

並列分散処理基盤のいま~45分で学ぶHadoop/Spark/Kafka/ストレージレイヤSW入門~(外部リンク)