セッション概要
大量のデータを処理し、分析することは既に広く行われています。
旧来のビッグデータ分析技術においては、処理の効率化などの目的である程度の制約を受け入れつつ利用することが多かったですが、近年Apache Icebergなどのオープンテーブルフォーマットと呼ばれる技術が制約の一部を取り除き、より使いやすくなっています。
本講演では、ビッグデータ分析技術の背景を振り返りつつ、主にApache Icebergに焦点を置きながらオープンテーブルフォーマットが実現することの概要や事例についてご紹介します。
講師
田中正浩
(株式会社NTTデータグループ)
セッション情報
- 担当:
- 株式会社NTTデータグループ
- レベル:
- 入門編
- 対象者:
- データレイクにおけるテーブルフォーマットに興味がある方
- 前提知識:
- ビッグデータ分析関連のOSSやクラウドサービスの理解がある方
- カテゴリー:
- データベース / 並列分散処理 / ビッグデータ