セッション概要
データの生成/受信のたびに都度処理を行うストリーム処理の利用が広がっています。
一方でストリーム処理ではその特性上データの欠損が発生しやすいことも知られており、これがストリーム処理の採用を忌避する理由となる場合もあると聞きます。
ストリーム処理の領域でデファクトスタンダードとして利用される分散メッセージングシステムのApache Kafkaにはデータの欠損を防ぐ機構が含まれ、こうした悩みを解決してくれます。
本セッションではデータ欠損の発生理由、それを防ぐためのApache Kafkaの機構、その内部挙動まで一気に紹介します。
講師
倉本健
(株式会社NTTデータグループ)
佐々木徹
(株式会社NTTデータグループ)
セッション情報
- 担当:
- 株式会社NTTデータグループ
- レベル:
- 入門編
- 対象者:
- データ処理基盤やストリーム処理に興味がある方
- 前提知識:
- Linux, Javaに関する基礎的な知識がある方
- カテゴリー:
- ビッグデータ / 並列分散処理基盤 / アナリティクス