セッション概要

データの生成/受信のたびに都度処理を行うストリーム処理の利用が広がっています。

一方でストリーム処理ではその特性上データの欠損が発生しやすいことも知られており、これがストリーム処理の採用を忌避する理由となる場合もあると聞きます。

ストリーム処理の領域でデファクトスタンダードとして利用される分散メッセージングシステムのApache Kafkaにはデータの欠損を防ぐ機構が含まれ、こうした悩みを解決してくれます。

本セッションではデータ欠損の発生理由、それを防ぐためのApache Kafkaの機構、その内部挙動まで一気に紹介します。

講師

倉本健

(株式会社NTTデータグループ)

佐々木徹

佐々木徹

(株式会社NTTデータグループ)

セッション情報

担当:
株式会社NTTデータグループ
レベル:
入門編
対象者:
データ処理基盤やストリーム処理に興味がある方
前提知識:
Linux, Javaに関する基礎的な知識がある方
カテゴリー:
ビッグデータ / 並列分散処理基盤 / アナリティクス
Google Calendar