セッション概要
特にIoT/M2M領域で顕著ですが、時々刻々生成される大量データの処理に際して、データの検索・集計処理に要する時間と同じくらい、他所で生成されたデータのインポートというのも大きな問題です。
ビッグデータ処理の領域では、列形式の構造化データ形式であるApache Arrowの利用が進んでおり、PostgreSQLにおいてもArrow_Fdwを介してこれを読み書きする事ができます。つまり言い換えれば、Apache Arrowを介してデータ交換を行う事により、大量データをデータベースにインポートする事なく、即、検索・集計処理を実行できるようになるのです。
本セッションでは、Apache Arrowを特徴とPostgreSQLからの利用、GPU処理を含む高速化技術について説明すると共に、PG-Strom v3.0のリリース以降の様々なアップデートについてもご紹介します。
講師
海外 浩平
(HeteroDB)
セッション情報
- 担当:
- ヘテロDB株式会社
- 対象者:
- 大量データ処理の情報収集を目的としている人、IoT/M2Mログデータ処理に興味がある人。
- 前提知識:
- 基本的なLinux(特にストレージ層)、PostgreSQLに関する知識がある方。
- カテゴリー:
- データベース/ネットワーク/ハードウェア