セッション概要

特にIoT/M2M領域で顕著ですが、時々刻々生成される大量データの処理に際して、データの検索・集計処理に要する時間と同じくらい、他所で生成されたデータのインポートというのも大きな問題です。

ビッグデータ処理の領域では、列形式の構造化データ形式であるApache Arrowの利用が進んでおり、PostgreSQLにおいてもArrow_Fdwを介してこれを読み書きする事ができます。つまり言い換えれば、Apache Arrowを介してデータ交換を行う事により、大量データをデータベースにインポートする事なく、即、検索・集計処理を実行できるようになるのです。

本セッションでは、Apache Arrowを特徴とPostgreSQLからの利用、GPU処理を含む高速化技術について説明すると共に、PG-Strom v3.0のリリース以降の様々なアップデートについてもご紹介します。

講師

海外 浩平

(HeteroDB)

セッション情報

担当:
ヘテロDB株式会社
対象者:
大量データ処理の情報収集を目的としている人、IoT/M2Mログデータ処理に興味がある人。
前提知識:
基本的なLinux(特にストレージ層)、PostgreSQLに関する知識がある方。
カテゴリー:
データベース/ネットワーク/ハードウェア
Google Calendar