セッション概要
あちこちにあるデータを集めるのは少ないうちは手作業で良いのですが、例えばCOVID-19の都道府県のオープンデータのように、複数の場所に異なったフォーマットで存在しているデータを毎日の更新も含めると自動にしたいところです。Apache HOPはPentahoで使われているKettleからフォークしたデータ統合プラットフォームです。
Dockerを使います。Docker Desktopをダウンロードお願いします。
Docker Desktopの動作確認後に、事前に2つのコンテナのPullもお願いします。
https://annoura.com/dive-into-apachehop/
セッション開始時にセットアップの時間を取りますので設定無しでも参加できるように考えていますが、追いつけない場合はこのサイトを参考に構築してください。
講師
案浦 浩二
セッション情報
- 担当:
- 日本Apache Hop Incubatingユーザーグループ
- レベル:
- 入門編
- 対象者:
- 点在するデータの収集に困っている人。Apache HOPって何か面白そうだと思う人。
- 前提知識:
- Docker Desktopを使います。一度でも動かしたことがあれば大丈夫です。
- カテゴリー:
- オープンデータ/データーベース/ETL