こんにちは!
テクニカルコンサルティングチームの古堅です。
Reveal で始めるデータ分析の基本シリーズ、第5回目!
データ解析 / 可視化において、解析対象のデータは非常に重要なリソースですね。
本記事では、データを整理 / 拡張できる CData Sync を活用して Reveal スターターキットのデータソースを強化していきます!
CData Sync とは
クラウド(SaaS)データを DB (データベース) および DWH (データウェアハウス) に同期するレプリケーションツール。
CData Sync が解決してくれるもの
ずばりデータの交通整理です!
主な用途としては、
- 複数ある DB (データベース) をまとめたい。
- 新たなデータソースを追加取得したい。
などのご要望を実現できます。
接続できるデータソースは 100 種以上!
エンタープライズ系のデータベースから、マーケティングデータ (Marketo, Twitter, YouTube) まで様々なデータソースに接続できます。
データの組み合わせパターンは様々
非常に多くのデータソースに接続できますので、様々なデータの組み合わせが実現できます!
ほんの一例ですが
「システムAのデータベース」×「システムBのデータベース」
「業務データ」×「マーケティングのデータリソース (Google アナリティクス) 」
「店舗データベース」×「ツイッター」×「YouTube」
「ツイッター」×「店舗データ」
「ツイッター」×「Google アナリティクス」 × 「業務データ」
など
CData Sync を Reveal で活用
CData Sync で解析対象のデータを準備
早速 CData Sync を活用して Reveal スターターキットのデータと、都道府県別の人口数&年齢比率 (※) のデータを連携してみました。
- Reveal スターターキットのデータ
- 都道府県別の人口数、年齢比率
※ 都道府県別の人口数&年齢比率のデータは、e-stat が公開しているデータを取得しデータベース化しています。
連携イメージ図
①Reveal スターターキットのデータを DWH に同期
上記図は単純なテーブルコピーですが、高度な同期オプションも用意されており、同期先は別テーブル名や異なるカラム名にコピーなど柔軟に対応できます。
②都道府県データを DWH に同期
DWH に Reveal スターターキットと都道府県データが揃いました!
DWH に Reveal スターターキットと都道府県データが揃いました! あとは Reveal から DWH を参照すればどちらのデータも取得できます。
Reveal で可視化
早速ダッシュボード化していきましょう。
都道府県別の売上金額と都道府県別の総人口数を比較する
今回追加で読み込んだ都道府県データを活用し、都道府県別売上金額と都道府県別総人口数の相関をグラフで表現しました。
一つ目のグラフを見ると売上 / 人口数は東京が1位で同じですが、2位以降は一致していませんね。
人口数が多いけど売上がイマイチな都道府県、例えば大阪は今後の販売戦略のターゲットに出来そう!というヒントが得られました。
Reveal スターターキットのご紹介
データ分析/可視化が出来る Reveal ですが、スターターキットをご用意しています。
スターターキットに含まれる3つのファイル
- ステップ・バイ・ステップで手順を解説したマニュアル
- サンプルデータ (エクセル)
- ダッシュボードレイアウトの定義ファイル
サンプルデータには、さまざまな「気付き」をちりばめています。
ステップバイステップでダッシュボードを構築するマニュアルがありますが、
スターターキットを進めていく上で、
- データが示しているのは何か?
- データを違うグラフで表現することで、別の気付きが得られないか?
- 原因は何か?どういう仮説が考えられるか?
- 自分のビジネスに当てはめた場合、どうなるか?
などを意識して進めて頂くとより良いデータ分析の効果が得られるかと思います。
ぜひ Reveal スターターキットをお試しください!