データの可視化、データビジュアライゼーションというとどんなことを思い浮かべますでしょうか?
フロー図やグラフであったり、マトリクスであったり、絵を思い浮かべる方が多いかと思います。システム部門に属している方は、BI(Business Intelligence)ツールをなどを思い浮かべる方もいると思います。
つまり、従来のデータビジュアライゼーションとはデータをグラフィックによって視覚的に理解できる手法を指し、それを実現するツールとしてはBIツールなどが有名という認識が一般的でしょう。
今回の記事では、そんな皆さんのイメージを大きく覆す新しいデータビジュアライゼーションの手法についてご紹介します。
2019年は新しいデータ可視化手法が注目されている
そもそも従来のBIツール/クロス集計とは?
フロー図、グラフ、マトリクス、表現方法はさまざまですが、新しいデータ可視化の手法が注目されています。
これまでのデータ可視化手法といえばBIツールを使ったデータの見える化が主で、表形式の構造化されたデータをクロス集計することが中心でした。
クロス集計と言えば代表的なものがアンケート形式です。X軸に感想(良い、普通、悪い)、Y軸に人の属性別(性別、年齢)といった層別で集計するといった手法がよく挙げられるように、エクセル等の表形式データをグラフで表現するレベルの話、それが従来のBIツールにおけるデータの可視化を意味するものでした。
新しいデータビジュアライゼーションの手法とは?
上記のBIツール/クロス集計に対して、注目されている新しいデータ可視化手法の特徴は、構造化/非構造化データに拘わらず、データ同士の「関連性」を見える化できる点です。
情報を細かい単位に分解し(ノード)、その関連性(エッジ)を定義することで表形式よりも柔軟な操作が可能となり、データ同士が何次の関係にあるとか、最短経路はどれかといったようなことも容易に判別可能です。
具体的にどんなことがわかるようになるのか?
【例1】ネットワークの「キープレイヤー」がわかる
データ同士の関係を可視化することで、ネットワーク上のキープレイヤーを客観的に特定できます。これは「グラフ理論」という結節点の位置関係を論じる数学を応用したものであり、表形式のデータベースでは「キープレイヤー」をデータ操作によって特定することは不可能または非常に困難とされています。
【例2】ネットワーク上の伝播経路がわかる
ネットワーク上の結びつきに重みづけをすることで、情報等の伝播を可視化することができます。たとえば、各種債権のネットワークを描くことで、ショック発生時にどこにリスクが集積するかを予測することができます。
【補足】データの持ち方もガラッと変わる
従来の表形式のデータの集積体から関係性を表すデータへと、データの持ち方自体も変わります。この関連性をデータベースに保存し、表現する技術が新しいデータビジュアライゼーション手法です。
新しいデータビジュアライゼーション手法を導入する2つのメリット
【メリット1】一度設定してしまえば以後大きなメンテナンスが不要に
たとえば、業務におけるデータの流れを可視化する場合、これまでは業務フロー図とデータフロー図をそれぞれ人の手で作成し、業務・システム変更の都度メンテナンスする必要がありました。
新しいデータビジュアライゼーションの技術では、データ(ノード)自身が業務プロセス上のどのタスクに属し、データ定義上のどの項目に属するか、といった情報を保持しますので、可視化する際に求められるのは図形を置く、線を引くといった描画作業ではなくなる訳です。
逆に、一番はじめにどの位置にどのような階層構造でノードを配置するか、といった設計作業が必要になります。一見すると煩わしい作業ですが、一度定義と描画ルールを決めてしまえばその後の大きなメンテナンスは不要となるので、可視化文書の維持・管理が容易になります。
さらにメンテナンスの観点では、業務・システム変更の際には変更箇所のみをクエリ等で一括更新することが可能なので、データや環境の変化に対する抵抗感や負荷が無くなり、より分析を進めやすくなる点もメリットです。
【メリット2】より多彩で柔軟な表現が可能かつ分析を繰り返しできる
従来のクロス集計を中心としたBIツールと比べてより多彩で柔軟な表現が可能となるだけでなく、上記の通り大きなメンテナンスが不要となるので分析を繰り返しできるようになります。
たとえば、業務プロセスが6階層の粒度に分解できる場合「6階層だと見にくいから4階層で表示してみよう」であったり、「業務プロセスを3つ跨って(例:仕入⇒加工⇒販売)見てみよう」といった柔軟な操作が可能になります。
スキーマ情報やLDAP情報を利用して自動的にデータフロー図を作ることで、一層の効率化を図ることも可能となるなど、これまで気軽に見える化できなかったために躊躇われていた分析が容易に可能になるので、より大きな価値を生むことが期待されます。
経営的な価値は「最新のデータによる深い分析と経営判断」
この手法を取り入れることでの経営的なメリットは、鳥の目、虫の目で状況をさまざまな観点から分析するツールを得られるという点です。
そして先に述べた自動的なデータフロー図を用いる場合には、全ての構成項目は誰かが手で描いた古いものではなく、常に最新の真実のデータが元となっているので、現場と経営のコミュニケーション促進につながると考えられます。
日本ではどのような企業/利用シーンにマッチするのか?
効率化/コスト削減の観点ではBPMに取り組む企業や、複雑なデータの流れを有するすべての企業に利用の機会があります。とくに、上流データのどこを変えると下流データのどこが影響を受けるか、よくわからないといった企業にはお勧めです。
たとえば、製造設計において部品同士の関連性を明確化することにも役に立ちますし、プロジェクト管理における依存関係の整理にも使われています。
コンプライアンスの観点ではGDPRなどの情報トレーサビリティへの対応、複雑に絡み合う人間と取引の関係性調査(脱税調査等)などに実績があります。
営業推進・マーケティングの観点では商流や親密度の分析により新しいアプローチや、コネクションルートを探すといったことも可能と考えられます。
その新しいデータビジュアライゼーションを実現するツールは?
いま、欧米で注目されている「Tom Sawyer/トムソーヤ」
1992年にカリフォルニア州で創業したトムソーヤは、同種類のサービスを提供する企業群の中では歴史のある企業ということができるでしょう。
関連性をデータベースに保存する技術を「グラフデータベース」といい、欧米で着実に利用者数を伸ばしていますが、その中でもトムソーヤは関連性を可視化する技術のバリュエーションでは随一と言えます。
グラフデータベースの1種であるAmazon NeptuneはAWS上で2018年から利用可能になっていますが、データベースにNeptuneを使用する場合はビジュアライゼーションにトムソーヤを使用することが一般的であるため、トムソーヤはAWSのテクノロジーパートナーに選ばれています。
【無料ダウンロード】Tom Sawyer/トムソーヤソリューション事例(日本語版)