
※本記事は、 小川 康二氏・伊藤 洋一氏の著書「DXを成功に導くデータマネジメント データ資産価値向上と問題解決のための実務プロセス75」(翔泳社刊)の一部を編集し、転載しています。
データとは何か?
ビジネスで扱うデータは「写像」「集計」「推測」の3種類です。
厳密には、現実世界の実体を写像したものがデータで、データを加工したものは情報として区別します。
例えば、コンビニエンスストアの買い物シーンを想像してみると、「商品:おにぎり」「レジ:1号機」「店員:伊藤」「決済金額:100円」が浮かび上がってきます。この浮かび上がってきた一つひとつの具体的な対象(おにぎり、1号機、伊藤、100円)がデータです。データを使って、売上集計や売れ筋商品を予測したものが情報です。
データと情報の違いとは何か?
データと情報の違いは、情報システム方法論の提唱者であるMilt Bryce氏が「情報=データ+プロセス」と述べています(図2.1.1)。

この式において、プロセスとは、集計・四則演算・統計・予測などの何らかの処理のことを指しています。そして情報とは、データを加工処理して出力されたものと述べられています。
ビジネス活動において、情報を必要とする理由は、サービス企画や業務改善などのビジネス施策を提案するにあたって、根拠を示す必要があるからです。根拠を示さないと意思決定者である上司や経営者は、経営判断ができないため合意しません。もちろん、意思決定者自身がビジネス施策の妥当性を判断する際も情報を必要とします。
このことから、情報は「ビジネス施策を実現する」という目的のために生成されるといえます。逆をいえば、ビジネス施策がなくなれば目的がなくなり、情報は必要なくなるかもしれません。ただし、情報の性質上、他のビジネス施策でも使っている情報かもしれないので、ここが管理する難しさでもあります。
本書では、DMBOK2に合わせて、上記における「情報」もデータとして扱っていきます。情報自体も広義に見れば、現実世界を写像した事実の記録と解釈できるからです。
データは腐る
データは何らかのビジネス施策を実現するうえで必要だから存在します。
バリューチェーンのデータに直結するオペレーショナルな業務(購買、生産、販売など)においては、先行業務から後続業務にデータを共有しないと仕事ができなくなるため、永続的に必要です。しかし、経営戦略や事業戦略を考えるためにデータを集計したり、予測データを作成したりするケースにおいては、戦略が変われば必要でなくなる可能性があります。
不要となったデータは廃棄する必要があります。ストレージを確保して貯めておくにもコストがかかります。しかし、多くの企業ではそのようなデータをいつまでも廃棄せず、そのままにしてしまいます。
なぜなら、誰がどのような目的で使っているのかわからなくなってしまっているからです。もしデータを廃棄してしまったあとに、どこかの業務で使っていることが判明したら大変なことになります。
このようなリスクを恐れて、多くの企業では廃棄せずに残しています。このように、利用目的が不明だが廃棄せずに残しているデータをダークデータと呼びます。企業内のダークデータは増加する一方です。その結果、いざデータ活用で欲しいデータを入手しようと思っても探すのが大変になり、データ活用促進の足枷になってしまいます(図2.1.2)。

このような問題を未然に防ぐためにもデータマネジメントが必要になるのです。
データは宝にもなる
利用目的のないデータを残しておくと腐るといいましたが、きちんとマネジメントを行えば宝にもなります。
バリューチェーンのデータは、企業にとって要のデータになるため、情報システム部門がデータの品質を保っていますが、データ活用によってつくられた意思決定者向けのデータはマネジメントをしっかり行う必要があります。
ダークデータの対応として、廃棄するための判断材料をあらかじめ決めておく、というところまでは考えられると思います。そこから一歩進んで、データ活用者がビジネス貢献した成功モデルを標準プロセスにして、データ活 用者全員がノウハウ共有できるようにもっていきましょう。このナレッジデータこそが企業にとって宝になるのです(図2.1.3)。

Point!ナレッジデータを中心にしたビジネス活動が当たり前になる
「知識経営」で知られる野中郁次郎氏らが「知的創造企業」を提唱していますが、データ駆動型経営を促進させることは、すなわち、知的創造企業の仕組みをつくることであるといっても過言ではありません。
ナレッジデータの共有とノウハウ共有の場づくりは今後、目が離せない施策だと考えます。