DX(デジタルトランスフォーメーション)推進コンサルティング 株式会社アイ・ティ・イノベーション

menuclear
ホーム > ブログ > 中山 嘉之の記事一覧 > 非構造化データと構造化データのシンクロナイズ


非構造化データと構造化データのシンクロナイズ


今年最後のブログは非構造化データにフォーカスを当ててみたい。ただし今回のテーマは、文書や画像データ等の多種多様な非構造化データからなるBIGデータの分析手法の話ではなく、日頃企業内システムで中心的に扱われている構造化データに、従来はエンタープライズ(企業)システムの外側で管理されている文書や画像等の非構造化データを付加し同期することで、業務効率を高めようという内容である。従来の味気ない画一的な構造化データに文脈やイメージを味付けすることで、発生イベントや問題解決にリアリティを与え、結果、人間の判断のスピードと正確性を増そうというものだ。そして、このことは“深さ”において企業システムの範囲を広げることに他ならない。

では、従来の構造化データを保管するリレーショナルデータベースに加えて、新たにドキュメントデータベース等のNon SQL DBを導入し、非構造化データを蓄積すれば話が済むのだろうか。答えは否である。ここで注意しなければならないのは、文書データ等の非構造化データの一要素として、構造化データたる数値や名称が含まれているという事だ。そして、両者は本来一致していなければならない。(時系列的なデータ変化で文書データが過去のものとなる事はあるが)。データの一元管理についてのセオリー“One Fact in One Place”は、構造化データに限った話ではない。つまり両者(構造化データと非構造化データ)の関係は、「要素データ」と「その組合せデータ+α」と捉えた方が自然である。Non SQLについて、いみじくもかのエリックエバンスは“not only SQL”と解釈した方が良いと語っている。

非構造化データと構造化データのシンクロ話を本題に戻して、企業システムにおいて両者がシンクロナイズしながら業務が進行してゆくシステムの具体例を挙げてみたい。図1は営業部門における見積書発行業務の例である。見積書の要素データである製品(サービス)名、製品仕様、製品@、顧客名、住所、組織、担当者等は構造化DBにマスター化して格納され、これらの要素データをもとに自動作成された非構造化データとしての“文書“が、価格申請文書作成⇒申請文書承認⇒見積書作成⇒見積書承認といったワークフローに沿って流れ、この”文書“を人間が読むことで、承認/否認がなされる仕組みである。

ここでのポイントは構造化データをもとに非構造化文書データが“自動生成”されるところにある。然るべき権限に基づくマスターメンテナンスによってのみ更新が許された“要素データ”は、幾つかの文言パターンから選択された“繋ぎの文言”と合体して1つの“文書”が出来上がる。さらに、顧客毎に要素データの追加・削除や、配置(レイアウト)のカスタマイズを可能にすることで、自動生成する文書にバリエーションを持たせることもできる等々。。。ふと、UIをイメージしていると、ここ数年プライベートで利用している「WEB年賀状サービス」を、季節柄思い出していた(オール手作りの素敵な年賀状を制作されている方には手抜きと言われても仕方ないが、百個近いサンプルからの干支の絵の選択、挨拶の文言の選択などを入力するだけで翌日には年賀葉書が手元に到着する)。

我々の身の回りには既にコンスーマライズされた便利なITが数多く存在する。にもかかわらず企業システムは今一つ“行けてない”というのが本音ではなかろうか。上記の例でも、古典的な企業システムでは、製品名、@等は受注入力用に構造化DBに格納されているが、見積書という文書はEXCELやWORDに全ての情報を直にタイプした非構造化データとして別に存在し、両者の名称や数値データは人間系でリンク同期をとっているケース、或いは必要な要素データを構造化DBに入力&格納した後に、見積書印刷システムで見積書を作成し、それを非構造化文書DBに格納しているケース等が多いのではなかろうか。

バックナンバー2015.4.20「硬さと軟らかさの融合」にも書かせていただいたが、エンタープライズシステムは従来のガチガチのものから“軟らかいもの”に向かうのが人間工学的に見て自然の流れである。がしかし、グニャグニャで無秩序になってもいけない。両者の融合をいかに図って行くかが企業内情報システム部門の腕の見せどころではないだろうか。

| 目次

採用情報
PM-waigaya
PM-WaiGaya
コンサルタントのトーク動画
PM Weekly Talk
PM Weekly Talk
コンサルタントが語る「PMBOK®12 の原理・原則」

Profileプロフィール

Avatar photo
中山 嘉之
1982年より協和発酵工業(現、協和発酵キリン)にて、社内システムの構築に携わる。メインフレーム~オープンへとITが変遷する中、DBモデラー兼PMを担い、2013年にエンタープライズ・データHubを中核とする疎結合アーキテクチャの完成に至る。2013年1月よりアイ・ティ・イノベーションにてコンサルタントを務める。【著書】「システム構築の大前提 ― ITアーキテクチャのセオリー」(リックテレコム)

Recent Entries最近の記事