シェアする

クラウド時代に情報のライフサイクル管理を考え直せ

この数年のクラウドサービスの充実には目を見張るものがある。無制限の容量を定額で利用させるというサービスは早々と頓挫したが、クラウドの容量は無制限と言ってもよいのではないだろうか?デスクトップのディスク容量ですら、3TB, 4TB は当たり前の時代になった。人間のアクティビティ、SNS、さらには IoTの生み出すデータは膨大な量になり、そうした情報が日常的に扱われている。

インターネットに公開された情報は、取るに足らない誰も関心を示さないものは、忘れ去られるかもしれないが、一旦GoogleにCrawlされてしまうと忘れることはできない。また、関心を集めた情報は必ずどこかに保存されている。

今や、アメリカの大統領が正式な広報の前にTwitterで発表してしまうくらいの時代である。インターネットに流れる情報は取るに足りないものから、世界を揺るがすものまで存在している。フェイクニュースという言葉が流行になったが、SNSを使って世論操作まで行われていると疑われる時代である。アクセス数を稼いで、アフィリエイトで儲けることも目的として、無断で情報を窃用するばかりか、つぎはぎ細工でもっともらしいことや、扇情的なことを仕立て上げるサイトやビジネスが問題になったこともあった。

容量が無制限であり、永久に存在し続けられるなら、正しい情報源、正確な記録や知識に容易にかつ永続的にアクセスできるようにすることが長い目で見ればメリットが大きいことは間違いない。順次知見が更新されていく様などもその過程が追いかけられることは重要なことだ。

しかし、この変化は極めて新しいことで、未だ多くの場所に紙や、物理的なメディアの扱いをベースにする考え方が幅を効かせていることに注意すべきだ。

情報ライフサイクル管理とは

ライフサイクル管理という考え方が情報、文書管理には存在する。ただ、これは非常に古くからある考え方で、それこそ、紙とタイプライターの時代のものから始まっている。

ビジネス文書においては、作成と受容→配布→使用→保守→廃棄というサイクルが存在する、というのがライフサイクルの考え方である。ここでわかるのは、作成に力点はおかれていないということと、廃棄に至る道筋が決められているということである。

確かに、すべての情報が必ず紙の上に表現されている場合、その紙は膨大な量となり、その廃棄を定期的に行わなければならない。したがって、廃棄のルールを定めることが重要な問題となる。

ビジネス文書では、情報の価値を考える時に、ストック文書の有する価値に基づいて評価する。それは、歴史的価値、法務価値、財務価値、業務価値というような分類である。したがって無価値であるとされた文書は短期間で廃棄される運命にある。

この分類を行う概念からビジネス文書については、作成のプロセスについては、ほとんど検討されていないのではないかと考えられる。すなわち、ビジネス文書の管理とは、どこかの事務機によって作成された文書を、配布、使用、保守という行程で管理し、廃棄に至るライフサイクルを管理するものと考えられる。保守は、上記の資産価値に基づき、その保管方法が選択されるということだ。

もともとは紙をベースに考えられた情報ライフサイクルも、2004年にコンピュータストレージシステムをベースとするものに合わせるように改定する試みが行われた。2000年代にはいり、インターネットが普及期に入り、2004年は光ファイバーによるブロードバンド接続が実用的な時期に入っていた。しかし、あくまで情報ライフサイクル管理は、保存がローカルストレージに行われ、その容量には限りがある中での活用を前提としたものであり、クラウド以前の時代であるし、現代のインターネットの状況は全く考慮されていなかっただろう。

コンピュータは事務機ではない

技術者にとっては、ソフトウエアのソースコードの管理と比較してみると分かりやすいだろう。さらに、オープンソースのソフトウエアならば、作成→配布→使用→保守という問題に関しては、非常に洗練されたシステムが構築されていることに気づくはずだ。

cvs (Concurrent Version System) は、テキストファイルの変更を記録し管理するバージョン管理システムである。最近は、Gitというクラウドベースで管理するシステムが利用されることのほうが多い。現在、ほとんどすべてのオープンソースソフトウエアの管理において、Gitが使用されているといってもいいだろう。このシステムの存在によって、オープンソフトウエアにおけるコントリビュータの知識が適切にフィードバックされ、整合性が保たれ、保守、運用が行われている。重要なのは、このシステムは作成の初期段階から深くかかわっているということだ。

これほど普及したシステムが一方に存在するにもかかわらず、一般の文書管理においては同様のシステムが利用されないのはなぜだろうか?もちろん、プログラムのソースコードがテキストファイルであり、その差分を抽出し管理することが容易であるという点はある。しかし、それはおそらく大きな問題ではなく、使う人と意識の問題が大きいのではないかと思われる。事務部門の文書というのは、未だに印刷することを前提に扱われていると思われる。コンピュータは事務機であり、印刷された文書ができて初めてそこから管理が始まるというわけである。

ペーパーレスについての誤解

IT化においては、ペーパーレスという言葉が登場する場面がよくある。日本の会社ではおびただしい量の紙を使っていることが多く、コスト削減効果としては、紙を削減することは大きな意義がある。しかし、プレゼンテーションのために、紙に印刷することは必ずしも悪いことであるとは言い切れない。紙に印刷された情報の縦覧性は、コンピュータ画面で容易に置き換えられるとはいい切れない。特に、小さな画面で表示できる情報量に限りがある場合には、紙に出力された情報のほうがはるかに使いやすいし、理解しやすいだろう。

ところが、ペーパーレスを実行する時には、この使い方の紙をまず削減しようとすることが見受けられる。タブレット端末を導入し、会議の資料をタブレットで閲覧するということから始めようとするわけだ。しかし、この場面における紙の役割はプレゼンテーションであり、縦覧性であるから、紙のほうが優位性のある状況である。したがって、実はこの場面での紙の削減は最後に考えるべきものである。なぜ、ここに手を付けようとするかというと、もっとも簡単で、最も効果を発揮できる場所であるのだが、それは、IT技術を事務機の延長でしか考えていないことのあらわれにほかならないのではないか。

誤解のないようにここで書いておくが、ラップトップコンピュータの小さな画面ですべての仕事を行うという状況で、紙の削減を唱えても実現しない。それは、知的作業においては劣悪な環境であると言わざるを得ない。これもITの軽視であると思われる。紙の優れた縦覧性を技術で補うと言っても限界がある。ある程度大きなディスプレイを使える必要はある。肩をすぼめてラップトップを使う姿には、問題がある。金融関係のトレーダーのように複数のディスプレイを並べる必要があるとは言わないが、ある程度の広さは環境として必要である。仮想デスクトップ環境を活用すれば、いわゆるフリーアドレス型のオフィス環境で大きなディスプレイを設置する環境を実現しやすいし、セキュリティ的な配慮も様々な点で有利である。さらに、最近は4Kディスプレイが安価に利用できるようになり、作業環境は大きな改善をすることができる。

スマートフォンの活用、普及はメッセージ交換の閾を下げ、常時ネットワークに接続した環境での情報共有を実現し、紙に依存するよりも高い効率が得られるようになってきている。

情報の記録と情報共有と文書管理

行政文書では、意思決定の過程を記録で残すということが重要な要素であると言われることがある。これは、政治家の不当な関与、汚職などの不正を防止する意味で、記録を残し、事後公開し、白日の下にさらすことで不正が行われないようにする意味がある。したがって、外部の人間からの接触に関しては非常に細かく記録されることがある。

民間企業においては、不正の撲滅というよりは、情報交換による共同作業の円滑化のほうが重要な課題であろう。かつてはグループウエアというシステムがもてはやされたことがあるが、現在はSNSやメッセージ交換、グループチャットアプリケーションが用いられることが多くなっている。これを文書管理と結び付けて活用する必要がある。

完成された書類をメールで添付して送付するという方法は、公開、あるいは発行のプロセスとして行われることはやむを得ない。しかし、これは情報共有ではない。メールは、証拠としては十分であるとは思われるが、SNS型のメッセージ交換に比べると、情報共有や記録性の効率は低い。特に、参加者があとから増加していく状況ではメールはあきらかに不利である。

近年のインターネットを活用した世界における情報管理と情報共有の概念は、おそらく強くオープンソースコミュニティの影響を受けていると考えられる。すなわち、Gitに代表されるバージョン管理システムを活用した共同作業を行い、情報を管理し、共有するということである。共有リポジトリを活用し、情報を共有し、共同作業を合理的に行うことを指向するということだ。共用のファイルサーバは単にディスクが分散している最低限の非効率を解消するだけで、情報共有の効率化には寄与しない。

作成段階からのIT, クラウドの利用

根本な違いは、コンピュータを事務機としては捉えていないということである。作成から受容に至るすべての過程は意思決定の過程として有益な記録であり、ある時点でリリースが行われ、分岐し、保全される。

クラウドストレージを活用した情報共有はそうした機能を段階的に提供している。厳格なバージョン管理については、難解に感じることが多いためか、明示的に利用しない限りは適用されないことが多いようだが、ビジネス用システムにおいても、実際にはすべてのバージョンが保管されていることもある。

ビジネス文書においては、そうしたインターネット的な文書管理システムと、従来型の資産性を意識した文書管理システムが混在している状況ではないかと考えられる。ちょうどその中間が「使用」の状況である。

そうすると、近代的な文書管理システムにおける要求仕様を明確に整理できると思われる。まず、作成段階に必要なものは、プロジェクト単位のリポジトリと、そのリポジトリへの柔軟なアクセス権限の設定である。リポジトリの管理は、Gitと同様の強力なバージョン管理、履歴管理機能が求められる。

補助的には、その作業を支援するコミュニケーションシステムが必要とされるであろう。このようなコミュニケーションシステムは、近年のSNSの発展により十分な機能が備わっている。

オープンソースソフトウエアでは、リリース→使用→保守→リリースというサイクルがここに形成されている。メジャーバージョンのリリースによって、分岐が発生し、各バージョンで一定期間保守が続けられ、終了する。

ビジネス文書においても、リリースによる分岐はプロジェクトの個別成果として位置付けることができ、共通した概念と位置付けることができるだろう。バージョン管理を行うことによって、最新の文書がどれなのか分からないというような事態は排除できる。使用を行った場合には、分岐を行い保管すればよい。

使用以降の管理については、資産性を考慮した管理がビジネス文書には適していることも事実である。なぜなら、そこには、制度、法律がかかわっており、法務、税務上の理由によりその取扱を必要とする状況が存在するからである。

ただし、近年のITシステムにおいては、もはや廃棄というプロセスを考える必要はない。すべてが歴史的資産価値を有しているとみなし、保管するべきであるし、保管できる。

インターネットでの情報流通に対する意識

現在のインターネットを活用したITもしくはICT技術は情報、知識の共有に大きな力を持っている。すでに実現している様々な機能がそれを証明している。インターネット検索によって発達した検索技術は誰しも認めるところであるし、インターネットそのものを作り上げてきたソフトウエアの開発技術もその一つである。これらの技術を活用することが、紙に依存するよりも明らかにメリットがあることを示すものである。

両者に共通する機能は、検索機能であることは言うまでもないことだが、検索用のメタデータをどこに保存するかという問題については、検討する必要がある。というのは、テキストファイルには、そうした場所が存在しないが、さまざまなフォーマットの文書にはそうしたメタデータを保管する方法、場所が存在しているからだ。SGMLに始まり、その派生の HTML そして汎用化された XMLにはメタフィールドの定義がある。Microsoft Office では、プロパティとして、作成日時、作成者などの詳細な情報が保管することができ、タイトル、キーワード、コメントなどを追加することができる。PDFでは、PDFにする前の情報から引き継がれるフィールドと、PDF独自のフィールドが存在する。これは、PDFを作成するソフトウエアによって異なる。

現在の多くのシステムでは、この文書そのものに含まれているメタデータを活用して、それを検索対象にするというものは少ない。

しかし、このメタデータを活用するほうが、可搬性が高まることは言うまでもないし、それを検索対象にできることが望ましいことは言うまでもない。

情報の保全とメタデータ

IT化された社会においては、情報の保存は、ファイルという形を取ることが一般的である。作成された日や、更新履歴、更新者などの情報はコンピュータシステムには履歴、ログとして保管されている。電子決済システム、電子カルテなどの多くはこの形態であり、ファイルは上書きされることなく、バージョン管理が行われ、その記録がシステムに残る。

システム内で管理される間はそれでいいのだが、リリースされる時点ではシステムを離れることになる。この時にはファイル単独でその情報を保全することが必要になる。同一システム内で扱われている間はよいのだが、離れてしまうと履歴、ログから切り離されてしまう。この時点で必要な情報をメタデータの形でファイル自身に記録するというのが一つの方法であろう。

法務、税務的な要件では、条文の上では保全を求めているものの具体的な方策

を規定しているわけではない。情報の流れが一方通行のものであれば、システム内で情報が保全されれば十分である。

紙であれば、署名、捺印ということで発行時にこれに効力を与える。しかし、これはその文書に改変が行われていないことをなんら保証するものでもない。紙の偽装、偽造というのはいまやプロの手にかかれば極めて容易なものであることに気づくべきである。

電子的に、ネットワークやリムーバブルストレージで流通されるのであれば電子署名という手段が最も適している。電子署名を施されたファイルは改竄すれば、それが直ちに判明する。

電子署名の活用

電子署名は、公開鍵暗号系の技術 (PKI)を活用したもので、所有者を特定する電子証明書を用いた情報保全の方法である。証明書は、認証局(CA, Certification Authority)によって署名されている。証明書によって何ができるかというと、PKIの技術の基本である、秘密鍵で暗号化し、公開鍵で復号するという手法とともに、その鍵の持ち主が確かに本人であるかどうかを認証局が保証するという仕組みを提供する。証明書を発行(認証局が署名する)際に、厳格な本人確認を行い、さらに利用する際には、復号に使用する公開鍵が現在有効なものであるかどうかを、証明書上の有効期限だけでなく、認証局に問い合わせて失効していないかを確認できる。万が一秘密鍵を紛失してしまったときには、認証局に失効手続きを行うことによって、その鍵を利用できなくすることができる。

実社会における公証人役場における役割に非常に近いものであるが、インターネットの仕組みを活用してリアルタイムに利用できるようになっている。

電子署名は、文書のハッシュ値を取得し、電子証明書を用い暗号化して添付するものである。さらに、タイムスタンプ署名を併用することができる。これは、タイムスタンプサーバにやはり文書のハッシュ値を送り、時刻と共に署名を行い添付するものである。タイムスタンプ署名は、我が国では現在3個の認定タイムスタンプ事業者がある。タイムスタンプ署名は、公証人役場でいえば、「確定日付」に相当するものであり、その時刻に確かにそのドキュメントが存在していたことを第三者的に証明する効力がある。

残念ながら、どんなファイルにでも電子署名を行うことができるわけでなく、現在ポピュラーなものは、PDFに対する電子署名である。XMLに対する電子署名も標準化されているが、残念ながら容易にできるシステムはない。PDFに対する署名は無料のソフトウエアでも行うことができる。

電子証明書は、長くても3年の有効期限が設定されていることが一般的であるので、これを経過してしまうと、署名の検証ができなくなってしまう。これを防ぐために長期署名の方法が標準化されており、JISにも規定されている。

電子署名は、改ざん、改変を防止し保全するという意味だけではなく、署名者を認証するという目的もある。電子署名は複数名で行うことができ、それぞれの署名者の電子証明書を用いて、順次署名を行う。全員の署名が終わったら長期署名化を行い、保全するというのが長期署名に規定された方式である。

さまざまな制度では、簡素化のためにタイムスタンプ署名のみとか、改ざん防止の技術を用いるとか記述されているケースがあり、そうした方法を用いている事例も散見される。しかし、これはそのファイル単独で認証から保全までを一貫できるかというと疑問がある。システム内で完結する場合には、履歴、ログを併用して、操作を行った者を特定することはできるが、そのファイルがシステムを離れて単独に存在する場合には、その情報は入っていない。これは、多くの電子決済システム、電子帳簿システムに見られるものであるが、前述するようにシステムを離れては検証できない。もっとも、紙に印刷してしまってはそうした目に見えない情報はすべて失われてしまっているので、紙をベースの物事を考えていては、技術のメリットを生かしているとはいえない。

おわりに

2018年、森友学園問題にかかわる財務省の決済文書書き換えという衝撃的な事件が発覚した。実は、財務省では電子決済システムがあり、実際には決済文書は上書き消去されることなく、書き換え前文書もこのシステム内に存在していたことが分かったらしく、まったくもって間抜けな話なのだが、そうしたことはあまり問題視されていないように感じる。これは、文書の流通が紙をベースの行われているからで、ニュース映像にも膨大な紙の山が現れたし、公開された文書も何度もコピーが繰り返されたと思われる不鮮明なものであった。

紙になったものを起点にして情報を考えるというのは、なんとも時代遅れ甚だしいのだが、電子署名のような目に見えないものが理解されないのは、これに限ったことではない。日本のおとなの科学技術に対する無理解、あるいは軽視はかなりひどい。電子決済システムに関しても、業者に丸投げで全く関心がなかったのだろう。これをすべての財務省職員が認知していれば、こんなつまらない問題で国会が長期にわたり機能不全に陥ることもなかっただろうし、自殺者が出ることもなかっただろう。

技術立国を標榜するのに、惨憺たる状況と言わざるを得ない。

確かに、情報技術の変化があまりに急速であり、従来の意思決定の速度では全くついていけていないことはわからなくもないが、国際的な競争環境の中で、それが果たして許されることなのだろうか?日本はよくガラパゴスと言われることがあるが、それなりの市場規模があり、独自の規制が存在し、それを既得権益とするものがある。言語が大きく異なり、英語を理解できる人が少ないために、情報鎖国的な要素が起こりやすい。それが場合によっては悪用されかねないわけで、気が付いたら世界のなかで取り残されて、かつての繁栄をなつかしむ状況になりかねないのではないだろうか。

印刷技術の誕生によって、宗教改革が成功したといわれるが、インターネットのもたらした革命は、はるかに大きなものとなるのではないだろうか。そう言っているそばから、紙の情報を入力するという業務を巡って、またもや年金機構で事件が発覚した。これも時代遅れの業務が起こした歪と捉えられなくもない。根本的に考えを変えないといけない時期に来ている。

そうこうしているうちにも次から次へと文書管理の問題が発覚してきた。自衛隊の日報問題なのだが、そもそも「なかったはずの日報」という表現自体がおかしい。廃棄したはずのものが消えずに残っていたということで、デジタル化時代に、紙ベースの情報ライフサイクル上の廃棄が馴染まないことをはっきりと示している。