その裏側には壊れるシステムがある。

USではAmazonが運営するストレージサービス"Amazon S3"がダウン、日本では航空管制システムの一部がダウンするなどして混乱が発生しています。

米国Amazon.comのストレージ・サービス「Amazon S3」が2月15日未明にダウンし、同サービスを利用するWebアプリケーションにさまざまな障害が及んだ。
同社のWeb Services部門が運営するディベロッパー向けの掲示板には、Amazon S3ユーザーからの書き込みが殺到し、同社スタッフは対応に追われた。S3サービスがダウンし、「膨大な数(およそ500件)の内部サーバ・エラーが発生した」と最初に書き込まれたのは、米国太平洋標準時間(以下、すべて同時間帯)15日の午前4時30分ごろだった。その後、このスレッドには、「Amazon S3を使ってすべての動画をホスティングしているわれわれのWebサイトでも同じ問題が発生している」「バックアップの実施予定時間はいつになるのだろう」「このサービスを基幹業務で使っているユーザーもいるので、このフォーラムには書き込みを続けられるようにしてほしい」といった書き込みが相次いだ。

http://www.computerworld.jp/news/trd/98631.html

18日午後4時30分ごろ、国土交通省の東京航空交通管制部(埼玉県所沢市)でコンピューターの管制システムの一部がダウンし、レーダー画面に航空機の便名と目的地が表示されなくなるトラブルが発生した。

http://www.yomiuri.co.jp/national/news/20080218-OYT1T00446.htm?from=main5

普段、あることが当たり前に使っているどんなサービスの裏側にも、そのサービスを支えるシステムがあります。現在のオンラインシステムの多くはIAサーバで構成されており、今あなたがお使いのWindowsのサーバ版や、Linux, Solaris, VMwareなどのIAサーバによって構成されたシステムがそのシステムの稼働を支えています。もちろん昔ながらの汎用機や、UNIXサーバなどもまだまだ多く使われているのですが、IAサーバは着実によりクリティカルな箇所で、より高負荷な使い方をされるようになっています。それらのシステムを構成するサーバ、ストレージ、ネットワーク機器は、あなたのパソコンや、ADSLルータや、8ポートスイッチなどよりもより高機能な、様々な冗長性が確保されたシステムが使用されていますが、基本的に使われている個々のパーツの信頼性には、それほど大きな差があるわけではありません。当然、いつかはどこかに問題が発生し、故障し、交換が必要になります。インターネットを使ったオンラインサービスが普及し、ハードウェアの姿が見えないサービスが無数に提供され、誰もがそうしたサービスを在って当たり前のもののように使っているのですが、その裏側には「実体」があるわけです。
社会はシステムに依存しています。人は社会をシステム化することによって現在の経済を維持しています。時々こうして障害が発生することにより、人々はその裏側に構築されたシステムの存在を思い出し、危惧してみたりするのですが、2,3日も経てばそうした危機意識は薄れてしまっています。
システムは普通、より多くのコストをつぎ込むことによってより安定性・可用性・信頼性を増すことができますが、90%の信頼性を99%にまで高めることはちょっとした追加コストで実現することができたとしても、99%を99.99999999%にするためには、場合によっては90%から99%に信頼性をあげるよりも桁違いに大きなコストが必要となる場合があります。そのサービスを提供する仕組みとして必要な信頼性を考慮して、適度なコストとの天秤によってシステム構築されますが、どんな考慮しても壊れるときには壊れるわけです。
そういうわけで、どんなシステムでも壊れるわけですから、「壊れたときのこと」をちゃんと考えておくこと。それが最後の、しかもコストには現れないものの最終的な結果を左右する最後の砦なのではないでしょうか。「壊れたときのこと」には2つの正反対の面があります。「壊れたら、どうするか」という対応策の面、そして「壊れたら、どうなるのか」という予測や検討の面。この2つの面はどちらも重要で、どちらが欠けていても「壊れたときのこと」を考えたということにはなりません。
些細なシステムから、非常に重要なシステムまで、現在はシステムを使わずして社会生活を送ることはほぼ不可能です。そんなわけで、どんなシステムでも「壊れたときのこと」を考えておいた上で、普段はその便利さを享受することが重要なのだと思います。