社会保険庁システムダウン

朝日と、スポニチの記事から。

年金のシステムが2時間半におよびダウンしていたとの記事。記事を見ると、休日なのに、問い合わせアクセスが殺到したことによる高負荷の問題と推定される。

この記事を見た技術者としては、社会保険庁GJと思った。殿様仕事を運用のメインに据えていれば、休日の運用で負荷が高くなることは想定されていないであろうことは想像に難くない(10年以上前に設計が為されていたのであれば当然。日曜日の年金相談窓口開設は初とされている)。システムダウンに対して、人手が足りないであろう日曜日に、たった2時間半で復旧を成し遂げたのは、社会保険庁とその裏にいる技術者たちが素晴らしい働きをしたからと言うべきであろう。ANAの件よろしく、普通なら終日ダウンしていておかしくない。

一度目の障害に対して、手早い復旧はGJといえる。
しかし、一度やってしまった以上、二度目は許されない。システムダウンの原因を追及し、場合によっては日曜日の窓口をとりやめることも当然、視野には入っているはずだ。
ここから先、このシステムがどうなるか注目していきたい。

[追記 6/13 19:55]
システムダウンの原因が特定された。
【続々報】年金システム障害の原因はミドルウエアのバグ、6年を経て顕在化(ITpro)
やっぱり、システム管理者たちGJで良かったらしい。
設計思想の外で行われたオペレーションに対して、あらかじめテストなどできるわけもなく、このシステムダウンは必然的に、不可避に起きたということが証明された。
同じような事故は、官民問わずこれからも起きるだろう。そんなとき、批判をする前に一歩立ち止まって待つだけの心の余裕が、我々システム利用者に求められる態度ではないだろうか。そして、システムの設計者は利用者に甘えず、正しく動くシステムを開発していくことが求められている。

タグ: ,

コメント / トラックバック3件

  1. Pleco より:

    初めまして
    かげながらROMしておりました。

    今回の件、情報も錯綜しているようですが、職員の話によるとシステムダウンはこれまでも年に数回起きていたようです…
    旧式で、年間運用コストだけでも500〜1000億掛かると言われているシステムですので、そろそろ全面見直しが行われないと厳しいような気もしますね。

  2. 菅野たくみ より:

    http://www.nikkei.co.jp/sp1/nt210/20070610SSXKA006010062007.html
    日経だと1時間半となっているようで、記事によってダウン時間も変わっているようです。

    >Plecoさん
    ごきげんよう。コメントありがとうございます。

    頂いたコメントが本当ならば、システムダウンは定常的にあったようですね。
    該当のシステムはミッションクリティカルとは言い難いですので、年数回程度のサーバーダウンであれば、設計当時は許される余地があったのでしょう。
    このシステムの利用目的を拡大し、リアルタイムの業務に応用したことでミッションクリティカル性が生まれてしまったのであれば、過去のシステム設計者を責めることは不可能です。

    ですので、仰るとおり、システムの全面見直しは必要でしょうが、早急な見直しと言われてしまうと、一旦立ち止まって首をひねる必要があるでしょう。
    年金記録漏れ問題の解消のため、名寄せのシステム開発を始めたところ、元のシステムが大きく変化したことが原因でデータ損失などの致命的バグが多く出るようでは、本末転倒と言えます。

    課題が山積しているところ、このあたりのさじ加減が非常に難しいところではありますが、難問に立ち向かう優秀な技術者の方々に期待したいところですね。

  3. 菅野たくみ より:

    追記……

    http://itpro.nikkeibp.co.jp/article/NEWS/20070611/274287/
    速報ですが、社会保険庁&NTTデータによると、日曜対応コードを入れ込んだことがバグの原因と推測されているようです。
    真因の追求はまだまだ時間が掛かりそうです。

コメントをどうぞ