全日空のトラブル対応は早かった
おそらく26日(土)におかしな兆候が出始めた頃から情報システム部を中心に召集がかかったはずです。27日(日)未明には処理能力が低下ということで、経営層にも連絡され対策本部が設置されたことでしょう。システムトラブルの原因を追求する |
システムトラブル時の原因特定はかなり困難です。単一原因の場合もありますが、いろいろな条件が重なった複合的な原因の場合もあります。
また現場は混乱しており精神的にもおいつけられた中で、一つずつ原因と考えられそうな要因をつぶしていかなければなりません。
全日空では12:30頃にはサーバーを元に戻し、汎用機に滞留していたデータを削除しましたので、午前中にはある程度、原因を特定できたようです。
修正による新たな不具合が発生しないか確認し、システムを本番に切り替え15時間ほどで全面復旧となりました。情報システム部のトラブル対応としては及第点でしょう。
部門間の情報連携が大切
全日空は人の命を預かる航空事業ですので、システムトラブルに際して「欠航する」という経営判断をしました。もちろん出張や旅行などで巻き込まれた乗客にとっては迷惑な話ですが、経営判断を遅らせカウンター窓口など人間系のトラブルをさらに引き起こしては言語道断です。これも及第点でしょう。
あまり報道で触れられませんでしたが、部門間の情報連携はどうだったのでしょうか。
情報システム部でトラブル対応を行いますが、原因追求よりも「いつ復旧するのか」が最大関心事になります。情報システム部である程度の原因が特定できても実際に対応してテストしてみなければ復旧時間の目安がたちません。
殺気だった現場に、「いつ復旧するのか」と一方的に電話をしても「このやろう、そんなこと分かるか!」と怒鳴り返されるのがオチです。
情報システム部に報告させるより対策本部から人を派遣し、現場の雰囲気やどこらへんまで目星がついているか派遣した人に逐一報告させます。
対策本部で収集した情報を整理し、顧客対応する窓口業務の担当部署やマスコミ対応する広報部門に的確に連絡しなけばなりません。復旧がいけそうだと判断した時に情報システム部に最終確認をとり、復旧の見通しを発表します。
コンティンジェンシープランを用意
システムトラブルを100%起こさないことはまず無理です。あらかじめ対応策を検討をしておく必要があります。システムトラブルや個人情報漏洩など経営では何が起きるか分かりません。企業規模にかかわらず緊急時のコンティンジェンシープランを用意し、事が起こった時にあわてず対応できるようにしておく必要があります。
またトラブルが起こった時は部門だけでは対応せず会社全体で対応します。部門間の情報連携をどうコントロールするかは経営層の大きな宿題です。まずは会社を取り巻くリスクを想定してコンティンジェンシープランを作成してみましょう。
「2007年問題」もあり汎用機からオープン系への移行が時代の流れですが、やはり一筋縄ではいきませんね。
参考ガイド記事
みずほのトラブルの原因に迫る!なぜ製品回収に?ソフト技術者が7万人足りない!
みずほ証券うっかりミス わずか16分で大損失に
「eMac」を2,787円で販売! ヤフーショッピングの誤表示事件
個人情報漏洩をしてしまった!
何で1日の売上が1億もあるの