異国見聞私書録

異国から見たこと感じたこと気になったこと。そして時折テクノロジーのお話。

障害報告書は必要なものなのか?

久しぶりの更新になってしまったが、再開したい。

エンジニアなら知っておきたい障害報告&再発防止策の考え方
http://qiita.com/hirokidaichi/items/f9f4549c88aaf8b38bda

障害報告書を書くことはエンジニアにとって必須要件であると思っていたが、所変わればそうでもないようだ。

こういってはなんだが異国に滞在して、まともな障害報告を見たことがない。こちらから請求しないと出てこない場合も多々あり、いったいどうなっているのかと常々思う。出てきても、言い訳に終始したものであったり、「メンバーのbest effortによりすばやく解決しました!」といった、主旨から大きく的外れな報告であったりする。

はじめは、限定的な会社のみに起きうることかと思っていたが、他社と取引を重ねるうちにそうでもないことが見えてきた。もちろん、まともな会社も中には存在するが、その多くはまともなものを提出しない。提出しないどころか、「なんでそんなモノが必要なのか」といった怪訝な態度を取られる場合もある。おそらく過去に提出した経験も少ないから、的が外れた報告書が出てくるのかも知れない。

 

かなり昔にNASAでは「人間はミスをするもの」ということを前提として、全てをオペレーションするといった主旨の記事を読んだことがある。どういうことかというと、失敗後のフォローの仕方に注力を置き、失敗自体は素直に受け入れるというものだ。ミスが起きた後のフォロープロセスさえしっかり出来ていれば、ミス自体は怖いものではないと言い換えることができると思う。

こうした考え方を背景に、ベンダーの外部向けの障害報告書は軽視されているのかどうかはわからない。内部向けのものが充実していればフォロープロセスもしっかりしてくるのかも知れないが、度重なる障害をみるとおそらく過去のミスも現在に活かしきれていない。

日本人の目から見ると「ぬるま湯」な状況に思えなくもないが、最近この考え方は半分違うと思うようになった。ベンダーのシステムを厳しく監視し、叱りつけ、報告書を提出させ、100%の稼働率を求めることに血道を上げるだけではダメなのだと思う。

 

信号機の故障、電車の運行停止、停電・・・こうした事故は日本では起きることは珍しいが、先進国と言われている国でさえ、異国ではかなりの頻度で起きる。客側もそうした事態には慣れているので、特段騒ぐことはないし、新聞に載るときはよほどの大規模障害となったときだけだ。この「ユーザ側の慣れ」、言い換えればユーザ側の危機対応能力は日本よりも日々「鍛錬されている」実感がある。信号機が故障すれば順番に交差点に入るルールはあるし、電車が止まればバスを使えばよい。停電時にはロウソクとトランプで時間を過ごすなど各人工夫をしている。

こうした延長線上にシステムに対する認識もあるのではないかと思う。ユーザ側からシステムへの過剰な期待などそもそもされていない。常に別ルートが、意識/無意識下なのか不明だが、模索され続けていると思う。ユーザ側から「システムはミスがあるもの」と認識されているのだろう。

システム屋にとってこの認識がされているのが幸か不幸なのか、少し複雑な気持ちではある。しかし、リスク分散意識を各人が持ち合わせているのは決して悪いことではないと思う今日このごろである。