Webサイト運営について

はてなに以下のような質問
一定規模以上のWebサイトを運営しているエンジニアの方、業務時間外の障害対応ってどういう風にやっていますか?
ルールとか体制とかを中心に教えてほしいです。
ちなみにぼくの会社では、監視ツールや自作監視スクリプトでアラートをエンジニア社員全員に送って、誰かが対応することになっています。(たまに誰も対応やレスをしなくて上司に怒られます)
これはぼくら社員にとって正直ストレスになるので、なにかよいルールや体制を上司に提案したいなと考えています。
ぜひみなさんの会社のやり方を教えてください。
よろしくお願いします。

特定されない程度で自分の経験も書いてみる。もう退職したしね。
前職はわりと有名な商用Webサイトでした。
自分の入社した当時は手動かせるSEは自分しかいなかったけど、
その頃はほぼフルアウトソーシングだったんで、
※オペレータ⇒開発会社⇒自分という順序で電話。
トラブルは毎日起こってたんで毎日電話。
でも対応はあくまでも開発会社がやってたんで、
上への状況報告のみ。
でもほんとにつらかったのは入社後一年後ぐらい。
内製やるとか当時の子会社社長が言っちゃったんだけどあぼん。
そのせいで社員はほぼ自分ひとりで管理してた。
(BPの人が一名協力してくれた)
でもリリースしたばっかりだったんで、毎朝2時ごろには起こされ、
ログ見てソース直してとか、
Oracle君が暴走するんで、週に三度ほど朝5時出勤で再起動したりと
ほんと死ぬかと思ったなぁ。
※オペレータ⇒自分への監視報告のみなので、
そこから切り分け、対応、上への報告、お詫びメールなど。
そんな事が半年続いたんでずいぶん強くなったな。
提案できるほど力も知識も無かったんで、結局耐えたっていうのが答え。
でもスキルと耐性と切り分け能力は抜群についたので
若かったしよかったのかもしれない。
ほんとは、体制組んで、手当てつけてってのが一番よいけど、
最近の転職したい人ってみんなこの手の仕事をいやがるんだよね。
しかもそんな人が事業会社に行きたいって言ってる。
そりゃ無理でしょ。
スポンサーリンク

0 件のコメント :

コメントを投稿