« 入力制限(正規表現のすすめ) | トップページ | さよならパソコン通信 »

2006.03.11

負荷に泣く

とりあえず一睡もしていないであろう中の人たちに、同業者として合掌。>ココログ
残念ながら、またしてもココログのメンテナンスが障害を呼ぶ結果となってしまったわけである。
原因解明云々についてはここでどうこういっても情報もないことだし憶測になってしまうので、今回はこの題材を元に「負荷と保守」について考えてみた。

ともかく、高負荷状態、というのはシステムにとっても何が起こるかわからない最低の状況だ。
だからこそ、システム稼働前の重要テスト項目に負荷テストというものが存在する。とはいえ稼働後の負荷上昇に対しては、事前のテストは基本的に無力である。
東証が注文件数・約定件数制限をかけていたのは記憶に新しいところであるが、あれは英断といっていいだろう。それを経営層がジャッジし市場に対して理解を求めたという点で、西室会長は偉いと思う。
ちょっと話がそれたが、その高負荷がコントロール不能な「お客様」からのトランザクションである、というのが輪をかけていやらしいところであろう。
社内ユーザ向けのシステムであれば、いろいろ苦情は出ようとも基幹部分以外の機能はすべて殺してしまい、業務を止めない部分に資源を集中ないし全面停止しユーザーの協力を仰ぐ、ということをするのが常であるが、お客様向けに開放している系であるとそれが難しい。どう対応しても非難をいただくことは必至だ。
対お客様である以上、言い訳は許されないのはどうしようもない。ただ誠実に対応を行う以外に最終的にやれることはない。

ウェブ系のシステムはとかく不規則なかつ想定が難しい負荷をかけられる傾向がある難しいシステムだ。
異常事態に適応できるだけのハード資源を確保すること、またそれを正常に維持管理することだけでも高度な保守運用能力が要求される。
通常、多くの顧客を集めるということはボリュームメリットで投資コストに対する利益を最大化できるというのが一般常識であるが、時としてこの方程式が崩れることがあるのがウェブの世界の面白くも悩ましいところであろう。
また障害時に負荷が雪だるま式に脹れ上がるのもウェブ系の恐ろしいところだ。
「あれ、ページがうまく表示されないや」
「あれ、きちんと注文できてないのかな?」
こうなったときにユーザーが行うアクションは何だろうか?
とりあえずリロードしたり、ページを戻して再処理を実行したりであろう。元々ふんづまっているところにリトライ要求がどんどん加えられるので、すでに窒息していたボトルネック部分はあっという間に壊死してしまう。

今回のボトルネックはDB部分ということで、ウェブ型システムの一番ボトルネックが顕在化しやすい部分だ。私が担当したシステムでは回線ネックによる障害が一番多いので、DB部分でも悩んでみたい、とかいうのは自虐的ジョークだが(^^;

どうやったらこうした障害は防止できるのだろうか?
どうやったらこうした障害の逐次対応がうまくいくのだろうか?
対岸の火事じゃなく考えないといけないだろうな……。

|

« 入力制限(正規表現のすすめ) | トップページ | さよならパソコン通信 »

コメント

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/2022/9030194

この記事へのトラックバック一覧です: 負荷に泣く:

« 入力制限(正規表現のすすめ) | トップページ | さよならパソコン通信 »