
既報の通り、東京証券取引所のarrowhead(アローヘッド)で、システム障害が発生し、終日取引停止となりました。
システム障害で取引終日停止は前代未聞の出来事だと思います。
arrowhead(アローヘッド)は、2010年のシステム運用開始以来、富士通が基盤を担当していて、毎々システム更改前のRFP(形ばかり)で、他社もチャレンジしますが、富士通の牙城となっている領域です。
画像は、前々回の2015年の更改時のシステム構成の資料ですが、昨年(2019年11月)の更改も基本的には、2015年の構成の後継モデルが稼働しています。
問題が発生した部分は、ストレージ( ETERNUS)に絡む部分のようで、ディスク障害等でバッチ処理が異常終了する等発生し、フェールオーバー(HA)したところ、メモリー障害により切り替わらなかったと説明されています。
このメモリー障害がどの部分を指すのかはよく分からなかったのですが、マザーボードと言う発言があったことからRAIDメモリーなのかもしれません。
ここからは今までのプレスリリースやRFPのレギュレーションからの推察です。
基本的な仕組みとしてフロントサーバー(PRIMEQUEST)は、2019年11月更改時の記事を見ると数を並べて処理能力と冗長性を担保しようとしているようです。
安価なIA Serverを並べて構成する方法は、よくある話だと思います。
DB Serverは、当然、冗長化(ホットスタンバイ)されていて、片系が死んでももう片系で処理できる構成になっていますし、当然、Server内部のCPU、メモリー等も部分的に切り離せる構成になっていると思います(なっていなかったら大笑い)。
ストレージは、内部のディスクはPAID6以上の構成になっていると思われます。
ディスクが1つ2つ死んでも筐体内でカーバーできる仕掛けですし、筐体自体がダメ~ってなったら、ここも冗長化されているので、片系が死んでも…
が切り替わらなかったですね(^^ゞ
障害は発生しないに越したことはありませんが、ソフトウェアもハードウェアも何かしらの不具合が発生する可能性を排除できない代物なので、発生した際の手際が問題になると思います。
そう言った意味では、今回の全面停止は、よく決断できたと思いますし、機器交換も夜の早い時点でよくできたと思います。
ところで、加藤勝信官房長官の「大変遺憾」発言はスルーするとして、東証の会見で質問している記者の質の悪さ、知識の無さは呆れるばかりです。
システム障害の原因や故障個所の可能性を問う為には、ある程度のシステム知識がある方が質問しないと、それことストレージって…フェールオーバーって…って、入門コースのような話になり、全く意味のない物になります。
日本の市場の信頼性がぁ~、賠償問題がぁ~、引責辞任はぁ~って、この時点でやっても全く意味ないと思うんですよね(苦笑)
別に東証や富士通の肩を持つつもりはないですが、あまりのレベルの低さに同情したくなってしまいました。
あと、我が陣営の関わっている部分でなかったので、ホッとしたのも事実です(^^ゞ
126902
Posted at 2020/10/02 03:04:02 | |
トラックバック(0) |
ニュース | パソコン/インターネット