立場上、いろいろと巻き込まれ、2002年のみずほの三行統合以来、実に14年振りの連続夜間対応状態です。
当時との違いは、表面上は、障害無く(業務影響のないものはチマチマと発生しているが)稼働していることです。
三行統合の時は、まぁコケるコケる(苦笑)
オンライン処理もダメなら、夜間バッチなんて最悪
接続システム側が障害で稼働せずデータが送られて来ない
待ち合わせ限界(あまり遅いと処理全体が遅延して、翌朝のオンラインが起動できなくなる)仕方がないので、切り離して実行することになれば、データ整合性が崩れ、また停止
やっとデータが送られて来たと思えば、仕様と違うデータが送られて来て、受信面で障害
パッチとか言う名の手直しで何とか後続に流せば、また、何処かで落ちる…
これに比べると、スリリングな夜を過ごしてはいますが、なんとか翌朝のオンラインは正常に稼働させていますし、オンラインでのデータ不正も発生していません。
システムテストの工程で、滅茶苦茶な品質傾向値が出ていて、一斉品質検査の実施と特異値発現プログラムの改修を品質管理と運用管理の責任者としての立場から指摘したら、本番では絶対に起こらない、問題のある報告はするナ、銀行側に提出する統計値を変えろ(改竄しろ)と命令し、あくまで反対したら自分の子飼いを送り込んで来て、都合の良い検査結果にすり替えた、いまは合併でなくなってしまった某メーカー系のソフト開発会社の責任者のような方もいません。
しかし、夜の世界は、どうして良いのか皆目手だてが見つからないお手上げ状態の世界になりつつあります。
オンライン重視の構成のところに、いろいろな業務環境の変化から大量データ処理(バッチ処理)が必要になったのに、それに合わせた構成を作らなかった(バッチ処理の専門家がいなかった)のが問題です。
HOST全盛の時代、大量データのバッチ基幹処理の設計開発、運用改善に従事してきた身としては、サーバの性能が良くなって、あまり深い考えを持たなくても良くなった現在の環境、それに頼り過ぎて知識が欠如している技術者に呆れるばかりです。
技術の世界で、便利になったことが必ずしも良い訳ではないと言うことの典型的な事例のように感じます。
因みに、σ(^_^)が製品選定と導入支援を担当し、コストを掛け過ぎだのなんだのと散々言われてもガンとして品質確保で譲らなかった部分の機能については、障害発生ゼロ記録を順調に更新中です(ちょっと、自慢♪)
カテゴリとレベルは全然違いますが、写真の指紋認証機能が搭載されていないPCに訳の分からないドライバをデバイスパックとして送り込んで来て、勝手にエラーを出しまくるメーカーユーティリティーなんて可愛いものです(苦笑)
122024
Posted at 2016/04/24 00:43:05 | |
トラックバック(0) |
コンピュータ関係 | パソコン/インターネット