東証システム障害の東証社長記者会見で分かったことを書いておく

2020年10月1日木曜日

時事

t f B! P L

 東証システム障害の東証社長記者会見で分かったことを書いておく。

 


東証で運用する証券取引システム「arrowhead」がシステム障害で停止し、東証トップの判断でシステムを終日停止にした。

 

arrowhead」は昨年11月から運用開始した新システムで、富士通がハード・ソフト共に開発している。

 

東証の株式売買システム「arrowhead」をバージョンアップ

 

システム障害の原因は、ハードウェアの物理的故障で、「サイバー攻撃」や「許容範囲外の高負荷によるダウン」のような事故では無い。

また、システム自体は不具合もなく、東証は富士通への損害賠償など考えていない。

「富士通はあくまでシステムを納入するベンダーであり、証券取引に関する運用責任は東証にある」

と東証社長は回答している。

 

arrowhead」は350台ほどのサーバーが連動して稼働する巨大なシステムで、ゲートウェイサーバーを通じて、証券会社のシステムと連携して、証券取引が行われる。


この内、全てのサーバーが連携する為に共通で必要とするデータやプログラムなどを格納する「共通サーバー」でメモリの物理的故障が発生した。


「共通サーバー」はデュプレックスシステムになっており、通常はプライマリーサーバーが稼働してシステムを支えているが、これがダウンした場合は、予備のセカンダリーサーバーが起動して、システムを支える。

これを「フェイルオーバー」と呼ぶ。


プライマリーサーバーでメモリの故障が起き、通常ならセカンダリーサーバーに切り替わるはずが、正常に切り替わらなかった。


その原因は、現時点では不明である。

 

「共通サーバー」がダウンした時点で、東証トップはシステムの終日停止を判断した。


その理由は、証券取引システムは東証システムと、東証システムを利用する証券会社のシステムの連動によって、稼働しており、証券取引は双方共一日単位で稼働し、夜は停止する。

 

東証システムだけ、リセットして再起動すると、その日に証券会社システムから入力された取引依頼のステータスデータが、東証システムから消滅してしまい、証券会社システムとの連動ができなくなる。


つまり、証券会社システムと東証システムのステータスが一致しなくなるため、証券会社システムが誤動作してしまう。

どんな誤動作するかは、証券会社のシステムが各種多数存在するので、予想は付かない。


これはとてもリスクが高い。

 

しかし、証券会社システムと東証システムは両方とも、一日単位で稼働するので、東証システム側を終日停止にすれば、証券会社システムもその日の夜に終了して、翌日最初から再起動するので、ステータスを最初からやり直して、通常業務を再開できる。


本日の取引は全て「未達」、つまり取引は成立しなかったことになるため、取引上の齟齬は起きない。

 

今後、富士通と協力してフェイルオーバーが起きなかった原因を究明して、問題を解消する。


メモリの故障は、修理して明日朝から東証システムを再開する。


しかし、フェイルオーバーが稼働しない原因が分かり対策するまで時間がかかるので、当面は「共通サーバー」に人が張り付き、故障時にフェイルオーバーが稼働しなければ、スイッチオーバー(人が手動で切り替える)する。

 

当面はこの運用で、証券取引システムを稼働することが可能である。

 


 大変、丁寧な説明で、素晴らしい会見だった。

なにより、経営者がシステムやコンピュータの仕組みを熟知しているのが素晴らしい。

本来、システムを運用する経営者はこうでなくてはいけない。

他の会社の経営層も是非見習うべきだろう。



なお、メディアの質問は最悪だった。

どうしようも無い「ITオンチ」だ。

メディア内部にITの専門家ぐらい配置しておけば良いのに。

このブログを検索

Translate

人気の投稿

自己紹介

自分の写真
オッサンです。実務経験は Windows環境にて C#,VB.NET ,SQL Server T-SQL,Oracle PL/SQL,PostgreSQL,MariaDB。昔はDelphi,C,C++ など。 趣味はUbuntu,PHP,PostgreSQL,MariaDBかな ?基本無料のやつ。

QooQ