ビットコイン急騰後のBitMEXサーバーダウン、当日と平時の障害対策について報告

BitMEX、先日のサーバーダウンの詳細を公開

仮想通貨デリバティブ取引所大手BitMEXで5月19日にサーバーダウンが発生していたが、そのことについての詳細報告が公式で公表された。

サーバーダウンが確認されたのは、日本時間19日21時に差し掛かるタイミングで、APIとウェブサイトが停止。当時、ビットコイン市場は一時9900ドルあたりまで急伸したのち、9700ドル台に反落したところだった。サーバーダウンによって、BitMEXではチャートが9,746ドルでフリーズ状態になっていた。

報告によると、ダウンタイム中において、ユーザーのポジションの強制清算は発生していなかったとのことだ。

BitMEX BTC/USDチャート

同社が公表した内容によれば、今回のサーバーダウンの原因について、そのハードウェア面の問題が引き金になっていたことを伝えている。

これまでBitMEXは、高まる取引量に対処し、ソフトウェア・ハードウェア面での障害によるリスクを削減するため、エンジニアチームが日々のアップデートを行ってきたと説明した。

また非運用環境にて毎週、サービスの停止をシミュレーションし、復旧手順の検証および自動化を進めるなど、障害発生時の対策も施してきたことを明かした。

そのうえで、今回のサーバーダウン発生を受け、これまでの対策をさらに強化し、さらなる安定的なサービスの提供に努めるとしている。また、そのためにシステムを保守するスタッフを積極的に募集しているという。

インシデント解決までの時系列記録

BitMEXはインシデント発生から解決までの対応について、以下のように時系列にまとめている。(日時は協定世界時(UTC)に準拠)

  • 12:00 トレーディングエンジンがリスタートし、オフラインに
  • 12:01 エンジニア・デブオプスチームが問題の解決にあたる
  • 12:13 顧客がhttps://status.bitmex.comやテレグラムのBitMEX公式チャンネルでアラートを受け取る。
  • 12:20 トレーディングエンジンサービスの一部が復旧、さらなる復旧に向け次の解決手順にあたる。
  • 12:38 トレーディングエンジンサーバーが二回目の再起動を開始、別の解決手順に当たる。
  • 12:41 クラウドプロバイダーが、二度のサーバーの再起動の原因がハードウェアの問題にあったことを確認
  • 13:04 トレーディングエンジンサービスが復旧
  • 13:23 トレーディングプラットフォームがオンラインに
  • 13:40 取引が再開
  • 引き出しは14:00と15:00に行われた。

これまでも、BitMEXにシステム障害やDDoS攻撃の事例が見られた。コロナショックによる暴落に際した3月13日、サービスが一時停止していたが、のち2度に渡るDDoS攻撃を受けたことを明かした。

当時、ETH/USDの取引でユーザーの損失が発生し、計156アカウントが影響を受けた。そのため、補償金額として計40.297BTCの払い戻しを行なった。

参考:BitMEX


画像はShutterstockのライセンス許諾により使用
「仮想通貨」とは「暗号資産」のことを指します