12月21日のサービス障害について

いつも Feedeen のご利用ありがとうございます。運営者の伊藤です。

本日(12月21日)の午後1時頃から1時間ほど、Feedeenのサービスが事前告知なく停止する障害が発生いたしました。影響を受けた皆様、たいへん申し訳ございません。現在判明している情報をご報告させていただきます。

概要

12月21日の13:04頃、データベースサーバーの異常を知らせるアラートが発生し、確認したところデータベースへのアクセスが遮断された状態となっていました。早急な復帰は不可能と判断したため、Feedeenをメンテナンスモードに移行し、データベースにアクセスするサービスをすべて停止して復旧作業を行いました。14:00頃に復旧作業が完了し、メンテナンスモードを解除、サービス復帰のアナウンスを行いました。

障害による影響

約1時間の間、サービスの停止が発生しました。なお、この障害によるデータの喪失はございません。

障害の原因

データベースサーバーとの通信が突然遮断され、一時的にですが完全にアクセス不能な状況となりました。このため、Feedeenのほぼすべてのサービスを停止せざるを得ない状況となりました。アクセス不能となった原因は把握できておりませんが、クラウドプラットフォーム内の通信障害、もしくはサーバーをホストしている物理マシンの再起動などが考えられます。

障害への対応

当初はデータベースサーバーへのアクセスが完全に遮断された状態に陥ったため、別のデータベースサーバーを起動して差し替えるべく作業を開始しました。しかし、作業中にアクセスが復帰し、データベースサーバーの再起動に成功したため、現行のサーバーを使って復帰させる方針に切り替えました。データベースの再起動後、簡単なチェックを行った後に各サービスを順次復帰させました。

今後の対応

現在のところ、 Feedeen ではシステムの冗長化等の対策が運営コストの面で難しく、サーバー障害による突発的なサービス停止は(稀にではありますが)今後も発生する可能性があります。監視体制の改善などで、万一の場合でも速やかに復旧できるよう努めてまいります。

また、一度障害が発生したサーバーは障害発生の確率が高まることも考えられるので、近いうちにデータベースサーバーの入れ替えを検討しております。その場合は告知の上で深夜にメンテナンスを実施させていただきますので、ご理解・ご協力のほど、お願い申し上げます。


今回はユーザーの皆様にご不便をおかけすることとなり、大変申し訳ございません。上記の通り対策は限られるのが現状ですが、サービス断を最小限にするべく努めてまいります。今後とも Feedeen をよろしくお願いいたします。

コメント

このブログの人気の投稿

運営者入院のため、メンテナンスとサポートが数日滞ります

退院しました

手術成功しました