スピードが求められる障害対応に、IIJ独自開発「Barry (バリー)」(IIR vol.51 3章)
2021年06月30日 水曜日
IIJでは世界規模のインターネットバックボーンだけでなく、クラウドを構成する多数のサーバ、また、それらを利用したインターネットサービスの運用を行っています。インターネットが重要な社会インフラとされる今日、これらの設備に発生した障害を早急に復旧することが重要です。また、障害対応に従事するスタッフの負担をできるだけ軽減することも、今の社会情勢で求められています。障害対応に当たるスタッフを支援するためにIIJが開発した支援システムについて報告します。
- 本報告のポイント
- システム運用における障害対応の負担についての課題を考察した。夜間・休日など通常業務時間外における待機スタッフの呼び出しや、障害対応開始後のコミュニケーションに課題がある事がわかった。
- 課題に対する改善策として独自の支援システム・スマートフォン向けアプリを開発した。開発に当たり、各運用チームの体制に適した呼び出し方ができるような工夫をした。対応開始後のコミュニケーション支援機能や、活動状況の記録機能も実装した。
- 実際に190の運用チーム、633名スタッフにシステム・アプリを導入した。導入したアプリによって運用品質が上がり、スタッフの負担が軽減された。
全文はこちらからご覧いただけます。
関連リンク
以下ではIIRの読みどころとなるポイントを紹介しています!
- 定期観測レポート 2020年度、200倍に急増した迷惑メールとパスワード付きZIP対策(IIR vol.51 1章)
- IIJ、フルMVNOの更なる挑戦(IIR vol.51 2章)
- スピードが求められる障害対応に、IIJ独自開発「Barry (バリー)」(IIR vol.51 3章)※本記事です