スピードが求められる障害対応に、IIJ独自開発「Barry (バリー)」(IIR vol.51 3章)

2021年06月30日 水曜日


【この記事を書いた人】
IIJ Engineers Blog編集部

開発・運用の現場から、IIJのエンジニアが技術的な情報や取り組みについて執筆する公式ブログを運営しています。

「スピードが求められる障害対応に、IIJ独自開発「Barry (バリー)」(IIR vol.51 3章)」のイメージ

IIJでは世界規模のインターネットバックボーンだけでなく、クラウドを構成する多数のサーバ、また、それらを利用したインターネットサービスの運用を行っています。インターネットが重要な社会インフラとされる今日、これらの設備に発生した障害を早急に復旧することが重要です。また、障害対応に従事するスタッフの負担をできるだけ軽減することも、今の社会情勢で求められています。障害対応に当たるスタッフを支援するためにIIJが開発した支援システムについて報告します。

  • 本報告のポイント
    • システム運用における障害対応の負担についての課題を考察した。夜間・休日など通常業務時間外における待機スタッフの呼び出しや、障害対応開始後のコミュニケーションに課題がある事がわかった。
    • 課題に対する改善策として独自の支援システム・スマートフォン向けアプリを開発した。開発に当たり、各運用チームの体制に適した呼び出し方ができるような工夫をした。対応開始後のコミュニケーション支援機能や、活動状況の記録機能も実装した。
    • 実際に190の運用チーム、633名スタッフにシステム・アプリを導入した。導入したアプリによって運用品質が上がり、スタッフの負担が軽減された。

全文はこちらからご覧いただけます。

関連リンク

以下ではIIRの読みどころとなるポイントを紹介しています!

IIJ Engineers Blog編集部

2021年06月30日 水曜日

開発・運用の現場から、IIJのエンジニアが技術的な情報や取り組みについて執筆する公式ブログを運営しています。

Related
関連記事