The Internet Health Report

2020年08月27日 木曜日


【この記事を書いた人】
Romain Fontugne

I'm a senior researcher at IIJ-II, leading the Internet Health Report project.

「The Internet Health Report」のイメージ

※本記事は、原文「The Internet Health Report」の日本語訳です

こんにちは。ロマンです。IIJ-IIで主にインターネット計測に関する研究を行っています。私のゴールのひとつは、The Internet Health Report (IHR)と呼ばれるプロジェクトで、インターネットインフラをモニタリングするためのオープンプラットフォームを提供することです。
この記事では、IHRモニタリング機能のいくつかの例を紹介します。詳細は、IHRのWebサイト(https://ihr.iijlab.net)をご覧ください。また、フィードバックを送ってください!

なぜThe Internet Health Reportなのか?

インターネットに接続しているネットワークは、オンラインユーザやサービスに到達するうえで、他のネットワークに依存しています。したがって、ネットワークのコネクティビティと到達性は、(自身が直接接続していない)インターネットの残りの部分への接続を手助けしてくれる多数のネットワークによって決定されます。つまり、外部ネットワークのモニタリングは、中間経路のコネクティビティ問題を理解し、復元性を向上させるうえで極めて重要となります。RIPE AtlasやRISなどの計測プラットフォームはそれらの問題の解決に役立ちますが、それらのデータセットの量と速度は、専門家でないと理解することが困難です。

The Internet Health Report (IHR)の目的は、インターネットインフラのデータに対してアナリティクスプラットフォームを提供し、このギャップを埋めることです。そのコアで、IHRはBGPとtracerouteデータを取り込み、ネットワーク依存性やレイテンシーなどのネットワークメトリクスを計算します。これらは、IHR Webサイトにインタラクティブなレポートの形で公開されています。現在、Global Report とNetwork Reportsの2種類のレポートがあります。Global Reportは、すべてのネットワークで見つかった最近の異常をリスト化しており、Network Reportsは、特定のASまたはIXPに関して計算されたすべてのメトリクスを表示しています。

ネットワーク依存性

IHRレポートで最初に紹介しているメトリックは、ネットワーク依存性(別名AS Hegemony)です。これは、ASが他のASに依存する度合いをBGPデータを基にして計測します。その値は0から1の間となり、特定のASNを含むパスの一部分を表します。

 

図1:アイスランドでのRIPE 78期間中のRIPE会議のASのネットワーク依存性
インタラクティブプロットはこちらをご覧ください

例えば、図1は、アイスランドのレイキャビクでのRIPE 78期間中のRIPE会議のAS(AS2121)に対するネットワーク依存性を示しています。一番上のプロットは、長時間にわたる依存性を示しており、グラフ下の表は、特定の時間の依存性の値を示しています。ここでは、Farice(AS56704, RIPE 78の主催者)が1.0というスコア(可能とされる最高スコア)を示しています。このことは、AS2121へのBGPパスが、通常、FariceのASNを含んでいることを意味します。他の依存性はずっと低く、それらがFariceの上流ネットワーク(Tata、GTT、および、Cogent)であることを示しています。5月21日の12:00ごろの変化は、多数のパスが一時的にCogentを経由してリルートされていることを示しています。これは、AS Graph表のヘッダー(図1には掲載されていません)をクリックして、BGPlayで確認することができます。

IHRはネットワークに依存するASの総数も報告しています。図1のグラフは空白ですが、このことは、AS2121がトランジットを提供していないことを意味します。トランジットネットワークに関しては、依存するネットワークの数が、そのアクティブな顧客を表します。たとえば、Fariceのレポートページには、2019年5月に、AS2121がFariceに依存していたことが示されています。

この依存性メトリックは、以下のような多数の各種ルーティングイベントのモニタリングを可能にしました。

レイテンシー

また、IHRはtracerouteを使い、RIPE Atlas計測プラットフォームによって収集されたネットワークレイテンシーをモニタリングします。ここでは、通常、2つのネットワークホスト間での平均レイテンシー(ネットワーク遅延)、そして、単一ネットワークのリンクレイテンシー(リンク遅延)という2種類のレイテンシーがあります。

図2は、5月17日に始まったフランス全土のロックダウン中に発生した、SFR(AS15557)からヨーロッパの他のネットワークまでのネットワーク遅延の例を示しています。GoogleやDNSルートサーバなど一般的なリソースへの増大したレイテンシーが、外出自粛要請と同時に発生した輻輳を明確に示しています。グラフをクリックすると、下に表が表示されます。この表は、これらの値の計算に使われたAtlasプローブとサンプルの数を示しています。遅延が変化する間、これらの値が安定しているかどうかチェックすることが大切です。それにより、観測された遅延が単に測定バイアスによるものでないことを確認できます。

図2:フランス全土でロックダウンが始まった時のSFR(AS1557)に対するネットワーク遅延
インタラクティブプロットはこちらをご覧ください
同じプロットを表示するには、検索ボックスに宛先ネットワークを入力し、[ADD]ボタンをクリックします。

現在のコロナウイルス禍の中で、Eyeballネットワーク(一般ユーザーがメールやウェブを確認したり、コンテンツを視聴したりするために日常的に利用するアクセスネットワーク)の輻輳が世界的に複数観測されました。そのため我々は、最近開催されたRIPE NCC hackathonの期間中、各国でのロックダウンのインパクトをモニタリングするために実験的ダッシュボードも構築しました。詳細は、RIPE Labsの関連記事をご覧ください。

図3は、Call of Dutyというゲームのアップデートがリリースされた時のTelia(AS1299)に対するリンク遅延の例を示しています。3月10日の20:00(UTC)ごろのスパイクは、tracerouteで見られるTeliaのIPで発生した全体的な遅延の増加を表しています。グラフ下の表は、最も影響を受けた特定のIPアドレスを示しています。

図3:あるゲームの主要アップデートのリリース時のTelia(AS1299)に対するリンク遅延
インタラクティブプロットはこちらをご覧ください

ディスコネクション

最後に、IHRは、インターネットに接続されなくなった地域やネットワークを探知するために、RIPE Atlasプローブのコネクティビティをモニタリングします。これは、決して完全なインターネット停止探知機ではありませんが、RIPE Atlasプローブをホスティングしている地域やネットワークにおける障害のモニタリングを可能にします。

図4は、コロナウイルスの世界的大流行によるロックダウンの期間中、2020年4月に起きたVirgin Mediaの停止に対するIHR結果を表しています。一番上の地図は、Virgin Mediaが停止している間、接続されなくなったプローブの位置を示しています。そして、それぞれの円の直径が、接続されなくなった時間を表しています。停止をモニタリングするためにRIPE Atlasプローブを使うことの利点は、その停止を内部から観察できることです。一番下の3種類のプロットは、RIPE NCCサーバ、Kルートサーバ、そして、Google DNSに対して、接続されなくなったプローブからのping結果を示しています。ここでは、赤色の垂直破線が失敗したpingを表しています。このように表現することで、停止のインパクトをより理解しやすくしています。この場合、毎時間に発生した短時間のディスコネクションをはっきりと観測できます。(これについては、ニュースなどで報告されています。)

図4:4月27日に発生したVirgin Media停止
インタラクティブプロットはこちらをご覧ください

より詳細に…

この記事は、Internet Health Report webサイト(https://ihr.iijlab.net)で掲載されているモニタリング結果の中からいくつか例をあげてご紹介しました。より詳細なモニタリング結果に関しては、IHR webサイトをご覧ください。そして、感想をお聞かせください。また、みなさんが管理しているASをIHRによってモニタリングしたい場合、Atlasプローブを配備されることをお勧めします。
表示されているデータは、私たちが提供しているAPIおよびPython libraryを通じて取得できます。したがって、ご自身のツールにこれらの結果を簡単に組み込むことができます。

フィードバック

IHRは、継続的なリサーチプロジェクトであり、オープンソースと資金援助の両方を必要とする新規改良を予定しています。もし、この活動に一企業として関わりたいという方がいらっしゃいましたら、私たちにお知らせください。また、フィードバックもお寄せください。フィードバックは私たちにとって非常に重要であり、コミュニティのニーズに対応するために優先して取り組むべき課題を検討するのにとても役立っています。

Romain Fontugne

2020年08月27日 木曜日

I'm a senior researcher at IIJ-II, leading the Internet Health Report project.

Related
関連記事