昨夜・・・VPNが切れたとアメリカに居残りしている部下より連絡がありました。
クリティカルではなかったのですが、調べてほすぃという事で。
日本はAM1:30過ぎの時だったかな。翌日で良いと言われたが、性分もあり少し調べていました。
そのくせ眠かったのでw、横着してiPhoneでMerakiのアプリから状況を確認。
確かに変だった。でも正常な通信経路があるという事だったので、私はすぐにインターネット上で何かが起きていると仮定した。
最近よく利用するダウンデテクターでもみてみるかなと・・・見てみると、Apple関係が調子悪そうな傾向が出ていた。時間とかのタイミングが合わないなぁ…。
でもちょっと日本から見ているし参考にならんか。ネットで同じ障害に苦しんでいる人がいないかウォッチしたけど、特に情報が無い・・・。
うーんと悩んで、基本に戻ろうと思って、自宅からアメリカ3拠点のグローバルIPにpingするも1拠点しか応答せず。
どうにもVerizon向けが駄目っぽく見える・・・。
んで、日本の公開サイトを見る様に指示。
「Yahoo見れる・・・ANA見れる・・・JAL見れない。」
とりあえず、これでローカルキャリア側の問題が出ていそうだという事と、Azureへの接続は問題がなかったので、経過観測にすることにした。
したらば今朝既に復旧している事を確認できた。
詳しいエリアは表現しないけど、画像の名称とかから推測してほしい。
日本からNJとMAがダメというのが分かる。
無論、VPNステータスダウンアラートが上がるので、現地の部下はMerakiのVPNに問題が起きたと感じたようだ。
(ちなみに、CAとMAは同軸インターネットでそもそも品質がイマイチ。)
ここで中々、インターネット網やらキャリア網がオカシイと判断するには難しい。
そして、Merakiのようなシンプルマネージメントデバイスであっても、こういったケースでは何が原因なのかという特定出来るインフォメーションは無いので、結局は経験が必要になってくるのかな。
先日のGoogleのBGP事件もあったし、インターネットではこのような出来事が度々起きる。
インターネットへの依存度もさることながらクラウドサービスへの依存度も凄まじく加速していますよね。
今回は運よく、AzureにデプロイしているvMX100への通信は無事でした。
しかし、クラウドサービスに重要な基盤を用意していく場合のは、結局はDirectConnectやExpressRoute等の専用線開拓が必要で、SLAを上げていくしかない。
専用線網も同一キャリア冗長しか選択肢しかないのでBGPで他キャリア冗長も含めてやると足回り代がとんでもないことになっていく。。。
今週水曜日もWindowsUpdateでインターネットは輻輳カーニバルでしたしね。
まぁ・・・SLAの考え方次第なんだろうけどね(^^;
そういえば、アメリカから金曜日に帰国して、日曜日に緊急出張をしていました。
冗長化しているVPNルーターが2台ともSDRAMが壊れるという不運に見舞われました。
SLA的に言うと、対応時間が稼働時間に対してザックリ大げさに言うと99.99%の稼働率を誇っていた機器と・・・。
年間にしたって99.9%です。
色々なモノをインターネット上で便利に使ったり使われたりしていますが、
最近色々と考えされられます・・・。