パスワードを忘れた? アカウント作成
16551307 story
NTT

4月3日、フレッツ光で3時間にわたる大規模障害。NTT東西の設備故障 27

ストーリー by nagazou
バグか何かかな 部門より
NTT東日本およびNTT西日本の提供する光回線サービス「フレッツ光」にて、3日7時10分頃より約3時間にわたり障害が発生した。この障害はNTT東日本では3日10時8分、NTT西日本では3日8時49分に復旧が完了したとされている。同社はこの障害に関して同日の午後6時からオンラインで会見をおこなった(NTT東日本[PDF]NTT西日本[PDF]PC WatchPC Watchその2)。

障害は午前7時10分~午前10時8分までの2時間58分に渡って発生。光アクセスサービスで最大35万9000件、そのうち、ひかり電話で最大18万6000件に影響したとされる。会見では両社ともに「多くの利用者に影響が出たこと、1時間以上にわたる障害であること、緊急通報も利用できない状況であったことから、重大事故にあたると認識している」と述べている。

原因に関しては、NTT東日本では49ビル/89台の加入者収容装置で、NTT西日本では21ビル/27台の加入者収容装置において、特定の配信サーバーからのパケット受信に起因して、障害が発生したという。NTT東日本およびNTT西日本が導入している、特定の海外メーカーの加入者収容装置だけで同時に障害が発生したとのこと。その機種の一部の装置で障害が発生した模様。両社は会見で「現在、詳細な原因の究明と抜本対策を急いでいる」と述べている。
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • 某加入者収容装置で、特定のパケットを受信すると再起動を繰り返すって装置に不具合があるってこと?

    • by Anonymous Coward on 2023年04月04日 13時37分 (#4437922)

      今の所はそうっぽい。
      予備系も死んだからソフトのバグだと思われる。
      ロングパケットらしいし、Cisco IOS XEでちょうど特定ロングパケットでリブートするセキュリティアドバイザリーが出てる。
      https://www.cisco.com/c/ja_jp/support/docs/csa/2023/cisco-sa-ipv4-vfr-... [cisco.com]

      親コメント
    • by Anonymous Coward

      もともと持っていたバグでしょうね。

      それが、3日の午前7時頃より開始したどこかのサービスによる通信により発現した。
      そのサービスはなんだ?
      そして発生した機器のメーカーは?

      そこをネットワーク屋さんたちは興味津々でガリガリとググってるよ。
      たぶん。

      • by Anonymous Coward

        #4437922 [srad.jp]

        • by Anonymous Coward

          ♪四分後の重複ぐらい大目に見てよ

        • by Anonymous Coward

          すまんな。
          遅筆で。

          しかも今日はスラドがなんだか重くてだな、レビューにも応答が帰って来なかったりで投稿できた時には別の人が答えらしきものを投稿してたんよ。
          書き出しの時にはまだ投稿は無かった。

    • by Anonymous Coward

      なんか既視感が・・・・
      その、「特定のパケット」が再起動時の初期化で発するもので
      近隣に伝播していくとかないかな
      なんか既視感が・・・・

      • by Anonymous Coward

        大事なことなのですね

      • by Anonymous Coward

        AI Chatに質問を投げたら。
        「○○とは△△となるよう○○を考慮する必要があります。」
        という文章を延々と繰り返した。

  • by Anonymous Coward on 2023年04月04日 13時29分 (#4437916)

    ファームウェアのアップデート的な感じが
    自動で行われようとして
    みたいな感じなのかな

  • by Anonymous Coward on 2023年04月04日 14時25分 (#4437952)

    ダウンが許されない基幹系は異なる機器で冗長化するしかないのかな?
    現実的なコストで可能な気はしないけど……
    # 同じNICでボンディング組んだサーバがドライバのバグで両系ダウンになったことがある。

    • by Anonymous Coward

      数年前のソフトバンクの大障害の時は「違うメーカーの機器で冗長組むのは当然」みたいな空気でしたがねぇ
      重要インフラなんだからそのくらいやってて欲しかったね

      • by Anonymous Coward

        > 「違うメーカーの機器で冗長組むのは当然」
        のニュアンスが良くわかりませんが、現実的には機能的なところや相互接続性の問題でそんなことは不可能かと。

        • by Anonymous Coward

          正副2系統を別のベンダーで用意するのは普通に出来ると思うが
          一瞬全断するけど、何時間も使用不能になるよりマシ

        • by Anonymous Coward

          異ベンダで直接HAを組めって話ではなく、稼働系と待機系のシステム一式をそれぞれ別ベンダで構築しろってことでは。
          局舎/AZ/リージョンごとにベンダ分けたりとか。

          • by Anonymous Coward

            今回のようなL3装置(ルーター)でベンダを分けるってのは、稼働系はApacheで、待機系はNginxで構築しろぐらいのもんだ。
            HTTPは標準化されてるプロトコルだからね。まあわかる。

            ソフバンのようなMMEでベンダを分けるってのは、稼働系はOracleで、待機系はSQL Serverで構築しろぐらいのもんだ。

            はぁ?
            SQLなんて方言もりもりでチューニングもクセも全然別もんだろ。できるかボケ。

typodupeerror

長期的な見通しやビジョンはあえて持たないようにしてる -- Linus Torvalds

読み込み中...