宇宙線によるコンピューターのトラブル、深刻に 57
ストーリー by hylom
見えないバグ 部門より
見えないバグ 部門より
あるAnonymous Coward曰く、
宇宙線によって、さまざまなコンピュータのトラブルが引き起こされているという。たとえば2003年にはベルギーでSEUが原因で電子投票のミスが発生、1人の候補者に4096票が追加されたこともあったそうだ(COMPUTERWORLD、ロスアラモス国立研究所、Slashdot)。
米ロスアラモス国立研究所は、宇宙線やそれに類する荷電粒子が軍隊、商業航空宇宙産業、コンピュータ業界に与える影響を警告してきた。宇宙線やそれに類する荷電粒子は人間や生物には影響を与えないものの、精密化している電気回路などには影響を与えやすい。こうしたトラブルはSEU(single event upset)と呼ばれている。
被害は写真の1ドットが欠ける程度のものから飛行機の運用に支障を来すものまでさまざまなだ。最近ではシスコのルーターのトラフィック損失の原因がSEUと公表されている。SEUは大きな問題だが、一般には理解されにくいのが問題のようだ。
1990年代には既に問題になり始めていた (スコア:5, 参考になる)
IBMが、メモリ エラー比率に対する宇宙線の影響を詳しく調査しています。
その結果として、約3,200mの高度では海面に比べて10倍のソフト エラー比率を計測したことが報告されています。
さらに、約15mの岩盤の洞窟でテストしたシステムでは、宇宙線が効果的に排除され、ソフトエラーは計測されませんでした。
出展 : Timothy J. Dell 『The Benefits of Chipkill-Correct ECC for PC Server Main Memory [umd.edu] (PDF)』IBM Microelectronics Division Rev. 11/19/97
HP ProLiant White Paper フォルト トレランスとスケーラビリティのためのホットプラグRAIDメモリ テクノロジー:概要 [hpe.com]
Re:1990年代には既に問題になり始めていた (スコア:1)
海や川にコンテナごとデータセンターを
鎮める沈めるというのは宇宙線対策には理に適っているのかもしれませんね。
Re: (スコア:0)
くっくっく
直接イカ墨をお見舞いしてやるでゲソ
Re:1990年代には既に問題になり始めていた (スコア:1)
Ciscoの7200に刺すNPE-300ルーティングモジュールが宇宙線ソフトエラーを起こしまくって全数交換した悪夢を思い出す。
もう15年以上前の問題だな。あれ以来FD-SOI化やECCやらプレーナーではそれなりに対策されてきたんだが、FinFETで復活でもしたのかな。
Re: (スコア:0)
FinFETは宇宙線に対してとても強いそうですよ。
理由の一つはFD-SOIと変わらない、完全空乏化された構造なこと。
もう一つはチャネル、ウェル部分の断面積がプレーナー構造に比べて小さいので、当たる確率が低いこと。
Re: (スコア:0)
無学を恥じるが吐露する。
宇宙線による誤動作が「ソフトエラー」とは知らなかった。
てっきりハードエラーだと思ってた。
Re:1990年代には既に問題になり始めていた (スコア:1)
恒久的な障害を起こすわけでなく、メモリ内容が化けたりする
復帰可能なのでソフト エラー
ハード エラーは復帰不可能な物理的故障 焼けたり 砕けたり 漏れたり 劣化したり
かなかなかな
Re:1990年代には既に問題になり始めていた (スコア:1)
基本的にはメモリ上のデータが化けたり回路が誤動作を起こすだけで半導体そのものの故障は起きない。
放射線が強い環境だと回路が破損することもあるらしいがその心配が必要なのは宇宙産業くらいだろう。
Re: (スコア:0)
そういや昔、つばさという人工衛星で民生半導体部品の実験やってたなぁ。Webで実験の報告資料を見た覚えがあるけど、何処いったんだろう。バンアレン帯でのDRAMやSRAM、フラッシュ、EEPROM等のラッチアップやらビット反転についての頻度が書いてあった記憶があるのだけど…。
このことは一般に周知徹底してほしい (スコア:4, おもしろおかしい)
再現性のないバグについては、「あ~、たぶんそれSEUですね」で納得いただけるように。
Re: (スコア:0)
まるでどこかのUnixサーバのメーカーみたいじゃないですか。
Re: (スコア:0)
再現性のないバグについては、「あ~、たぶんそれSEUですね」で納得いただけるように。
今まで電圧の瞬間低下とかノイズによる微細な影響とかケーブル内でのロスといった言い訳してたわ
ケーブルと電圧の低下は本当にそれが原因だったこともあるからタチが悪い
候補者に4096票が追加 (スコア:2)
もう少し位置が違ってたら2147483648票が追加されたり、マイナス票になってたり?
Re: (スコア:0)
銀行口座に2147483648円が追加されたりしないかなあ
Re: (スコア:0)
「突然知らないうちに口座に大金が」という場合、うかつに使用すると面倒ごとに巻き込まれる可能性が高いのでご注意。
いや、非合法組織に狙われるとかだけでなく、現実の法的にも若干のリスクが。
Re: (スコア:0)
64bit化してたらMSBに近いbitが1つひっくり返っただけでも銀行がやばいですね。
それにしても(端末とか)ECC付きではなかったのかな。投票システムはデータの個数は多いけど1つ1つのデータは少ないから冗長ビットをケチっちゃだめだよね。ハードウェアでの冗長ビット付き加算器とかスパコンで使われてるようなエラー訂正とか必要なんだろうね。人工衛星用の多数決型CPUを使うのもありかも(性能低いけど難しい計算する訳でもないし)。
-- AIとか量子コンピューターみたいな流行りものに手を出して決算がアバウトになるのも面白いけど。ネジ釘のごとくノイマン型は滅びない。末端の端末って回文?
それ以前に (スコア:1)
OSの脆弱性の方が深刻では?
深刻度が桁違いなのに、同じ深刻という言葉に括られているのは危険。
#あ〜、プレミアムフライデーっていいなぁ。毎月3連休があるなんて。
Re:それ以前に (スコア:1)
#あ〜、プレミアムフライデーっていいなぁ。毎月3連休があるなんて。
1日休みになるなんて良いですね=。
あれ?もしかして、プレミアムフライデーが祝日みたいなものと勘違いしてません?
Re: (スコア:0)
元々外に出る事が無ければ、自宅でゴロゴロするのを説明する良い名目とも見えるかも。
#休みでないのなら、手間かけて出社したからにはそこそこ仕事したいよな。
#ンなアホよりも、明示的な有休消化義務でも企業に課してくれ。
Re:それ以前に (スコア:1)
#3166463さん、会社に電話して見た方がいいのでは?
きっと、皆さんフツーに仕事されてますよ。
Googleのやつのソース知りたい (スコア:1)
GoogleChromeの中に「1から10まで足す」みたいな単純な計算を仕込んでて
計算結果がおかしくなってる事例がそこそこ見つかってる、みたいな噂を聞いたんだけど
ソースが見つからない。
あと、どんだけの割合なんだろうとかも気になる。
Re:Googleのやつのソース知りたい (スコア:2)
ソースコードではなくて恐縮ですが、このかたのツイートはどうでしょうか。
https://twitter.com/xharaken/status/341668178239303680 [twitter.com]
Re: (スコア:0)
WindowsやLinuxにそんな機構をつけてるなんて聞いたことない状況で、たかが1アプリがやることとは思えない。
Re:Googleのやつのソース知りたい (スコア:1)
Re: (スコア:0)
Re: (スコア:0)
Windowsなら普通にイベントログに記録が残りますな。
CPUのキャッシュが壊れたときもログが残った。
Re:Googleのやつのソース知りたい (スコア:1)
Windows Vistaからみたいで、Advances in Memory Management for Windows [microsoft.com]で紹介されています。ゼロページの中身が本当にゼロであることを読み込んで確かめるなどと書いてあるので、ECCでなくても機能するのですかね。
昔は日本語でも公開されていたようなのですが、今は消えてしまったようです(ホワイトペーパー: Windows のメモリ管理の進歩 - NyaRuRuが地球にいたころ [hatenablog.com])。
Re: (スコア:0)
Windowsのイベントログって、たまに見るとHDDのエラーログとかが大量に出てて背筋が寒くなることあるよね。
Re: (スコア:0)
chrome は見つからなかったけどこんなものを見つけた。
Google: Computer memory flakier than expected
https://www.cnet.com/news/google-computer-memory-flakier-than-expected/ [cnet.com]
この辺にいろいろリンクあり。
http://stackoverflow.com/questions/2580933/cosmic-rays-what-is-the-pro... [stackoverflow.com]
Re: (スコア:0)
普段触ってるパソコンのほぼ全てにeccを付けてあるけど、エラーを検出したところを見たことがなくて残念に思ってる。
蟹光線 (スコア:0)
宇宙船からの攻撃か!
Re: (スコア:0)
宇宙カニからの警告ですよこれは。
Re: (スコア:0)
タイタン蟹?
Re: (スコア:0)
均整ガニ(惑星クラドニカの住人)
Re: (スコア:0)
おしいっ! (スコア:0)
もう12bitぐらい左側を化けさせる事が出来れば人口より多い投票数を記録したかもしれない(笑)
1人の候補者に4096票が追加 (スコア:0)
だからトランプが当選になったのか。
Re: (スコア:0)
トランプのはビッグデータ解析技術の勝利だって喧伝されてるだろ。SNSで個人の嗜好がダダ漏れって怖い世界だねぇ。
Re: (スコア:0)
>トランプのはビッグデータ解析技術の勝利だって喧伝されてる
そんな話聞いたこともなかった
そーすきぼんんす
Re: (スコア:0)
駄々漏れって自分で公開してるだけだろ
いやなら自宅鯖でやれってはなしであって
ノイズ対策 (スコア:0)
今までもEMI問題の一部としてさんざ取り上げれれてきたじゃないか。
オーディオ関係になると、効果が怪しい似非科学的なものまであるのは周知の事実だろう。
実際には、EMI狂歌は結構されているので、瞬間停電の方がよっぽど恐かったりする。
Re: (スコア:0)
EMI狂歌って…
狂乱家族日記を思い出してしまったじゃねーか。
# 凶華さまの字が違うけど、久しぶりに観たくなったよ。
Re:ノイズ対策 (スコア:1)
そのまえに東芝EMIを思い出そうよ(えー
90nmプロセス辺りで両面に張り付けるプロテクタ作ったらどうなの? (スコア:0)
毎度90°で突入してるわけでもないのにバーストエラーが少ないならば
空乏状態のDRAMやフラッシュをペタリと被せときゃ数キロの岩盤じゃなくても結構防げるんじゃね?
Re: (スコア:0)
そんなんでシールドできたらノーベル賞もらえますよ
Re: (スコア:0)
SOIはラッチアップ防止に効くらしいです。(JAXAのページ [www.jaxa.jp])
高度な情報を安易に扱うからだと思う (スコア:0)
>宇宙線やそれに類する荷電粒子は人間や生物には影響を与えない
良いソースが示せないけど、一部の遺伝子異常などの原因だったはず。
>精密化している電気回路などには影響が
だから、昔から冗長化、多重化の技術があり、フォールトトレラントは
サーバー選ぶときに選択肢にあるはず。
別に原爆に耐えられるとか求められてるわけではないのだから、扱う情報
の重要さとコストで判断すればいいだけ。安物で済ますなら、安全もそれなり
なのは当然。これが分からないなら、因果はめぐるだけかと。
>こうしたトラブルはSEU(single event upset)と呼ばれている。
別に新しい言い方しなくても、一時的な誤りでいいのに。
若いと、新しい言い回しで吹聴したくなるのだろうけど。この歳になると、
こけおどしにしか見えない。
Re:高度な情報を安易に扱うからだと思う (スコア:1)
> 別に新しい言い方しなくても、一時的な誤りでいいのに。
別に、少なくとも30年前には普通に使っていましたよ。
アマチュア衛星に興味をもっていたころ覚えたのかな。
例えば、サレーのこんな報告書 [usu.edu](1980年代)にもある。
このころの衛星は4~64k bit SRAM(UoSAT Oscar 9,11)を積んでいたようで。日本のJAS-1(FO-12/FO-20)は256k bitのDRAMだったけど。
Re: (スコア:0)
SEUは全然新しい言い方じゃないです。
宇宙線で使い物にならなかったスパコン達 (スコア:0)
Ando's Processor Information Page [geocities.jp]に、宇宙線で1時間に1度エラーを起こして使い物にならなかったり、システムがブートする前に宇宙線でやられて安定稼働できなかったりする話が紹介されている。
DRAMは微細化でフラッシュメモリのように、ECCが必須になることが予測されているので、個人的には楽しみ。
ECCは男のロマンなので。