アカウント名:
パスワード:
私の職場だと、この2年くらいで crucial が 1台、 adataが1台壊れました。intelなどの他メーカーは無事。
実際に壊れて分かったことは、SSDは突然壊れる点です。HDDはSMARTなどで警告が出始めたりで故障の予兆が見えますが、SDDは突然死にます。SMARTがあてにならない。
そしてSSDはデータのリカバリもできない。HDDなら不良セクタを無視しながらデータをddで吸い出すとかできるけどSSDはそもそもディスクとして認識しないとか、通電すると恐ろしく発熱するなど、絶望的な壊れ方をします。
と言うわけで私の職場では、SSDは常に予備を用意しておくと言う運用になりました。数TBのSSDならたいした値段しないから予備買っておけ、必要なら予備SSDに定期的にデータ複製しておけ(cron + rsyncとかで)、って方針です。
ほんと突然死にますね。高負荷用途じゃないからと無名メーカーのSSDを排熱の厳しいケースで使ってたら突然死しました。リブートしたらBIOSでも認識しないんでその時は何が起こったかプチパニックになりましたよ。
RAID1にすればいいんじゃまいか# バックアップしとくのは基本
RAIDをバックアップとは呼ばないがな
/*消しちゃったあれも上書いちゃったあれもバックアップあれば大丈夫(キリッえ?RAID!?それじゃあのデータはorz*/
SSD突然死への対策だから、この場合バックアップで合ってるかと。
# 使用環境の問題だったりすると同時に死にそうだけど
同種の装置を複数並べるのは冗長化で、バックアップは同目的で異種の実装を複数切り替えることだと思います。どちらも機能の継続性が目的ですが、手法としては異なるかと。
# 従って仕様の揃わないドライブで組んだRAIDアレイは勝手流バックアップと言えm(ry
こちらの業界では本番系と同一機器の予備系を動かしておくことをバックアップとは呼ばないんですね。うっかり言って突っ込まれないように注意します。
待機系、英語ならstandby deviceですかね。バックアップシステムという語句は、外部記憶装置へのデータ保管を指して使われてきたので、間違えて伝わることのないように使わない。構成全体はデュープレックスシステム、もしくはアクティブ/スタンバイ構成。
ただ、通信回線に関してはバックアップ回線(Backup routeもしくはline)という。デュープレックスと言う語は、全二重/半二重(Full-duplex/Half-duplex)を指して用いるので使わない。検索してみたが、待機回線とかスタンバイ回線…という言い方もしない様子。通信回線は1本でも、通信していなければ待機状態(スタンバイ状態)だからだろう。
結局このあたりは業界次第、用途次第で用語や表現は変わるのです。IT分野の人とだけ関わってると、言葉の視野が狭くなりがちなので気を付けないといけない。そうしないと、他業界の人から「日本語は通じてるが会話が通じてない人」認定されてしまいます。
バックアップの意味論まで踏み込むと話が拡散するので方法論くらいで止めときましょうwといいつつRAID1はメディアハード突然死対策に有効です。(別ロット、可能なら別メーカ等で組むのがいいかな?)操作ミスには無力ですけどね。# こうですかw
なんかスラドって「RAID1」の単語を出すと文脈無視して「RAIDはバックアップじゃない」と脊髄反射コメント付くよね
だからbotが書いてるんだよ。この場合「RAID1」がキーワード
RAIDはバックアップじゃない
自宅用ですがcrucialとintelは頑丈ですね10年くらい日々GB単位書いては消してをしていますが未だにCristal Disk Infoで寿命90%初期の数年はOS用として、以後はRAID0で一時領域用の余生で活躍中未使用領域をウェアレベリングように1割以上取っていれば結構持つもんですよ
# 一番若いのは数年のSamsung
未使用領域というのは、ファイルを削除した後のゴミが残っている領域も、SSD側から未使用領域と認識できるものなんですか?
ソフトウェアミラーじゃダメなの?LinuxもWindowsも対応してるでしょ?
前兆は無いけど総書き込み量で機械的に交換していけばいいからある意味楽という話も
今回問題になってるのは寿命じゃなくて偶発障害でしょ?コントローラが死んだとかの。
コントローラが寿命で死にましたとさ
>HDDはSMARTなどで警告が出始めたりで故障の予兆が見えますが
Googleが大量に使用しているHDDの故障率の分析 [srad.jp]
大半の故障は徴候を示さない突然死であり、S.M.A.R.T.値による故障予測日数は殆ど参考にならなかった。
リンク先読んでないけど大方gigazineあたりの誤訳ゴミ記事だろう
HDDは突然死といっても本当に突然死することはそんなになくてリードエラーが出だしてから完全に読めなくなるまでの間にデータを吸い出す猶予がたいていあるんだよ数時間程度だけどな、常にSMARTを監視して即座にアクションをとれるなら結構助けられる
数年前までストレージを運用していたときの経験だと、HDDメーカーによってSMART異常が出てからもしばらく動作するものと前兆無く即死するものに割と分かれていたように記憶しています。HGSTが前者、Seagateが後者だったかな?# 何百本もディスクが載ってると安定期でも週一以上のペースで壊れるんだな……とか思っていました。
Quantum製がカッコンカッコン鳴り始めるのは聞いたことがある。そいつ自体はSMARTなんてなかった時代の代物だが、東芝系のHDDがそんな感じの音を出して異常動作し始めて、SMARTにリードエラーやらが出るようだ。
故障予測日数は殆ど参考にならなかった。
個体的な兆候の話ではなく統計による目安の話だよね。誤訳ではないだろうけど内容はズレてる。故障予測日数より長く使えることがあるのもおかしいとでも言うのだろうか。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
物事のやり方は一つではない -- Perlな人
SSDは突然死する (スコア:1)
私の職場だと、この2年くらいで crucial が 1台、 adataが1台壊れました。intelなどの他メーカーは無事。
実際に壊れて分かったことは、SSDは突然壊れる点です。
HDDはSMARTなどで警告が出始めたりで故障の予兆が見えますが、SDDは突然死にます。SMARTがあてにならない。
そしてSSDはデータのリカバリもできない。HDDなら不良セクタを無視しながらデータをddで吸い出すとかできるけど
SSDはそもそもディスクとして認識しないとか、通電すると恐ろしく発熱するなど、絶望的な壊れ方をします。
と言うわけで私の職場では、SSDは常に予備を用意しておくと言う運用になりました。
数TBのSSDならたいした値段しないから予備買っておけ、必要なら予備SSDに定期的にデータ複製しておけ(cron + rsyncとかで)、って方針です。
Re:SSDは突然死する (スコア:1)
ほんと突然死にますね。
高負荷用途じゃないからと無名メーカーのSSDを排熱の厳しいケースで使ってたら突然死しました。
リブートしたらBIOSでも認識しないんでその時は何が起こったかプチパニックになりましたよ。
Re: (スコア:0)
RAID1にすればいいんじゃまいか
# バックアップしとくのは基本
Re:SSDは突然死する (スコア:1)
RAID1にすればいいんじゃまいか
# バックアップしとくのは基本
RAIDをバックアップとは呼ばないがな
/*
消しちゃったあれも
上書いちゃったあれも
バックアップあれば大丈夫(キリッ
え?RAID!?それじゃあのデータはorz
*/
Re:SSDは突然死する (スコア:1)
RAID1にすればいいんじゃまいか(突然死に一応対応できる)
# (それとは別の手段で)バックアップしとくのは基本
RAIDをバックアップとは呼んでない。
Re: (スコア:0)
SSD突然死への対策だから、この場合バックアップで合ってるかと。
# 使用環境の問題だったりすると同時に死にそうだけど
Re:SSDは突然死する (スコア:2)
同種の装置を複数並べるのは冗長化で、バックアップは同目的で異種の実装を複数切り替えることだと思います。どちらも機能の継続性が目的ですが、手法としては異なるかと。
# 従って仕様の揃わないドライブで組んだRAIDアレイは勝手流バックアップと言えm(ry
Re: (スコア:0)
こちらの業界では本番系と同一機器の予備系を動かしておくことをバックアップとは呼ばないんですね。
うっかり言って突っ込まれないように注意します。
Re:SSDは突然死する (スコア:1)
待機系、英語ならstandby deviceですかね。
バックアップシステムという語句は、外部記憶装置へのデータ保管を指して使われてきたので、
間違えて伝わることのないように使わない。
構成全体はデュープレックスシステム、もしくはアクティブ/スタンバイ構成。
ただ、通信回線に関してはバックアップ回線(Backup routeもしくはline)という。
デュープレックスと言う語は、全二重/半二重(Full-duplex/Half-duplex)を指して用いるので使わない。
検索してみたが、待機回線とかスタンバイ回線…という言い方もしない様子。
通信回線は1本でも、通信していなければ待機状態(スタンバイ状態)だからだろう。
Re: (スコア:0)
結局このあたりは業界次第、用途次第で用語や表現は変わるのです。
IT分野の人とだけ関わってると、言葉の視野が狭くなりがちなので気を付けないといけない。
そうしないと、他業界の人から「日本語は通じてるが会話が通じてない人」認定されてしまいます。
Re: (スコア:0)
バックアップの意味論まで踏み込むと話が拡散するので
方法論くらいで止めときましょうw
といいつつ
RAID1はメディアハード突然死対策に有効です。
(別ロット、可能なら別メーカ等で組むのがいいかな?)
操作ミスには無力ですけどね。
# こうですかw
Re: (スコア:0)
なんかスラドって「RAID1」の単語を出すと文脈無視して「RAIDはバックアップじゃない」と脊髄反射コメント付くよね
Re: (スコア:0)
だからbotが書いてるんだよ。この場合「RAID1」がキーワード
Re: (スコア:0)
RAIDはバックアップじゃない
Re: (スコア:0)
私の職場だと、この2年くらいで crucial が 1台、 adataが1台壊れました。intelなどの他メーカーは無事。
自宅用ですがcrucialとintelは頑丈ですね
10年くらい日々GB単位書いては消してをしていますが
未だにCristal Disk Infoで寿命90%
初期の数年はOS用として、以後はRAID0で一時領域用の余生で活躍中
未使用領域をウェアレベリングように1割以上取っていれば結構持つもんですよ
# 一番若いのは数年のSamsung
Re: (スコア:0)
未使用領域というのは、ファイルを削除した後のゴミが残っている領域も、SSD側から未使用領域と認識できるものなんですか?
Re:SSDは突然死する (スコア:1)
// ディスクレベルでは Trim (SATA) / Unmap (SAS)コマンドが相当
Re: (スコア:0)
ソフトウェアミラーじゃダメなの?
LinuxもWindowsも対応してるでしょ?
Re: (スコア:0)
前兆は無いけど総書き込み量で機械的に交換していけばいいからある意味楽という話も
Re: (スコア:0)
今回問題になってるのは寿命じゃなくて偶発障害でしょ?コントローラが死んだとかの。
Re: (スコア:0)
コントローラが寿命で死にましたとさ
Re: (スコア:0)
>HDDはSMARTなどで警告が出始めたりで故障の予兆が見えますが
Googleが大量に使用しているHDDの故障率の分析 [srad.jp]
大半の故障は徴候を示さない突然死であり、S.M.A.R.T.値による故障予測日数は殆ど参考にならなかった。
Re: (スコア:0)
リンク先読んでないけど大方gigazineあたりの誤訳ゴミ記事だろう
HDDは突然死といっても本当に突然死することはそんなになくて
リードエラーが出だしてから完全に読めなくなるまでの間にデータを吸い出す猶予がたいていあるんだよ
数時間程度だけどな、常にSMARTを監視して即座にアクションをとれるなら結構助けられる
Re:SSDは突然死する (スコア:1)
数年前までストレージを運用していたときの経験だと、HDDメーカーによってSMART異常が出てからもしばらく動作するものと前兆無く即死するものに割と分かれていたように記憶しています。
HGSTが前者、Seagateが後者だったかな?
# 何百本もディスクが載ってると安定期でも週一以上のペースで壊れるんだな……とか思っていました。
Re: (スコア:0)
Quantum製がカッコンカッコン鳴り始めるのは聞いたことがある。
そいつ自体はSMARTなんてなかった時代の代物だが、
東芝系のHDDがそんな感じの音を出して異常動作し始めて、
SMARTにリードエラーやらが出るようだ。
Re: (スコア:0)
故障予測日数は殆ど参考にならなかった。
個体的な兆候の話ではなく統計による目安の話だよね。
誤訳ではないだろうけど内容はズレてる。
故障予測日数より長く使えることがあるのもおかしいとでも言うのだろうか。