アカウント名:
パスワード:
将来的にはこれまでのミラーリングによるバックアップだけでなく
なんて実装にしちゃうんですかね…。ランサムウェア攻撃なんて受けた日には全滅でしょうに…。
そうですね。バックアップは2世代以上は保持しとくのが普通だと思います。でなければ、1回バックアップに失敗しただけで、復旧不能になる可能性が有るわけだし。しかもシェルスクリプトでコピー(rsync?)でバックアップとか、そんな貧乏くさいことを…お金が無かったんですかね。
そらお金がなかったんでしょ。OSについてくるツールでも複数世代の増分バックアップや差分バックアップくらい取れますし。単純にストレージ代がないのだろうと。
ファイルシステムは分散ファイルシステムのLustreなんだそうですね。LustreはCOWのファイルシステムではないようです。世代管理やクローニングが一瞬で出来るCOWのファイルシステムならよかったのでしょうが、btrfsでさえ普及していると言えない状態では、そういう分散ファイルシステムは難しいのかな…?
ウチはミラーリングを「データのバックアップ」と称したら叱られます。
ここで言う「ミラーリング」と言うのは、RAID1的なものでは無く、D2Dなコピーの事じゃないかと思う。それでも「データのバックアップ」と称したら叱られますか?
叱られるよ。やらかした当事者のお詫び文見よう。
>これまでのミラーリングによるバックアップだけでなく,1世代分の増分バックアップを残す等の機能強化を検討いたします
「ミラーリング」の中身がRAIDでもD2Dでも常時接続で都度自動的にコピーされるという意味では安全性/危険性に変わりは無い。結局バックアップセットをいくつ持つか、数で勝負するしかない。当然コストがからむから簡単ではないが。
# 最強のバックアップは『印刷』。災害がなければまず大丈夫。# え? 間違ってゴミ箱に入れちゃう? それはフィフティフィフティ。デスクトップにもあるじゃない。
結局バックアップセットをいくつ持つか、数で勝負するしかない。当然コストがからむから簡単ではないが。
バックアップ世代(バックアップセット)数を2以上にせよ、というのは同意です。が、そこは問題にしていません。バックアップ世代数が1であっても、D2Dなコピーをバックアップと呼ぶのが間違いなのか、という話をしています。
なんか、言葉の定義にこだわってる割には RAID と D2D を同列で比較するみたいな訳の分からん事を言うなと思っていたら案の定マイナスモデされたな。
D2Dの定義をちゃんと確認した上で、引用記事やコメントを良く見直そう。
RAID1とD2Dは同列ではありません。最初からそう言っています。同列でないので、バックアップと呼べるか否かも違うだろう、という話をしています。
で、キミは今回の件はRAID1だと思ってるの? それともD2Dだと思ってるの?で、それはバックアップと呼べるの? 呼べないの? 加えてその理由は?
キミからまともな答が返ってくるとは到底思えませんが、一応尋ねておきます。
冗長性を増やすだけですよね。待機系をバックアップと呼ぶのも、システムとしては合っているがデータとしては違うと思いますし。
あくまで物理障害に対する冗長系でしかなくてバグ等の論理障害には無力だからね。
28TBが完全に消失とあったので世代バックアップを復元したらいいんじゃないかと思ったらやってないんですね。
世代バックアップと遠隔地バックアップは当たり前と思っていましたがやってないのか。
利用手順はこれかな?https://web.kudpc.kyoto-u.ac.jp/manual/ja/filesystem [kyoto-u.ac.jp]
バックアップ構成にするのか、バックアップ不要で大きなストレージとして使うのかもユーザに委ねられてるように見える。スパコンの計算データを保持するための物で、研究成果を保存しておくストレージとは違うだろうし、こんなものなのでは。
開発は別のところで行って、計算能力必要な時だけ時間貸しでスパコン使って、終わったら結果を取り出すのが一般的な使い方だと思う。こういうのは確実なデータ保持より、同じコストに対して速度や容量の方が重要な用途なんじゃないかな。
ミラーリングによるバックアップと言っているので前向きに考えるとデータをよそにコピーしておいておく通常のバックアップをミラーリングと呼称している気もしますが。実行中のスクリプトを上書きするような組織ですし用語がハチャメチャでも驚かない。これならバックアップ実施中とデータの復元中以外はバックアップ先がオフラインなのでランサムウェアやホワイターにやられない。バックアップ先が常時オンラインみたいなシステムもあるし結局何に対するバックアップなのかによるんでしょうけど。オペレーションミス発生時のバックアップは予算がないので実施しないのが一般的。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
目玉の数さえ十分あれば、どんなバグも深刻ではない -- Eric Raymond
どうして (スコア:1)
将来的にはこれまでのミラーリングによるバックアップだけでなく
なんて実装にしちゃうんですかね…。ランサムウェア攻撃なんて受けた日には全滅でしょうに…。
Re:どうして (スコア:1)
そうですね。
バックアップは2世代以上は保持しとくのが普通だと思います。
でなければ、1回バックアップに失敗しただけで、復旧不能になる可能性が有るわけだし。
しかもシェルスクリプトでコピー(rsync?)でバックアップとか、そんな貧乏くさいことを…
お金が無かったんですかね。
Re: (スコア:0)
そらお金がなかったんでしょ。OSについてくるツールでも複数世代の増分バックアップや差分バックアップくらい取れますし。単純にストレージ代がないのだろうと。
Re: (スコア:0)
ファイルシステムは分散ファイルシステムのLustreなんだそうですね。LustreはCOWのファイルシステムではないようです。世代管理やクローニングが一瞬で出来るCOWのファイルシステムならよかったのでしょうが、btrfsでさえ普及していると言えない状態では、そういう分散ファイルシステムは難しいのかな…?
Re: (スコア:0)
ウチはミラーリングを「データのバックアップ」と称したら叱られます。
Re:どうして (スコア:1)
ここで言う「ミラーリング」と言うのは、RAID1的なものでは無く、D2Dなコピーの事じゃないかと思う。
それでも「データのバックアップ」と称したら叱られますか?
Re: (スコア:0)
叱られるよ。やらかした当事者のお詫び文見よう。
>これまでのミラーリングによるバックアップだけでなく,1世代分の増分バックアップを残す等の機能強化を検討いたします
「ミラーリング」の中身がRAIDでもD2Dでも常時接続で都度自動的にコピーされるという意味では安全性/危険性に変わりは無い。
結局バックアップセットをいくつ持つか、数で勝負するしかない。当然コストがからむから簡単ではないが。
# 最強のバックアップは『印刷』。災害がなければまず大丈夫。
# え? 間違ってゴミ箱に入れちゃう? それはフィフティフィフティ。デスクトップにもあるじゃない。
Re:どうして (スコア:1)
結局バックアップセットをいくつ持つか、数で勝負するしかない。当然コストがからむから簡単ではないが。
バックアップ世代(バックアップセット)数を2以上にせよ、というのは同意です。が、そこは問題にしていません。
バックアップ世代数が1であっても、D2Dなコピーをバックアップと呼ぶのが間違いなのか、という話をしています。
Re: (スコア:0)
なんか、言葉の定義にこだわってる割には RAID と D2D を同列で比較するみたいな
訳の分からん事を言うなと思っていたら案の定マイナスモデされたな。
D2Dの定義をちゃんと確認した上で、引用記事やコメントを良く見直そう。
Re:どうして (スコア:1)
RAID1とD2Dは同列ではありません。最初からそう言っています。
同列でないので、バックアップと呼べるか否かも違うだろう、という話をしています。
で、キミは今回の件はRAID1だと思ってるの? それともD2Dだと思ってるの?
で、それはバックアップと呼べるの? 呼べないの? 加えてその理由は?
キミからまともな答が返ってくるとは到底思えませんが、一応尋ねておきます。
Re: (スコア:0)
冗長性を増やすだけですよね。
待機系をバックアップと呼ぶのも、システムとしては合っているがデータとしては違うと思いますし。
Re: (スコア:0)
あくまで物理障害に対する冗長系でしかなくてバグ等の論理障害には無力だからね。
Re: (スコア:0)
28TBが完全に消失とあったので世代バックアップを復元したらいいんじゃないかと思ったらやってないんですね。
世代バックアップと遠隔地バックアップは当たり前と思っていましたがやってないのか。
Re: (スコア:0)
利用手順はこれかな?
https://web.kudpc.kyoto-u.ac.jp/manual/ja/filesystem [kyoto-u.ac.jp]
バックアップ構成にするのか、バックアップ不要で大きなストレージとして使うのかもユーザに委ねられてるように見える。
スパコンの計算データを保持するための物で、研究成果を保存しておくストレージとは違うだろうし、こんなものなのでは。
開発は別のところで行って、計算能力必要な時だけ時間貸しでスパコン使って、終わったら結果を取り出すのが一般的な使い方だと思う。
こういうのは確実なデータ保持より、同じコストに対して速度や容量の方が重要な用途なんじゃないかな。
Re: (スコア:0)
ミラーリングによるバックアップと言っているので前向きに考えるとデータをよそにコピーしておいておく通常のバックアップをミラーリングと呼称している気もしますが。
実行中のスクリプトを上書きするような組織ですし用語がハチャメチャでも驚かない。これならバックアップ実施中とデータの復元中以外はバックアップ先がオフラインなのでランサムウェアやホワイターにやられない。
バックアップ先が常時オンラインみたいなシステムもあるし結局何に対するバックアップなのかによるんでしょうけど。
オペレーションミス発生時のバックアップは予算がないので実施しないのが一般的。