パスワードを忘れた? アカウント作成
2315187 story
ストレージ

個人的なデータはどうやって管理してる? 80

ストーリー by reo
アクセスしないファイルは塩漬けにしておけ 部門より

eggy 曰く、

本家 /. 記事「Ask Slashdot: How Do You Manage Your Personal Data?」より。

私の問題を聞いて欲しい。私は随分と多くの個人的なデータ (ポルノや海賊版ソフト、また MPAA や RIAA 絡みのものではない) を所有している。そこで気がついたのだが、故障が起きたときのためにスペアドライブを少なくとも一つは用意しておくべきだろうし、ファイルシステムが壊れた場合には再構築する必要が出てくる。私の場合、容量が 200 GB 〜 2 TB の外付けドライブを幾つか持っているのだが、この 2 TB ドライブの調子がイライラするほど悪いので、ファイルシステムの問題なのかドライブの問題なのかを切り分けするのにデータを取り出してドライブをフォーマットする必要がある。しかしファイルを待避するための 1.6 TB の空き容量はどこにもなく、先程も述べたように、私の所有するドライブの中で最も容量の大きいものと同様の容量を持つスペアドライブが必要であるということに気がついたのである。

たとえ RAID を使っていたとしても、ドライブが某かの理由で故障したりファイスシステムを再構築しなければならなくなったら、同様にスペアドライブが必要となるだろう。私は壁にぶつかっているが、恐らく同じようなことで行き詰まっている人は私以外にもいると思われる。これは私の保有する個人データであり、データの整合性及びセキュリティーの観点から、この問題はとうてい私の手に負えなくなってきている。問題は悪化の一途を辿ることになるだろう。そして申し訳ないが「クラウド」は実践的な解決法としては認められない。またバックアップメカニズムとしてテープを活用するというのは経済的な理由から現実的な解決方法とはならない。ブルーレイディスクはせいぜい 50 GB しか保存できないし、大量のデータをバックアップするのに時間が永遠にかかってしまう上、その課程で人間が度々介入して操作しなければならない。

そこでお尋ねしたいのだが、予算が限られている個人が大量のデータを所有している場合 (スペア用空きドライブを用意する以外に) どんな選択肢があるだろうか。このような問題に対処するため、どんな解決策があるだろうか。

この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。
  • by racco (37699) on 2012年03月28日 10時56分 (#2125213)

    予算は本来データの価値によって決まるはずだ。

    データの価値がないならバックアップする必要はないし、データの価値が少ないならハードディスクをもう一台買えば済むし
    データの価値が高いなら、他のより寿命の長いメディアにバックアップするし、さらにデータの価値が高いなら遠隔地にバックアップを保管する。
    特殊な例外として、自分以外の人にも普遍的に価値があるデータならばP2Pで放流することがバックアップ手段になるかもしれない。

    一般的には、予算が予め決まっていてより信頼性の高いバックアップ手段を探すなら、最初に価値のあるデータと価値のないデータを分別整理するべきだ。
    #今や2TBのハードディスクなんて1万円以下で買えるのに、それより安くする意味ってあるのかね、、

  • mhddfsで (スコア:3, 興味深い)

    by rti (659) on 2012年03月28日 12時33分 (#2125340) ホームページ

    個人宅でもっとも求められるのは、最初にデータロストを避けることとで、その次に面倒な手間と機器設置スペース問題だと思う。
    逆にあまり求められないのが、サービスダウンタイムだと思う。ごめんね、朝までに直すよでほとんど問題ない。

    で、ダウンタイム軽減のためのRAIDとかよくわかんない自称安全なファイルシステムだと、扱い次第では、データロストすることもあるし、オペレーションミスで消してしまうこともある。

    だからといって、バックアップ専用機の別PCを設置する場所もないだろうしね。

    で、結論として行き着いたのが、HDDをmhddfsで束ねてスペースを確保して、それと同じものをもう一つ用意して、夜間rsyncする。
    例えば、4台刺して、 2台をmhddfs で束ねて、残り2台もmhddfsで束ねるかんじ、、で、朝にrsync ね。
    間違って消しても、 最長一日だったら復旧できる。
    それに、mhddfsってext3とかの上にラップする形だから、mhddfsが壊れても個別ハードディスクは ext3 で mount できるしね。
    データオールロストを徹底的に避けてる。

    もちろん、同一PCの別のマシンにバックアップだから、OSのバグやストレージ上のrootでのオペミスには弱いけど、そこは割り切った。
    また、mhddfsは書き込みパフォーマンスの問題もあるけど、個人のストレージだし、VM を nfs mountとかするわけでもないし、そこまでシビアなものはないから、まーいいか的な感じで。

    http://d.hatena.ne.jp/rti7743/20110726/1311688637 [hatena.ne.jp]

    --
    by rti.
    • 「金槌を持つと何でも釘に見える」みたいな話だなー。
      冗長性と可用性と間違いへの耐性は別に考えたほうがいいぞ?

      それはRAID0のバックアップをrsyncで取っているのとほぼ同等でしかない。
      RAID0と違って性能アップはしないし可用性はドライブ単体より低い。
      バックアップ直前の間違いに対してリカバリー手段もない。

      それならバージョニング対応のファイルシステムをRAID1/6の上で使う方がずっといいと思うけどね。
      # 自動で他の機械にバックアップを作るファイルシステムとか面白そうだな。

      親コメント
      • by rti (659) on 2012年03月28日 22時38分 (#2125741) ホームページ

        バージョン管理ができるファイルシステムは理想だけど、それが壊れた時の復旧はどこまでできるの?
        専用のバックアップマシンを設置するなんて、家庭では無理だし。
        最悪壊れてもデータの一部はなんとしてでも復旧できるにしたいんだ。

        うちの何とかというファイルシステムは理論的に絶対に壊れませんっていっているファイルシステムのリカバリー屋がなぜあるのか、世の中は不思議がいっぱいだぜ。

        >それはRAID0のバックアップをrsyncで取っているのとほぼ同等でしかない。
        RAID0にはならないと思うよ。
        mhddfsが壊れても、元となる各ディスクは ext3 などで作られているので、局地的な復旧は可能になる。
        ハードディスクやRAIDコントローラが死にました、だからデータ全部死にましたはない。
        #イメージ的には、片肺になってもデータを取り出せる RAID1 に近いと思う。

        シンプルな技術を組み合わせることで、とことんデータをロストしないシステムを目指した。

        ># 自動で他の機械にバックアップを作るファイルシステムとか面白そうだな。
        なんか家庭内dropboxみたい。
        家庭内ネットワークだと、機材をどこまで設置できるかによると思う。

        --
        by rti.
        親コメント
        • まず、冗長性にも可用性にも寄与してないデータの堅さに関してはただの屋上屋でしかない「mhddfsが壊れても」って話がおかしいじゃん。
          RAID0と同じってのは、トラックナンバーよろしく何台壊れたらデータが飛ぶ可能性があるか考えてみりゃ当然のこととして理解できるはずなんだがなー。
          JBODの方が近いって指摘ならもちろんその通りだ。

          さて、一度に故障するとデータが壊れる可能性のあるドライブの台数なわけだけど、RAID0も1台。mhddfsも1台だよな?
          直接ext3使ってるのと同じか、容量に余裕がなければどれが飛んでも何かが飛ぶのでRAID0〜素のドライブ程度の強さしかないわけだ。
          どれか1台でも飛んだらデータロスの可能性のあるシステムを「とことんデータをロストしない」と称するのは適当と言えるかい?

          次に、rsyncのバックアップじゃ全然「とことんデータをロストしない」って条件を満たせない。
          rsyncする間隔が1日だと巻き戻し可能な期間はは0〜1日になる。最悪値で0なのにオペミス耐性を特徴に挙げられる?
          つまりだ、バックアップするならバージョン込みでバックアップする必要があるってこと。
          そこでバージョニング対応のファイルシステム使えば便利何じゃないか?
          逆にバージョニングなしでコピーしてもバックアップになってない可能性があるってのは今述べた通りだ。

          ついでに言えばRAIDは充分、というかmhddfsよりはシンプルだよ?
          RAID1ならRAIDとして扱わなくても見えるし、ハード的な代替可能性が大事ならSoftRAIDすりゃいいしな。

          親コメント
          • by rti (659) on 2012年03月29日 0時09分 (#2125802) ホームページ

            >さて、一度に故障するとデータが壊れる可能性のあるドライブの台数なわけだけど、RAID0も1台。mhddfsも1台だよな?
            データオールロストといえばよかったでしょうかね。

            ディスク1 ディスク2 があって、 RAID0 してます。 ディスク1が壊れたら、ディスク2がハードウェア的に無事でも、データは取り出せませんよね?
            ディスク1 ディスク2 があって、 mhddfs してます。 ディスク1が壊れたとしても、 ディスク2に書いている方のデータだけは取り出すことができます。
            これの違いだと思います。

            壊れ方次第では、データロストはもちろん、起きますよ。
            ただし、その場合でも、データをすべて失うのか、一部のデータだけでも復旧したいのかの違いです。
            家庭内のデータって愛着がって、しかも取り返しのつかないデータが多いと思います。
            最悪、一部だけでも復旧したいという思いは強いと思うんですね。

            >次に、rsyncのバックアップじゃ全然「とことんデータをロストしない」って条件を満たせない。
            >rsyncする間隔が1日だと巻き戻し可能な期間はは001日になる。最悪値で0なのにオペミス耐性を特徴に挙げられる?
            そこはどこまでの精度が欲しいか、そして手間をかけれるかの部分だと考えています。
            家庭内ネットワークにおいて、朝のN時までならば、戻せますよで、ほとんどの場合問題ないと思います。
            で、あれば、実装も運用も楽なこの方法で十分だと思いますね。

            --
            by rti.
            親コメント
    • by rti (659) on 2012年03月28日 12時36分 (#2125346) ホームページ

      いつものことながら、日本語がおかしいな。

      >同一PCの別のマシンにバックアップだから
      同一PCの別のハードディスクバックアップだから

      --
      by rti.
      親コメント
  • まだ出てないとは・・・!

    Windows Home Server V1(以下WHS)は、余ったHDDを組み合わせて、構成を動的に変更できるスパンボリューム的な物を作れます。
    大事なデータは異なるディスクに複製して保存できるので、クラッシュしても他のHDDからデータを復元できます。
    で、RAIDと違ってアレイを分解することなく、ディスクを開放できるので、WHSで管理しておけば、アレイ構成を増やすも減らすも問題無しです。

    WHSの問題点はこの機能を実現する為の拡張部分が遅いことでしょうか・・・

    で、WHS V2ではこれらの機能が除外されました。
    同等の機能をVVaultで実現可能です。
    VVaultはWindows7等の非サーバOSでも動くので、現状はこちらを試すのが現実的でしょう。
  • by iwakuralain (33086) on 2012年03月28日 10時48分 (#2125201)

    こんな解決策があってもいいのではないだろうか

    • by s02222 (20350) on 2012年03月28日 11時10分 (#2125233)
      データの内容によるけど、動画像なら、半諦めと考えて画質を切り詰め圧縮率を上げてエンコードしなおすとか、最新のコーデックでエンコードし直して容量を稼ぐとか。
      親コメント
    • 対策としては一応バックアップというか、並列環境を。

      とはいっても、ここの所何度か飛んだので、実はアドレス帳以外はどうでも良いと気が付いた。
      最近死んだPCも放置しっぱなしで別のPCから新PCへアドレス帳を写しただけで後何もしてないや。

      親コメント
    • by Anonymous Coward

      はい、諦められるようにエロデータはあえてバックアップをとっていません。
      中途半端に残るよりは消えて貰いたいデータですから。

    • by Anonymous Coward

      それは選択肢ではあっても解決策ではない。

    • by Anonymous Coward
      リスクマネジメントにおける「リスクの受容」の「消極的受容」っていうものですね。 ありだと思います。
  • 古くて容量の小さいHDDを集めて古いパソコンにFreeNASをインストール。HDDを単純に連結してバックアップに必要な容量を得る。実際にHDD4台を連結して運用しているが、特に問題なく利用できている。消費電力はかなり大きいので、バックアップするときだけ稼働するという運用。
  • まあ,元ネタに関しては
    「あきらめろ」
    しかないですねw

    自分は,
    本体 500GBHDD
    外付け 1TB HDD
    を基本として,その中でも,写真データとか重要なデータの入ったフォルダだけを
    外付けの 2TBのHDDにTimeMachineでバックアップとってます。
    さらに写真データについては1年ごとにBDにバックアップ取ってます。
    ちなみに,写真データについてはベストショットをiPhotoに残し,悩んだものはセカンドフォルダに入れる。
    セカンドフォルダに入れたものは,年末にBDに写真を焼く際に,同時にBDに入れ,元のHDDからは削除しておく。
    そうすることにより,おそらく使わないであろうBDの方に心の棚を作ることになり,
    メインスペースであるところのHDDには本当に必要なデータしか残らない。
    これがベストだとは思いませんが,あまり障害については気を遣わなくても良いようになってます。

    MP3データに付いては,基本的に元のCDは残ってるので要らないんですが,
    いざというときにめんどうなので,BD辺りに残しておこうかなあ,と思案中。

    ※ちなみに,他に250GBのHDDを緊急用ブートディスクとして保存してます。
    (緊急用と言うより,単にベータ版のOSを入れてるだけですけどもw)
  • 外付けHDDを付けっぱなしにしてるなら、価格/容量比が良い感じのうちでなるべく大きなのに置き換えて木っ端なのを棄てると、電気代で元が取れる可能性がある。あんまり古くならないうちに容量の小さなものから順に売り払っていけばより効果的。小さな容量のHDDを維持し続けるのは無意味。

    ついでに故障の可能性が多少は減ることが期待できるので、ある程度は問題の解答にも。根本的な解決には結局はスペアしか無いと思う。個人的なデータがホームビデオの類なら、曾祖母やらの親類縁者にデータを押しつけることでバックアップに代える、みたいな工夫は良く聞くけど。
    • データを親類縁者に押しつけると、そのサポートがもれなく付いてきてしまいませんか?

      「これテレビで見られないの?」
      「印刷したいんだけど、どうしたらいいの?」
      「映り悪いんだけど修正してくれない?」

      うちはそれに加えて、
      「あなたもそろそろ身を固めないと」
      みたいな大きなお世話まで付いてくるんですが。

      親コメント
  • 知り合いが息子のムービーの保存で同じように悩んでいたっけな。

    # ここ数日のスラドのスポンサーさんを立てるとすれば
    # サーバ機買ってWindows Home Server入れろ、そしてファイルサーバにしろ、かな

    • Re:お父ちゃんは大変だな (スコア:2, おもしろおかしい)

      by Anonymous Coward on 2012年03月28日 13時06分 (#2125376)

      そこでクラウディアさんに質問
      「大量のデータ(ポルノや海賊版ではなく)を保存するのに使えますか」
      クラウディア「……」

      親コメント
      • クラウドのストレージにバックアップってのを誰もが考えると思うけど、
        無料かそれに近い安いサービスだと1アカウントあたりの容量制限が
        ある。それを回避するとなると複数のサービス、複数のアカウントを
        使って分散保存することになり手間かかるんですな。

        また、クラウドにデータを送り出すためにはそれなりに太い回線が
        必要なんだけども、100Mbpsより速い光回線サービス契約する
        くらいなら100Mbps以下の契約にして、浮いた金でストレージ
        買えよという話ですよね。諸外国なら回線事情はもっと
        よろしくないですね。ISPによってはあまり上りの帯域を使いすぎると
        帯域しぼられちゃう可能性もある。

        あと、クラウドサービスを選ぶにしても、マイナーなところだと
        いきなりサービス終了とかしちゃうから油断できない。HPとか。
        容量無制限だったのを縛りつけちゃうトレンドマイクロとか。

        だから、クラウドに保存というのは、TB級のデータでは
        あまり最適解とは言えないんですよね。
        というのは元の記事の人は分かっているみたいだけど。

        とりあえず自分としては光速を越える移動手段が開発される
        未来に賭けて、データを電波にして宇宙のある方向に送信。
        将来、その電波のとんだ方に光速を超えて移動して、電波が
        飛んできたところをキャッチしてデータに戻すというのを考えてみた。
        これならストレージが要らない。

        ああでも結局そんな設備個人で用意できねえわなぁ……
        親コメント
  • 2TBHDDが手ごろな価格で買えたり、比較的安価な50GBリムーバブルメディアが存在するだけでもありがたいと思わなくては。
  • by Anonymous Coward on 2012年03月28日 11時00分 (#2125216)

    他にどんな解決策があると言うのだ。

    お勧めはベアドライブを裸族系の外付けスタンドで運用。
    ※洪水の影響が無ければ、安価なドライブをバックアップ専用に気軽に買えるんだけどな…。

    • まったくまったく。

      とても大切なデータなら Amazon S3 といったオンラインストレージがお手軽だと思いますが、(料金は下がり続けているとはいえ個人データ向けとしては信頼性過剰で)まだちょっとお高いし、要求条件でクラウド的な手法はお好みではないようで。

      となると、やはりスペアHDD/SSDを用意(要は、その時点で入手可能な最大容量のストレージ新製品を買い続ける)一択だと思いますけど、他に手段があるなら私も知りたい。

      親コメント
    • 同意。

      2Tのストレージを
      ・RAID1でミラー(2台)
      ・さらにrsyncで定期コピー(1台)

      で1/3のストレージ容量しか使えて無いけど
      これくらい無いと消失が怖い。

      # そろそろ3THDD買い増すべきか?

      親コメント
  • by Anonymous Coward on 2012年03月28日 11時01分 (#2125217)
    もしかして:断舎離?
    • by Anonymous Coward

      スラドで言及するなら舎離断だろう。

      #愛ってなんだ?!

  • by Anonymous Coward on 2012年03月28日 11時08分 (#2125228)

    数十TBが全部個人データのはずはないだろ。
    98%は映像画像データのはず。

    HDDが調子悪いだけでぶっこ割れていないのなら、そのまま数年放置でいい。
    数年後スタンダードが10TBとかになるから、その時に移動するなりすればいい。

    まあ、上の人の意見である破棄するのが一番手っ取り早い。
    どうせ一生見ないものばかりだろうに。

    そういう俺も撮りだメタビデオ5000本を破棄した・・・
    今はDVDが2000枚ほど・・・

    • by TarZ (28055) on 2012年03月28日 11時22分 (#2125254) 日記

      テラバイト級の自作ポエムを抱えている人かもしれないじゃないか!

      それから、自分で計算した数兆ケタの円周率データとか。(自分で計算したってところがこだわりなので、定数だからHDD故障してもまた入手可能ではないか、とは考えない)

      親コメント
      • by Elbereth (17793) on 2012年03月28日 19時51分 (#2125636)
        > それから、自分で計算した数兆ケタの円周率データとか。

        マジレスすると、仮に100歳の人が生まれた瞬間から一生をかけて
        計算してきた5兆桁のデータがあると仮定すると、
        1年あたりの計算量は500億桁、1日あたりだと1.36億桁
        一秒では37万強の桁となる。それだけすごい計算量の人が
        存在しうるか。半世紀あまり前のHDDの開発後に計算を
        始めたとしても、その倍の計算量だ。
        それだけの計算を脳内でできる人間はいないし、いたとしても
        計算結果を脳内からHDDに出力する方法はこれまで
        発明されていないので、例としては不適切である。

        #↑いちいちマジレスすんなよ
        親コメント
    • Re:はぁ?個人データ? (スコア:2, おもしろおかしい)

      by Anonymous Coward on 2012年03月28日 11時47分 (#2125279)

      >メタビデオ
      ビデオ撮影してるところを撮影したビデオ、とかかな?

      親コメント
    • by reo (4042) on 2012年03月28日 11時21分 (#2125251) 日記

      数十TBが全部個人データのはずはないだろ。
      98%は映像画像データのはず。

      個人的なデータで動画像というものもあるでしょう。しかもポルノでも warez でもないものが。子供の運動会やら学芸会を必死で撮影しているお父さんお母さんの姿は日本でも良く観られる光景です。子供が成長したら、成人したら、子供が出来たらまた観ようと思うコンテンツというのは無数に転がっていて、それらを破棄するのが一番いいなどと思えないことも容易に理解できるかと思います。

      --
      Hiroki (REO) Kashiwazaki
      親コメント
      • by 335 (4199) on 2012年03月28日 11時53分 (#2125285) 日記

        >それらを破棄するのが一番いいなどと思えないことも容易に理解できる

        それでもやはり、取捨選択することの価値を理解させることには意義がある。

        同じ費用をかけるならば、無駄に大量のホームビデオを保管することは失われるリスクを高めることになるわけだ。
        取捨選択したデータをより冗長にバックアップするほうがよいかもしれない。

        親コメント
        • by Anonymous Coward on 2012年03月28日 12時26分 (#2125319)

          というか、30時間のホームビデオなんてあっても見ない。30分にまとめてあれば見る可能性はある。
          3分にまとめられていれば感動映像になるかもしれない。

          分別しなければゴミ、分別すれば資源なのです。

          親コメント
          • で、いつか30分ないし3分のビデオに編集しようと思っている30時間のビデオがいつまでも手元にあるのですよ。

            親コメント
          • by Anonymous Coward on 2012年03月28日 14時43分 (#2125459)
             テープで撮り溜めていた頃は確かにそうでしたが、ファイルベースになるとこれが案外何とかなります。
             録画開始部、もしくは一定時間おきのサムネイルをザーッと並べて、見たいところだけちょこちょこつまんで見ればいいんです。
             ハイライト部を自動抽出してまとめてくれる機能なんてのもありますし。

             「n歳のとき、うちの子はどんなんだったかな?」と、ふと思い立ってサクッと見れるのが良いです。
             見始めると、家内も子供達もなんやかんやで食い入るように見てます。楽しいです。
            親コメント
      • by Anonymous Coward
         家庭用ビデオカメラの記録媒体がほぼフラッシュメモリに切り替わったのは、2010年くらいでしょうか。
         これらの現実的なバックアップ先はやはりBDレコーダー(内蔵HDD→BD)でしょうね。
      • by Anonymous Coward

        > 個人的なデータで動画像というものもあるでしょう。
        > 子供の運動会やら学芸会を必死で撮影しているお父さんお母さんの姿は日本でも良く観られる光景です。

        おっしゃるとおりです。

        ただ、最初に「とりためた子供のビデオがたくさんあって」といわずに
        「大量のデータ(ポルノや海賊版ではなく)」って言っちゃうと
        やっぱり突っ込まれますよ。

    • by Anonymous Coward

      写真データだけで5TB超えてます…。

      親が趣味で撮ってるんですけどね。RAWデータ込みなので1枚20MBぐらいある。
      ディスククラッシュ避けにミラーリングしてますが、バックアップまで取る余裕は無いですね(笑

      何十万枚もの写真、把握してるわけもないので失敗作はすぐに消して欲しいんだけど、ストレージ容量単価が順当に下がるから、ファイル整理圧力がかからないのが欠点。

      • ビデオもそうだけど,撮ったら即整理しないとね。
        自分も昔はRAWでこだわりで撮ってたけど,もう収集付かなくなったので,カメラの解像度が1800万画素を超えた辺りで諦めた。
        なるべく整理してるので,1年のデータはBD1枚でお釣りが来るぐらいで済んでる(ってまだ多すぎかw)。
        親コメント
  • by Anonymous Coward on 2012年03月28日 11時18分 (#2125247)

    原因がドライブの問題だった場合結局新品買い換えとなる。
    原因がファイルシステムの場合でも、ファイルシステムが壊れる程度には
    使用し続けたわけだから予防的買い換えを行う。
    どちらにしても新しいドライブを買って、それにデータをコピーして使用。
    旧ドライブはその時点でのスナップショットとして保存。

  • by Anonymous Coward on 2012年03月28日 11時26分 (#2125259)

    最大のバックアップはP2Pに流してしまうことだとかなんだとか

    • by Anonymous Coward

      「バックアップファイルは圧縮して、自分宛のメールとしてBBSに預けておく」

      というのを、昔何かの雑誌で見た記憶があるなぁ。

    • by Anonymous Coward

      アーカイブの一部が欠けても残りは復元できるとか、
      AESで暗号化できるとか、UNIXでも使えるとか考え出すと、
      放流用アーカイブのフォーマット選択に困る。

typodupeerror

私はプログラマです。1040 formに私の職業としてそう書いています -- Ken Thompson

読み込み中...