AMD、32GBのメモリを搭載したGPUを発売 31
ストーリー by hylom
グラフィックプロセッサというと違う感 部門より
グラフィックプロセッサというと違う感 部門より
あるAnonymous Coward 曰く、
AMDが32GBという巨大なビデオメモリを搭載できる高性能演算サーバー向けGPU「FirePro S9170」を発表した。このGPUはLAPACKのdgemm(倍精度浮動小数点の行列積)といった演算向けに開発された製品で、学術機関や政府機関、石油/ガス業界、および深層ニューラルネットワークの演算クラスタ開発向けだそうだ。ちなみにお値段は3000~4000ドルとのこと(TECHGATE)。
単精度浮動小数点数演算性能は最大5.24TFLOPS、倍精度浮動小数点演算性能は2.62TFLOPSと強力。OpenCL 2.0にも対応しているほか、2015年第3四半期に提供開始予定のOpenMPおよびOpenACCへの対応予定とのこと(AMD、PC Watch、Slashdot)。
メモリ (スコア:2)
AMDの文書では『ビデオメモリ』っていう記述は無い。
Re: (スコア:0)
タレこみ人の母でございます。 この度は息子が大変ご迷惑をおかけし、深くお詫び申し上げます。
Re: (スコア:0)
GDDR5とは書かれてますよ。
一応はOpenGL 4.4をサポートするGPUのようだし、別にビデオメモリでも間違ってはいないのでは?
Re:メモリ (スコア:1)
OpenGL 4.4やDirectX12で最大4096×2160相当の画像データを生成できるが、映像出力は持ってないので、別途PCI-E x16から別のビデオカードに画像データを転送してやらないと映像出力できない。
GPUが直接操作できる自分用のオンボードローカルメモリであっても、果たしてビデオメモリといえるかどうかは疑問。
Re: (スコア:0)
オフスクリーンレンダリングできるならVRAMでは?
Re: (スコア:0)
そんなへんてこな定義は初めて聞いた
Re:メモリ (スコア:1)
Re: (スコア:0)
VRAMはフレームバッファ以外の用途(Zバッファだとか、テクスチャバッファだとか、シェーダー置いたりとか)にも使うからねえ。
同じカードでも、ディスプレイアダプタに使う時はVRAMで、GPGPUに使う時は只のメモリと呼び方変えんの?とか。
Re: (スコア:0)
裏VRAMみたいなもん?
Re: (スコア:0)
このカードがグラフィクスのプロセシングを主眼にしてないことに比べれば、別にいいんじゃない?
メモリを搭載したGPU (スコア:0)
メモリが一体なのかと思った。
Re: (スコア:0)
表現も統一してほしいですよね。
GPUとはプロセッサユニットのはずなのに、GPUを搭載した拡張カードもGPUと呼ぶ・・・
Re:メモリを搭載したGPU (スコア:2)
つまり…拡張カード全体で一つの交換部品ですので、あれ全体で不可分のユニットと考え呼称しております次第でありまして…
# Slot形状のCPUも下駄部分に違和感あるな
# 消費財だと思ってなかったものが消費されるのに近い違和感
Re: (スコア:0)
そう言えばSlotでCPUさしてた頃は、どう見ても拡張カードの形状でしたねCPU。
たくさん足の生えた小さな黒い箱型がプロセッサユニットというのも思い込みに過ぎないか。
Re: (スコア:0)
AthlonやPentium IIじゃあるまいに。
Re: (スコア:0)
CPUがワンチップのLSI化される以前、ワンボードだった頃の話では?
さらに遡ると、CPUだけでも複数ボードの組合せ。
Re: (スコア:0)
PentiumIIさんが仲間に。。。
もとい元祖を主張されています
Re: (スコア:0)
ここまで来るとコプロだよね。
それとも非対称プロセッサ構成の一部と見るべき?
Re:メモリを搭載したGPU (スコア:2)
コプロと非対称マルチプロセッサとNUMAとSMPの違いというものがよくわからないですね。
Re: (スコア:0)
年内か来年あたり、インタポーザ上にHBMでオンパッケージにGB単位のメモリを搭載したGPU/APU/CPUが出てきそうな感じですからね。
単純に単層のメモリパッケージをGPUのパッケージに搭載したものとしてはPS3のRSXのパッケージに256MBのメモリを張り付けている例がある。
HBMにインタポーザ上に実装するのが、一般的になればメインメモリを追加する喜びは減るのだろう。
巨大 (スコア:0)
いまだに32GBが巨大なのか?!
Re: (スコア:0)
GPUボード一つに乗る量としては。
マザーに乗っけたメモリとは使い勝手が断然違うと思いますけど。
Re: (スコア:0)
メインメモリ64GB以上ないと、効率的に運用できそうもないですね。
Re: (スコア:0)
必要に応じて、このユニットを複数台使うことを想定しているのでしょう。
まあTB単位のメモリを使う用途に、このユニットが向いているかどうかは不明ですが。
Re: (スコア:0)
演算クラスタ用だからこのユニットを複数ぶっ刺した演算ノードを複数繋ぐのが「前提」じゃないかな。
別ノードからユニット内のデータにアクセスするとどうしても遅延や帯域が足りない。
即座にアクセスしたいデータはユニットごとに保持する方が良いから、
その場合は10GB単位のデータ扱うって程度の条件で十分に有効に使える。
メモリ領域毎に独立性のある演算でもアクセスの速いメモリがユニットごとに32GBだからはやり有効に使える。
単純に、大容量データを扱う問題領域でもGPGPUが使いやすくなったと解釈すれば良いような気がしますけど。
32GB (スコア:0)
全然足りない><
Re: (スコア:0)
1ユニットだからね。これを1ノードにたくさん挿して、そのノードでクラスタ作ってからが本番。
ノード自体にもメモリ載せるから容量はガッツリ稼げますよ
メモリより倍精度演算 (スコア:0)
これが過去のAMD製品に比べて新しいところは32GBメモリなのでしょうが、この製品が他社製品に対してユニークな点は精度浮動小数点演算の性能が高い点ですね。
AMDのFireProは単精度5.24TFLOPSに対して、倍精度2.62TFLOPS。単精度の1/2の性能です。
NvidiaのTeslaだと単精度5.60TFLOPSに対して、倍精度1.87TFLOPS。単精度の1/3の性能です。
Nvidiaは倍精度より、単精度、もっと言えば16bitの高速化に力を入れてるので、今後も倍精度を優先することはなさそう。
そっちの方が今後の用途や市場規模が大きいからだそうです。
一方AMDは今のところ倍精度重視ですが、次の世代でも続くんでしょうか。
Re: (スコア:0)
みんなIntel向けに最適化するので損しかしなかったCPUの二の舞いにならなきゃいいんですがね。
Re: (スコア:0)
「どんな環境で実行されるかわからないからシェアの大きい環境向けに最適化」
というのは演算クラスタ向けではそこまで大きくないんじゃないかと思いたい。
Re: (スコア:0)
現状だと一般人が買える倍精度がある程度性能の物ってもう280X位?