アカウント名:
パスワード:
コメントに突っ込みで申し訳ないですが,Cellを生かしたコードを書くなら,SPUはCODE+TEXT共用で256KBしかメモリ持ってないですし,PPU<->SPU間はいっぺんに最大16KBしか転送できないですから,ページングやオーバーレイなどのテクニックは必須になります。 その辺を分かっててSPUをぶんまわせるコードを書けるならGPUが非力でも十分カバーできるでしょう。 RSXはGPUっていうよりDACとして使ってるように思えます。(既存回路の使い回しでコストも抑えられますし。)
わたしが気になるのはむしろ,採用されているCellが倍精度浮動小数点のストール対策が施されたものかどうかです。 PowerXCell 8iならこの対策が施されているのですが,特に謳ってないところを見るとこれは期待しない方が良さそうですね。
SCE広報の説明によれば、日本では出荷される80GB版の全数がCell、RSXともに65nm世代となる。 [impress.co.jp]
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
ハッカーとクラッカーの違い。大してないと思います -- あるアレゲ
だいぶマシになったけど、RSXが足かせ? (スコア:2, 興味深い)
高いグラフィック性能が必要な場合
→GeForce7世代のRSXはすでに時代後れ、同世代と比較しても128bitのメモリインタフェースが災いし、パフォーマンスは伸びない
グラフィック性能は不要な場合
→RSXは現行GPUと比べると、消費電力低減などの機能が大きく劣り、3Dを使用しなくてもある程度発熱してしまう
前者はRSXを改良するか、Cell+RSXとはいえPS3との互換なんて気にする必要ないんだから、互換性が無い代わりに性能の高い、最新のチップを買ってきて載せちゃうとか。
後者は性能を多少犠牲にする代わりに消費電力を落とした「ローパワー版RSX」みたいなのを載せるとか(メモリバスを半減するだけでも結構効く)、または同じく外部から買ってくるか。
……といった感じで、解決方法はありそうなんだけど、結局PS3をそのまんま流用しちゃってる。
ようするにグラフィック関係が中途半端すぎる。RSXはGPGPUも使えないし。
(むしろPS3から変えたくない理由があったのかな)
他に理由があるとすれば、
>DVI-I出力が可能なBKCU-VD1ビデオディスプレイボードが用意されています。
のため?……でも、もっといい方法があるよね。
で、アキレス腱のメモリは1GBになってある程度カバーされてるけど、増設する際はPCIeを使用するので、転送速度が遅くてそれほどパフォーマンス出ない印象。
(それをなんとかするために、PCIeに限界の8GB載せたとして、メインの1GBをキャッシュ代わりに使う、みたいな感覚かなあ)
ただ素のPS3と比べるとはるかに改善されてて、割と実用的にいけちゃうかもしれない。買ってもいいんかもしれないけど、価格が気になるかなあ。
#PC-98時代のCバスに差すEMSメモリを思い出した。またページングみたいなことやるのか?
Re:だいぶマシになったけど、RSXが足かせ? (スコア:4, 興味深い)
コメントに突っ込みで申し訳ないですが,Cellを生かしたコードを書くなら,SPUはCODE+TEXT共用で256KBしかメモリ持ってないですし,PPU<->SPU間はいっぺんに最大16KBしか転送できないですから,ページングやオーバーレイなどのテクニックは必須になります。
その辺を分かっててSPUをぶんまわせるコードを書けるならGPUが非力でも十分カバーできるでしょう。
RSXはGPUっていうよりDACとして使ってるように思えます。(既存回路の使い回しでコストも抑えられますし。)
わたしが気になるのはむしろ,採用されているCellが倍精度浮動小数点のストール対策が施されたものかどうかです。
PowerXCell 8iならこの対策が施されているのですが,特に謳ってないところを見るとこれは期待しない方が良さそうですね。
@@@@
Re:だいぶマシになったけど、RSXが足かせ? (スコア:4, 興味深い)
Cellには2ポートのFlexIOがあるだけで、PCI Expressの汎用のGPUは直接は接続できないからでしょう。
CellとFlexIOで接続される東芝のSCC(Super Companion Chip)にはPCI Express x4がついてるけど、GPUをつなぐには細すぎるかと。
参考:【レポート】SIGGRAPH 2007 - 一般展示セクションレポート(後編) (1) PS3のようでPS3じゃないCellワークステーション(1) [mycom.co.jp]
GPGPUが使えるような最新アーキテクチャのGPUを接続したいのであれば、Cellを再設計してPCI Express x16を追加するか、FlexIO接続の最新GPU(RSX2?)を開発するか、PCI Express x16を持ったI/O LSI(SCC2?)を開発する必要がありますが、どれも開発費用を回収できる見込みがないんじゃないかと。
Re:だいぶマシになったけど、RSXが足かせ? (スコア:1)
# GPGPU で使うとなると 256bit 幅でも最先端 GPU には足りないみたいな話もあるらしいです。
Re: (スコア:0)
Re: (スコア:0)
新しいノードとしてNVIDIAのTesla S1070を導入しています。
http://pc.watch.impress.co.jp/docs/2008/1203/nvidia.htm [impress.co.jp]
Tesla S1070はGTX280のチップを4基積んだ1Uラックマウントシステムで
単精度の処理能力ピーク値が3.73 to 4.14 TFlopsと高い性能です。
もちろんこんなピーク値なんて実アプリケーションでは出ないでしょうが
CELL開発の面倒さと比較して、NVIDIAのGPUを積んだデスクトップやノートPC上のCUDAで開発して
それを持ってくればいいTeslaの方がいいのではないでしょうか?
Re:だいぶマシになったけど、RSXが足かせ? (スコア:1)
>それを持ってくればいいTeslaの方がいいのではないでしょうか?
私もそれ思いましたよ。単精度、倍精度ともにGPUの方が圧倒的に上だし、
開発の面ではLarrabeeが出てくればますますハードルが下がりそうだし、
Cellって競争力あるのかな?
他にもCellと同じSPEを積んだSpursEngine [itmedia.co.jp]とかが注目されてるみたいだけど、
GPUでも同じような事は出来だろうし何れPhysXみたいに見向きもされなくなるように思えてならない。
いっその事、地デジカードに内臓する定番エンコーダにしてしまえばもう少し数は出るかもしれませんけど。
何というかいつもの事だけど日本の半導体事業が心配に思えてしまうよ。
Re: (スコア:0)
もう少し局所的並列度の低いもの(2並列とか4並列とか)で
大局的並列度の高いものをSPEの数で圧倒できる場合はあると思います。
# 問題は、それに気付かせるPRの仕方と気付くほど採用者(≠開発者)が有能かということだと思う
Re: (スコア:0)
実はPS3のゲームの開発用マシンの流用だったりして。
Re: (スコア:0)
Re: (スコア:0)
延々払い続けるハメになったからという話があります。
したがってRSXもライセンス料を払わずにすんで好きなように生産できる契約にしていると思われます。
BCU-100を出した部署は、プロ用機器を担当しているところです。すぐ生産中止になってしまうPC用のパーツはなかなか採用できないでしょう。
そもそもRSXなんかなくていい気がしますが、何か3Dのグラフィックを使う応用を考えてるのでしょうね。
Re: (スコア:0, すばらしい洞察)
サーバーマシンに高価なグラフィックチップは要らないから。
リモートアクセスするでしょ。
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)