アカウント名:
パスワード:
車に例えるならフェラーリ乗ってるのと変らない感じですね、個人では性能使い切れないし使う用途もないCPUパワーがここまで必要な用途は真面目に考えるならサーバーの仮想化なんだろうけど、科学計算とかはGPUで計算したほうが良いだろうし
いやいや、ベンチマーク画面みながらニヤニヤしつつ一杯やると言う用途には最適ですよ
と言うネタは置いといて、科学技術計算でもGPUの方が早いと言う事はないですよ。つうか、GPUの方が早いケースは一部で、ほとんどの問題はGPUよりもCPUの性能を高めた方がパフォーマンスが上がります。
科学技術計算で行なうのは、ほぼ全ての問題でGPUでやらせるほうが速いよ。
問題をそのまんまベタにやらせたら汎用的なCPUのほうが速いが多いけど、一般にはGPU向け(極並列)に式を置き換える作業をする。普通に考えると遅くなるような計算の重複を発生させても式を並列化すると、よほど特殊なものでもないかぎり数千台単位で並列実行できるGPUには、いまのCPUの並列レベルでは手が届かない。
そんなことないです。分岐が多い用途とか、スレッド間のメモリ参照が多い用途だとGPUで性能出ません。だからPOWER9とか、スパコン富岳に搭載予定するA64FXなんていうスパコン向けのCPUが存在します。別のツリーで話題に出てるやねうら王のような将棋ソフトもその典型例です。過去にGPUやFPGAに移植した人もいますが、CPUより性能出ませんでした。
単純な性能面でも、GPUとの差は縮まっています。現在最高性能のGPUである、NVIDIAのTU102コアではFP32の理論性能が16 TFLOPS。一方、今回のCPUはFP32で11 TFLOPSです。この程度の差しかないと、少しでもGPUに向かない用途ではCPUに勝てません。
こういう状況なのでGPU側は、TensorCoreのようなAI専用プロセッサを搭載したり、RayTracing専用プロセッサを搭載したり、CPUとの差別化を図るようになっています。
どう計算しても、11Tflopsにならんのやけど。64(core) x2.9G(Hz) x8(avx2/32bit) x2(fma unit) x2(mul/add)で 5.9Tflops
最近のCPUってそんなに演算能力高いんですね。ただメモリ帯域はまだ数倍~10倍程度の開きがあるようなので、そこはネックになりそう。
>いやいや、ベンチマーク画面みながらニヤニヤしつつ一杯やると言う用途には最適ですよ
フェラーリも、街中を流して羨望のまなざしを受けてニヤニヤする・・・・って用途(?)があるでしょう(笑)
個人で性能を使い切る奴らの顔がいっぱい浮かんだけど、どう考えても一般人ではなかった#なんて書いたのがバレると、お前もな!って言われるんだろうな・・
> 個人で性能を使い切る奴らの顔がいっぱい浮かんだけど、どう考えても一般人ではなかった> #なんて書いたのがバレると、お前もな!って言われるんだろうな・・
これをデスクトップ向けと標榜しているっつーのがな
だって、ノートパソコン向けじゃないでしょ?
ハーフエッジ構造な3DCG方面だとGPUでは厳しいことが多いような
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
アレゲは一日にしてならず -- アレゲ見習い
ここまで来ると趣味のレベル (スコア:0)
車に例えるならフェラーリ乗ってるのと変らない感じですね、個人では性能使い切れないし使う用途もない
CPUパワーがここまで必要な用途は真面目に考えるならサーバーの仮想化なんだろうけど、科学計算とかはGPUで計算したほうが良いだろうし
Re: (スコア:0)
いやいや、ベンチマーク画面みながらニヤニヤしつつ一杯やると言う用途には最適ですよ
と言うネタは置いといて、科学技術計算でもGPUの方が早いと言う事はないですよ。
つうか、GPUの方が早いケースは一部で、ほとんどの問題はGPUよりもCPUの性能を高めた方がパフォーマンスが上がります。
Re: (スコア:0)
科学技術計算で行なうのは、ほぼ全ての問題でGPUでやらせるほうが速いよ。
問題をそのまんまベタにやらせたら汎用的なCPUのほうが速いが多いけど、一般にはGPU向け(極並列)に式を置き換える作業をする。
普通に考えると遅くなるような計算の重複を発生させても式を並列化すると、よほど特殊なものでもないかぎり数千台単位で並列実行できるGPUには、いまのCPUの並列レベルでは手が届かない。
Re:ここまで来ると趣味のレベル (スコア:2, 興味深い)
そんなことないです。
分岐が多い用途とか、スレッド間のメモリ参照が多い用途だとGPUで性能出ません。
だからPOWER9とか、スパコン富岳に搭載予定するA64FXなんていうスパコン向けのCPUが存在します。
別のツリーで話題に出てるやねうら王のような将棋ソフトもその典型例です。
過去にGPUやFPGAに移植した人もいますが、CPUより性能出ませんでした。
単純な性能面でも、GPUとの差は縮まっています。
現在最高性能のGPUである、NVIDIAのTU102コアではFP32の理論性能が16 TFLOPS。
一方、今回のCPUはFP32で11 TFLOPSです。
この程度の差しかないと、少しでもGPUに向かない用途ではCPUに勝てません。
こういう状況なのでGPU側は、TensorCoreのようなAI専用プロセッサを搭載したり、RayTracing専用プロセッサを搭載したり、CPUとの差別化を図るようになっています。
Re:ここまで来ると趣味のレベル (スコア:1)
どう計算しても、11Tflopsにならんのやけど。
64(core) x2.9G(Hz) x8(avx2/32bit) x2(fma unit) x2(mul/add)で 5.9Tflops
Re: (スコア:0)
最近のCPUってそんなに演算能力高いんですね。
ただメモリ帯域はまだ数倍~10倍程度の開きがあるようなので、
そこはネックになりそう。
Re: (スコア:0)
>いやいや、ベンチマーク画面みながらニヤニヤしつつ一杯やると言う用途には最適ですよ
フェラーリも、街中を流して羨望のまなざしを受けてニヤニヤする・・・・って用途(?)があるでしょう(笑)
Re: (スコア:0)
個人で性能を使い切る奴らの顔がいっぱい浮かんだけど、どう考えても一般人ではなかった
#なんて書いたのがバレると、お前もな!って言われるんだろうな・・
Re:ここまで来ると趣味のレベル (スコア:1)
> 個人で性能を使い切る奴らの顔がいっぱい浮かんだけど、どう考えても一般人ではなかった
> #なんて書いたのがバレると、お前もな!って言われるんだろうな・・
Re: (スコア:0)
これをデスクトップ向けと標榜しているっつーのがな
Re: (スコア:0)
だって、ノートパソコン向けじゃないでしょ?
Re: (スコア:0)
ハーフエッジ構造な3DCG方面だとGPUでは厳しいことが多いような