アカウント名:
パスワード:
この場合の定義は知らないが、おそらくシステムが消費する単位エネルギー当たりの何らかの演算回数の総数だろう。演算素子の単位時間当たりの消費電力は、おおよそ、電源電圧x(ターンオン時間+ターンオフ時間)x各ゲート毎のスイッチング回数の総和、に比例する。記事では大幅に良くなるとのことなので、GPU は CPU に比べて、一演算に要する、各ゲート毎のスイッチング回数の総和が大幅に少なくてすむ、ということだろうか? もしかして、GPU は、必要十分なゲートのみオン/オフしているのか? 最近、グラフィックボードが故障して GPU が使えなくなりどうしようかと思案中の者より。GPU の記事には興味津津なので。
エネルギー効率は、Flops/W、1Wあたりの演算回数で定義されてますね。
GPUのエネルギー効率が高い理由ですけど、一言で言えば、「演算処理に関わるゲート数(無駄)が少ない」ってことですね。GPUは、低機能なコアを数多く積んでいます。最新のGeForceは、512コアを積んでるいものもあったりして、せいぜい8コア程度な普通のCPUとは桁が違います。個々のコアの機能は少ないが、その分回路規模が小さいです。
x86 CPUなんかは、コア自体が高機能なので、どんなプログラムでもそこそこな速さで動きますが、GPUはその性能を引き出すのが難しいです。同じ処理でもプログラム次第
BlueGene/Q(POWER系) 17位 677104 / 340.5 = 1988.56 64位 172494 / 85.12 = 2026.48# 圧倒的。一人別次元。さすが、スパコンのためだけに開発されたプロセッサ。
POWER7(POWER系) 55位 185100 / 501.47 = 369.11 221位 73350 / 129.6 = 565.97# BlueGene/Qと同じPOWER系ながらガクッと落ちる。# 命令セットがエネルギー効率の決定的な要因ではないことがわかる。
PowerXCell 8i(POWER系+独自) 10位 1042000 / 2345 = 444.35 89位 126500 / 276 = 458.33# 65nmプロセス製ながら、40/45nmプロセスとも勝負できる数値。# 出た当時にはBlueGene/Pをも圧倒しただけのことはある。# しかし、この後継プロセッサをIBMが開発しない(開発中止した)ことから# 「『LINPACKスコアを消費電力で割った数値』だけ良ければ良いスパコン」# ではないことが透けて見える。
Xeon E5(x86系 Sandy Bridge) 15位 773700 / 924.16 = 837.19 61位 176700 / 198.72 = 889.19# 他より進んだ32nmを採用するとはいえ# 使用者からすれば同一製造プロセスで比較するよりその時に使えるかどうかが重要ともいえる。# PC用途向けだけでなく、スパコン向けとしても高性能なプロセッサを開発できる# Intelのイスラエルチームは大変素晴らしい。
Xeon X56x0(x86系 Nehalem) 9位 1050000 / 4590 = 228.76 140位 89670 / 212.62 = 421.74# 他より進んだ32nmを採用してこのありさま。# アメリカメーカなどがノートPCで軒並みNehalemを避けていたがスパコンでも振るわない。# 根本的にエネルギー効率が悪いのだろう。
Opteron 61xx(x86系 Hound) 3位 1759000 / 6950 = 253.09 8位 1054000 / 2910 = 362.2 46位 230600 / 540.4 = 426.72# 3位Jaguarの悪い数値はCPUだけをアップグレードしたからか?# その他の数値を見る限り、POWER7やNehalemとなら勝負になる範囲。
Opteron 62xx(x86系 Bulldozer) 20位 565700 / 972 = 582# 32nmを採用し、さすがにOpteron 61xxを超え、Nehalemも超えている。# しかし、Sandy Bridgeは強すぎた。
Tesla 20x0(GPU Fermi) 2位 2566000 / 4040 = 635.15 5位 1192000 / 1398.61 = 852.27 21位 496500 / 540 = 919.44 114位 103200 / 81.5 = 1266.26# 規模により大きく数値が変動する。GPU間の遠さとGPUメモリの少なさが原因か?# 現世代はSandy Bridgeに追いつかれたので、次世代GPUではまた引き離さないと# プログラミングが特殊であるため厳しいかもしれない。
Radeon(GPU) 33位 299300 / 416.78 = 718.12前回430位 42830 / 31.13 = 1375.84# 採用数が少ないが、数値的にはそんなに悪くない。# 前回430位の長崎大学のDEGIMAが今回のバージョンでは消費電力が載っていないのが残念。
ShenWei(Alpha?) 14位 795900 / 1074 = 741.06# 例の中国独自プロセッサ機。かなりいい数値。# 65nmプロセス製らしく、それが本当ならばこの後継はBlueGeneの強敵となっていくかも。
> Xeon X56x0(x86系 Nehalem)> 9位 1050000 / 4590 = 228.76> 140位 89670 / 212.62 = 421.74
同一CPUで倍近くも違うことに何の疑問も持たない上、Sandy BridgeにはAVXがあることも無視とはね。バカじゃないの?
9位はXeon X7560ですね、すみません。Nehalem-EXの存在をすっかり忘れてた。採用数少ないし。(と言い訳)というとでXeon X56x0の上段は 66位 168800 / 510 = 330.98
「同一CPUで倍近くも違うことに何の疑問も持たない」については129位のようなものがたくさんあるので、スルーしてしました。(と言い訳) 129位 96697 / 546.26 = 177.02 (Xeon X5670)
ちなみに「# 他より進んだ32nmを採用してこの
元コメの者です。
親コメントが「8位よりも効率の悪い3位のデータと2位よりも順位の低い5位」を比べている違和感
特に深い意味はありません。元々、国産同士の比較の方がなじみがあってわかりやすいだろうと、京とTSUBAMEの数字を出してみたら、電力効率がほとんど同じだったものだから、しかたなくTOP500を眺めてx86なスパコンの数字も出してみた、って流れです。(最初はTOP500も見ずに個別のスペック情報で書いてました。それよりはTOP500のリンクの方が統一的なフォーマットでわかりやすいだろうと後から修正。)
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
日本発のオープンソースソフトウェアは42件 -- ある官僚
エネルギー効率 (スコア:2)
この場合の定義は知らないが、おそらくシステムが消費する単位エネルギー当たりの何らかの演算回数の総数だろう。演算素子の単位時間当たりの消費電力は、おおよそ、電源電圧x(ターンオン時間+ターンオフ時間)x各ゲート毎のスイッチング回数の総和、に比例する。記事では大幅に良くなるとのことなので、GPU は CPU に比べて、一演算に要する、各ゲート毎のスイッチング回数の総和が大幅に少なくてすむ、ということだろうか? もしかして、GPU は、必要十分なゲートのみオン/オフしているのか? 最近、グラフィックボードが故障して GPU が使えなくなりどうしようかと思案中の者より。GPU の記事には興味津津なので。
Re: (スコア:2)
エネルギー効率は、Flops/W、1Wあたりの演算回数で定義されてますね。
GPUのエネルギー効率が高い理由ですけど、一言で言えば、「演算処理に関わるゲート数(無駄)が少ない」ってことですね。
GPUは、低機能なコアを数多く積んでいます。最新のGeForceは、512コアを積んでるいものもあったりして、せいぜい8コア程度な普通のCPUとは桁が違います。
個々のコアの機能は少ないが、その分回路規模が小さいです。
x86 CPUなんかは、コア自体が高機能なので、どんなプログラムでもそこそこな速さで動きますが、
GPUはその性能を引き出すのが難しいです。同じ処理でもプログラム次第
長文失礼 (スコア:1)
BlueGene/Q(POWER系)
17位 677104 / 340.5 = 1988.56
64位 172494 / 85.12 = 2026.48
# 圧倒的。一人別次元。さすが、スパコンのためだけに開発されたプロセッサ。
POWER7(POWER系)
55位 185100 / 501.47 = 369.11
221位 73350 / 129.6 = 565.97
# BlueGene/Qと同じPOWER系ながらガクッと落ちる。
# 命令セットがエネルギー効率の決定的な要因ではないことがわかる。
PowerXCell 8i(POWER系+独自)
10位 1042000 / 2345 = 444.35
89位 126500 / 276 = 458.33
# 65nmプロセス製ながら、40/45nmプロセスとも勝負できる数値。
# 出た当時にはBlueGene/Pをも圧倒しただけのことはある。
# しかし、この後継プロセッサをIBMが開発しない(開発中止した)ことから
# 「『LINPACKスコアを消費電力で割った数値』だけ良ければ良いスパコン」
# ではないことが透けて見える。
Xeon E5(x86系 Sandy Bridge)
15位 773700 / 924.16 = 837.19
61位 176700 / 198.72 = 889.19
# 他より進んだ32nmを採用するとはいえ
# 使用者からすれば同一製造プロセスで比較するよりその時に使えるかどうかが重要ともいえる。
# PC用途向けだけでなく、スパコン向けとしても高性能なプロセッサを開発できる
# Intelのイスラエルチームは大変素晴らしい。
Xeon X56x0(x86系 Nehalem)
9位 1050000 / 4590 = 228.76
140位 89670 / 212.62 = 421.74
# 他より進んだ32nmを採用してこのありさま。
# アメリカメーカなどがノートPCで軒並みNehalemを避けていたがスパコンでも振るわない。
# 根本的にエネルギー効率が悪いのだろう。
Opteron 61xx(x86系 Hound)
3位 1759000 / 6950 = 253.09
8位 1054000 / 2910 = 362.2
46位 230600 / 540.4 = 426.72
# 3位Jaguarの悪い数値はCPUだけをアップグレードしたからか?
# その他の数値を見る限り、POWER7やNehalemとなら勝負になる範囲。
Opteron 62xx(x86系 Bulldozer)
20位 565700 / 972 = 582
# 32nmを採用し、さすがにOpteron 61xxを超え、Nehalemも超えている。
# しかし、Sandy Bridgeは強すぎた。
Tesla 20x0(GPU Fermi)
2位 2566000 / 4040 = 635.15
5位 1192000 / 1398.61 = 852.27
21位 496500 / 540 = 919.44
114位 103200 / 81.5 = 1266.26
# 規模により大きく数値が変動する。GPU間の遠さとGPUメモリの少なさが原因か?
# 現世代はSandy Bridgeに追いつかれたので、次世代GPUではまた引き離さないと
# プログラミングが特殊であるため厳しいかもしれない。
Radeon(GPU)
33位 299300 / 416.78 = 718.12
前回430位 42830 / 31.13 = 1375.84
# 採用数が少ないが、数値的にはそんなに悪くない。
# 前回430位の長崎大学のDEGIMAが今回のバージョンでは消費電力が載っていないのが残念。
ShenWei(Alpha?)
14位 795900 / 1074 = 741.06
# 例の中国独自プロセッサ機。かなりいい数値。
# 65nmプロセス製らしく、それが本当ならばこの後継はBlueGeneの強敵となっていくかも。
Re: (スコア:0)
> Xeon X56x0(x86系 Nehalem)
> 9位 1050000 / 4590 = 228.76
> 140位 89670 / 212.62 = 421.74
同一CPUで倍近くも違うことに何の疑問も持たない上、Sandy BridgeにはAVXがあることも無視とはね。
バカじゃないの?
バカでした。 (スコア:0)
9位はXeon X7560ですね、すみません。
Nehalem-EXの存在をすっかり忘れてた。採用数少ないし。(と言い訳)
というとでXeon X56x0の上段は
66位 168800 / 510 = 330.98
「同一CPUで倍近くも違うことに何の疑問も持たない」については
129位のようなものがたくさんあるので、スルーしてしました。(と言い訳)
129位 96697 / 546.26 = 177.02 (Xeon X5670)
ちなみに「# 他より進んだ32nmを採用してこの
Re:バカでした。 (スコア:1)
元コメの者です。
特に深い意味はありません。
元々、国産同士の比較の方がなじみがあってわかりやすいだろうと、京とTSUBAMEの数字を出してみたら、電力効率がほとんど同じだったものだから、しかたなくTOP500を眺めてx86なスパコンの数字も出してみた、って流れです。
(最初はTOP500も見ずに個別のスペック情報で書いてました。それよりはTOP500のリンクの方が統一的なフォーマットでわかりやすいだろうと後から修正。)