iPad 2の性能はスーパーコンピュータ「Cray-2」に匹敵する 52
ストーリー by hylom
ただし消費電力比 部門より
ただし消費電力比 部門より
taraiok 曰く、
テネシー大学のPiotr Luszczek氏が、アメリカのマサチューセッツ州で開催されたIEEE主催の「HPEC 2012」で「Anatomy of a Globally Recursive Embedded LINPACK Benchmark.」と題し、ベンチマークを通じてPCの進化を見るというプレゼンテーションを行った。同氏がスーパーコンピュータなどの分野で使われているベンチマーク「LINPACK」を、さまざまなデバイスで動作させてテストを行ったのだが、その結果中には興味を引くものが含まれていたという。 まず1つは、LINPACKを使用してAppleの「iPad 2」の性能を計測したところ1Wあたり4 GFLOPSという、1985年製のクレイ・リサーチ社製スーパーコンピュータ「Cray-2」と同等の性能になったという(Phoronix.com、本家/.)。
もう1つは、AMDのOpteron 6180SEプロセッサをほぼ1(正確には1.04)とした1Wあたりの性能比で、ARM Cortex-A9は4倍のパフォーマンスを実現しているという。同テストでは、AMDのストリーミングプロセッサ「AMD FireStream 9370」が2.35倍、NVIDIA「Fermi M2050」が2.29倍、Intel「XeonプロセッサE7-8870」が0.74倍、Intel「Atom N570」が0.79倍という結果になったとしている。
ダウンサイジング (スコア:5, おもしろおかしい)
つまり椅子が座布団になったってことさ
Re: (スコア:0)
山田君、座布団1枚!
Re:ダウンサイジング (スコア:1)
Cray2って椅子だったけ?
1系じゃね?
なるほど (スコア:4, おもしろおかしい)
iPad2の消費電力は、1985年のスーパーコンピュータ「Cray-2」に匹敵する
ということか。
#モノは言いよう。
Re:なるほど (スコア:4, 参考になる)
たぶん違います。下でphasonさんが指摘している通り、タレコミの間違い。
正しくは
・iPad 2のピーク性能(消費電力関係なし)は、Cray-2 [wikipedia.org]と同等の1.9 GFLOPS。
(数字は直接書かれていませんが、グラフから見て取れます)
・iPad 2の1ワットあたりの性能は、Opteron 6180SEの4倍となる4 GFLOPS/W。
で、単純にこれを当てはめると、iPad 2の消費電力は0.48 Wぐらいになります。
ちなみに、Cray-2の消費電力は200 kW。桁が5つも異なります。
Re:なるほど (スコア:3)
分かっているとは思いますが、iPad 2の消費電力が0.5Wなのではありませんので誤解のないよう。
Apple A5のCortex-A9デュアルコアのTDPが0.5Wということで、
Apple A5そものもはもっと食いますし、言うまでもありませんがiPad2システム全体
はもっと消費電力は多くなります。
iPad 2のApple A5というとSamsung 45nmプロセスじゃなかったかと思いますが、
ARMの45nm向けのCortex-A9ハードマクロの公称が800MHz@0.5Wでしたから、
そんなもんなのでしょう。
Re:なるほど (スコア:3)
そうそう、補足で、この記事を最初みたときにちょっとどうなのかなと思ったのは、
Cortex-A9はセカンダリキャッシュがオプションでして、公称のTDPにセカンダリキャッシュ分は
入っていないはずです。
比較対象のプロセッサはすべてキャッシュ込みですが、Apple A5はそうではないと推定されるので
キャッシュを入れればOpteron 6180SEの4倍という数値にはならないかもしれませんね。
他のTDPもメーカーの公称値みたいなので、どうなのかな、というところはありますけど。
Re:なるほど (スコア:2)
GPU部分の演算能力は使われてないんでしょうかね?
Re:なるほど (スコア:2)
たぶん使ってないでしょう。
Apple A5のGPUは汎用的には使えないのではないか、
というのに加えて、Cortex-A9の論理値は1コアあたり3.2GFLOPS@800MHzでiPad2は
デュアルコアですから、LINPACKで2GFLOPSというスコアは、
Cortex-A9だけを使っても出せそうに思います。
Re: (スコア:0)
例えればNOP命令が1サイクルなのを最小実行サイクル1と言っているようなものです。
またケータイ/スマホ向けSoCは非常にきめ細かい電力制御を行っているため、これも単純比較は無意味。
Re: (スコア:0)
NOP命令が1サイクルなのを最小実行サイクル1と言っているようなものです。
何か問題が?
Re:なるほど (スコア:2)
「ビタミンB1は、グリーンピース7400個分」を思い出しました。
Re: (スコア:0)
リチウムイオン電池ってすごいんですね。そりゃ爆発するわ
おかしいよね? (スコア:2)
そのネタ元のサイトのPhoronix.com,多分間違ってますよね?
そもそもチップのperformance/Wattは長いこと向上し続けてるんだから,遙か昔のCray-2とiPadで同じぐらい,なんてのがあり得ない話だということはここに来られている方の多くはすぐわかるはず.
実際,
http://www.phoronix.com/image-viewer.php?id=0x2012&image=apple_ipa... [phoronix.com]
のグラフ,縦軸の数字と各機種から考える限り,縦軸は純粋なパフォーマンス(消費電力関係無いFLOPS値)と見るのが妥当では?
だからperformance/Wattでは無く,純粋なperformanceがCray-2とiPad2/3あたりでほぼ同じ(タレコミ文のタイトルが正しく,本文が間違い),という話ですよね?
Phoronix.comは,その後のGPUなども含めたperformance/Wattの話とごっちゃにしているだけのような……
訂正:ネタ元サイトは間違ってませんでした (スコア:2)
って,よく読んだらネタ元のサイトは間違ってませんね.4GFLOPS/Wattの文章が変な位置に書かれてるけど,間違いでは無い.
その妙な構成の文章を読んで,タレコミの段階で勘違いした,ですね.
大元のPhoronix.comにたいしては,濡れ衣を着せて申し訳ありませんでした.
Re: (スコア:0)
ワットあたりの性能ではないよね。
Cray2とiPad2の性能/ワット比が同じだとしたら、ここ数十年で何も進歩してないことになるw
Re:おかしいよね? (スコア:1)
解答: taraiok/hylomのゴールデンコンビ
Re: (スコア:0)
解答: taraiokはhylomの別アカウント
Re: (スコア:0)
>あり得ない話だということはここに来られている方の多くはすぐわかるはず.
Cray-2の使用電力のほとんどは冷却のためであること
はすぐ分かりました。
そのうち (スコア:2)
このペースで行けばスーパーコンピューター「京」の処理能力が手のひらサイズになる日もそんなに先のことじゃないかな。
Re:そのうち (スコア:1)
単純計算だけど京のCPUが88128個だから、ワンチップ化するには300分の1位までまで微細化しないといけない
京のCPUは45nmの製造プロセスで作られてるから。この300分の1で0.15nmケイ素の原子半径より少し大きい位になる。
三次元半導体とかの対処策も無いわけじゃないけど。まだまだ先の話だと思うよ
Re:そのうち (スコア:2)
ちょっとズルいかもしれないけど、「京」程度のサーバでの演算結果を
手のひらサイズの端末が高速な無線通信で取り出せば、
実質的に目的を達成していることになると思うんだけど、それじゃダメかな。
Siriとか実質そういう仕組みだよね。
Re: (スコア:0)
人間が巨大化する可能性も。
Re:そのうち (スコア:1)
体積比で300の三乗根で、6.7倍にスケールアップしないといけませんね。
身長のみで見たとき、江戸時代(ex.1712年)の男性平均身長を156cm、現代(ex.2012年)のそれを166cmと仮定すると、
300年で10cmだから単純計算で28386年必要ですね。
# 勿論比例関係にあるとか全くどうでもいい話ですのでAC
Re: (スコア:0)
ヤック・デカルチャ
Re: (スコア:0)
無理じゃない?
ここ数年プロセッサ一個あたりの性能向上はほぼ頭打ちで、
それを横にたくさん並べるか、性能はそのまま消費電力を落としてモバイル機器にPC並みの性能を
という方向に進んでる。
ああ、手のひらのほうを大きくするという手はあるか。
Re:そのうち (スコア:3, おもしろおかしい)
|迦)チラッ
Re:そのうち (スコア:1)
この発言から、きっとエンジニアではないと判断しますが、
一般人が無理じゃない?と思うことを実現してきたのが
エンジニア(研究者、科学者etc)なのだと思います。
# 自分ただの土木ですが
Re: (スコア:0)
一般人ができそうだと思うことの大半を実現できないのが科学者や技術者です
Re: (スコア:0)
一般人がお金をたくさん用意してくれればそれなりに出来るんじゃない?
Re: (スコア:0)
金積んで物理の法則を曲げられるなら、どんなに楽なことか。
Re: (スコア:0)
Re: (スコア:0)
驚愕の事実を一つ教えてやろう。親コメはムーアについては何も語ってないんだ。
Re: (スコア:0)
>横にたくさん並べる
プログラム次第では並べれば並ぶほど速くなります。
さらに、縦にも並べればw
Re: (スコア:0)
動作周波数が頭打ちというのと性能向上が頭打ちというのは違うよ
いろいろなベンチマークでコアあたり周波数当たりの性能もだいたい5−6年で3倍くらい [tomshardware.com]になってる
それに京だってスカラなんだから「横にたくさん並べる」ことで原理的には追いつくでしょ
まあ素人さんが「無理だ」というところを解決するところに技術者や研究者の存在価値があるわけだけど
Re: (スコア:0)
動作周波数が上がらないってことは、性能が上がらないのと同じだよ。
そのグラフもcore2以降の性能向上は緩い、単にクロック至上主義のPentium 4が入ってるから大きく見えるだけ
まだ上昇余地が有るから上がってはいるけどさ。
依存性の高い処理だと、同時命令実行数を増やそうが、デコーダ強化しようがクロックが上がらない限りどっかで性能が頭打ちになる。
Re:そのうち (スコア:1)
>動作周波数が上がらないってことは、性能が上がらないのと同じだよ。
件のグラフはクロックあたりなんですが
>単にクロック至上主義のPentium 4が入ってるから大きく見えるだけ
矛盾していることに気がついていますか?
クロックを上げただけでは意味がない(Pen4)なら、「動作周波数が上がらないってことは、性能が上がらないのと同じ」ではないですよね
スパコン的な処理を考えるなら、動作周波数xIPCx並列数がシステム全体の性能です
第一項が定数になっても他の変数が増加すればシステム性能は上がっていきます
もちろんアムダールの法則による限界はありますが、「動作周波数が上がらなければ性能も上がらない」という命題は完全な間違いです
Re: (スコア:0)
Pentium 4はクロックあたりの性能を犠牲にしてクロックを上げる方向に走ったCPUなので比較対象としては問題があると思います。
Pentium 4が登場した頃はクロックの差が小さかったのでPentium 3より遅いと話題になりました。
Re: (スコア:0)
>依存性の高い処理だと、同時命令実行数を増やそうが、デコーダ強化しようがクロックが上がらない限りどっかで性能が頭打ちになる。
その前提は意味が無いのでは?
スパコンの性能を比較対象として論議する以上、対象となる処理はそれなりに並列性の高い処理のはず。
今は逐次処理で実装しているものについても、可能な限り並列性を高めようとする努力はもう何年も前からはじまっています。
Re: (スコア:0)
>だいたい5−6年で3倍くらい
それが頭打ちってことでしょ。
いまCorei7でせいぜい50GFLOPS前後なのに、そのペースで10PFLOPSになるのにどれだけかかるのさ。
Re: (スコア:0)
GPUはそれをはるかに超えてるような気も
単純にベクトルプロセッサだけ多数並べれば良くない?
こんなのもあるみたいだし
http://pc.watch.impress.co.jp/docs/2006/1106/tokyou.htm [impress.co.jp]
Re: (スコア:0)
そら特定用途に絞るんでOKなら、全処理をハードウェアで組んで1クロックで
全データを処理できる何畳敷きの大きさのチップだって作れるわな。
(人の)手のひらには乗らないだろうけど。
Re: (スコア:0)
そら特定用途に絞るんでOKなら、全処理をハードウェアで組んで1クロックで
全データを処理できる何畳敷きの大きさのチップだって作れるわな。
(人の)手のひらには乗らないだろうけど。
消費電力、発熱量、製造装置いずれも何畳敷きのチップが達成可能ならね
物理的に作れるチップのサイズってのがある気がするんだけど
あとデータのロード・ストアはなしですか、そうですか
はあ〜
Re: (スコア:0)
「このペース」が続くとは思えないなあ。ムーアの法則にもかげりが見えてきたしDRAMもNANDもそろそろ微細化に限界が来ているようだし。
Re: (スコア:0)
できても国内メーカーの圧力で輸入禁止になりそう。
Re:そのうち (スコア:2, おもしろおかしい)
一昔前、中国工場からの注文で共産圏輸出の規制の為に某社の専用PCを入れた覚えが有る。
無茶苦茶古い構成でトロいクセにバカ高かった。
因みに日本製。
でだ。
その会社のフツーのPCの殆どが、中国で生産していたというアホな話。
Re: (スコア:0)
その頃になっても国内メーカーにそんな圧力が残ってたらいいねえ(遠い目
Re: (スコア:0)
そもそも国内にコンピュータメーカが残っているか…
使う人がダンチ (スコア:2)
どこかで読んだような話だと思ったら (スコア:0)
Ando先生の最近の話題(2011年5月14日) [geocities.jp](の5.)を「実際にやってみた」のか
# 本筋からそれるけど、Cypress(40nm/VLIW5)のFireStream 9370だけではなくて、Tahiti(28nm/GCN)のFirePro W9000でも試してほしかったな