アカウント名:
パスワード:
Intelもlarrabeeは途中で開発やめたし、そのレベルのメニーコアが主流になってないのは理由があるんだよね??
そんなにスレッドを分割できないというソフト側の事情と多数のコアを制御するのが大変で結局効率が上がらない
ということだったんだっけか? よほど筋が悪くない限りIntelはそれを力技で押進めるんだけど…それでも辞めたってのは相当アレだったんだなって思うよ
# それもとそういうCPUって他の用途では生き残ってるの?
密結合分散処理の問題点に、プロセッサ間の通信コストの増大があったと思う。伝送路が単純なバスだと、そこがボトルネックとなるという様な。
大昔、筑波大でPACSとかをやっていた際、通信は隣り合ったプロセッサ間だけでやって、この問題を回避してたと思った。
負荷もだけど「光速度では遅い」んですよね。。
メモリ帯域がボトルネック
ララビーはXeon Phiと名前を変えて、まだやってたような。
HPCでは、メニーコアはGPGPUと並んで最近のトレンドです。メニーコアはGPUと違って、既存のコードがそのまま動くのがメリットですが、SIMD命令(Xeon Phiの場合はAVX-512)のSIMD幅を使い切らないとピーク性能は出ないので、普通のアプリケーションだと使う意味はないです。
ググって見ました。GPUコンピューティング対抗なんすね位置的には…
NVIDIAがその分野でほぼ独占してたと思ってたけど…
# 新製品出たようだけどどうなんだろ… _(:3 」∠)_
今のxeon phiは、PCIE経由ではなくなって、FLOPSとメモリ帯域がGPU並の割と普通なメニーコアCPUなので、CUDAの優位性はなくなった。深層学習用途ならxeon phi版のpythonが用意されているので、普通に書けばGPU並の並列度で処理してくれる。
テスラはテスラでnV Linkがあるからなー。あるだけでいまいち流行ってないが。
リアルタイム画像プロセッシングや自動運転、機械学習などを目的として開発されたって書いてるから、今後そういった分野で、メニーコアが必要とされる、もしくは必要になると考えたから開発したんじゃない?半導体開発企業に、そういうプロセッサは無いのかとか、作れないかとか問い合わせも来ててもおかしくないしね。
詰め込むだけならどうとでもできるんでしょうけど、一個あたりの小ささと性能の兼ね合い、効率よく協調動作させる、そんだけの並列駆動を活かす活用法を見出すとかが重点研究分野なんでしょう。
でしょうね…ググった先ではGPGPUもXeon Phiも最適化によって大きく性能が変わるがその最適化に労力が掛かるんで、もにょってるよって話も出てましたね。
# Phiって後出しなのに使い物にならんってはっきり言えばいいのにと思う
また半可通がいいかげんなことを言う…
http://news.mynavi.jp/news/2015/07/14/540/ [mynavi.jp]> TOP500に掲載されたシステムの性能を合計すると、361PFlopsとなり(前回は309PFlops)、1PFlops超のシステムも68システム(前回は50システム)へと増加した。また、何らかのアクセラレータ/コプロセッサを搭載したシステムは88システム(前回は75システム)となり、その内の52システムがNVIDIA、4システムがATI Radeon(AMD)、そして33システムがIntel MICアーキテクチャ(Xeon Phi)となっている。
Tianhe-2もXeon Phiだよ
http://news.mynavi.jp/articles/2014/12/16/gpu_mic/ [mynavi.jp](GPUとXeon Phi、どちらが計算処理アクセラレータに最適か? - 実際の実行性能を比較するワークショップを首都大学東京が開催)
すまんね、読んだ記事が古かったようだね…
># Phiって後出しなのに使い物にならんってはっきり言えばいいのにと思うパフォーマンスが出せないだけで、ナンチャッテでも動くってのは悪い事では無いと思う。まぁ宣伝効果としては弱いけど、とりあえず動かして置いて、結果が出せそうなら後で詰めるって手は使える。
CUDAのコンパイラは最適化を一切してくれないが、Intelコンパイラはある程度最適化をしてくれるコンパイラの最適化が良くなればXeon Phiのほうが有利になるだろう...
あなたの言う最適化とは何?CUDA C++コンパイラはC++言語から中間コードへの変換を行うものだが、ここで最適化は行われている。中間コードからGPUネイティブコードへの変換はグラフィックドライバの処理になる。
GPUの方が性能でちゃうとかなんじゃね?中途半端に複雑なコアを大量に必要とする研究やソフトがそうなかったのかも
Core i7はいつまでたっても4コア8スレから、進化しないねタスクマネージャーを見ても、めったに8スレどころか、4スレも使ってないから、今の状態じゃエンコードや機械学習ぐらいしか4スレ以上使い道なさそうだねWindows自身がその場で機械学習するような必要が出てくれば、必要になるかもね
10こあ20すれっどのくろいやつかえば
Core i7には8コアあるけど#Skylakeには無いけど、2011v3のもCore i7だよ
6コアのSandy Bridge-E使ってるけど、起動直後に12スレッド動いてるよ、駆除ソフトのスキャンや更新とかでw
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
海軍に入るくらいなら海賊になった方がいい -- Steven Paul Jobs
ららびーのゆめ (スコア:1)
Intelもlarrabeeは途中で開発やめたし、そのレベルのメニーコアが主流に
なってないのは理由があるんだよね??
そんなにスレッドを分割できないというソフト側の事情と
多数のコアを制御するのが大変で結局効率が上がらない
ということだったんだっけか? よほど筋が悪くない限りIntelはそれを
力技で押進めるんだけど…それでも辞めたってのは相当アレだったんだなって思うよ
# それもとそういうCPUって他の用途では生き残ってるの?
Re:ららびーのゆめ (スコア:3, 興味深い)
密結合分散処理の問題点に、プロセッサ間の通信コストの増大があったと思う。伝送路が単純なバスだと、そこがボトルネックとなるという様な。
大昔、筑波大でPACSとかをやっていた際、通信は隣り合ったプロセッサ間だけでやって、この問題を回避してたと思った。
Re:ららびーのゆめ (スコア:1)
負荷もだけど「光速度では遅い」んですよね。。
Re:ららびーのゆめ (スコア:2, すばらしい洞察)
メモリ帯域がボトルネック
Re:ららびーのゆめ (スコア:1)
ララビーはXeon Phiと名前を変えて、まだやってたような。
Re:ららびーのゆめ (スコア:2, 興味深い)
HPCでは、メニーコアはGPGPUと並んで最近のトレンドです。
メニーコアはGPUと違って、既存のコードがそのまま動くのがメリットですが、
SIMD命令(Xeon Phiの場合はAVX-512)のSIMD幅を使い切らないとピーク性能は出ないので、普通のアプリケーションだと使う意味はないです。
Re:ららびーのゆめ (スコア:1)
ググって見ました。GPUコンピューティング対抗なんすね位置的には…
NVIDIAがその分野でほぼ独占してたと思ってたけど…
# 新製品出たようだけどどうなんだろ… _(:3 」∠)_
Re: (スコア:0)
今のxeon phiは、PCIE経由ではなくなって、
FLOPSとメモリ帯域がGPU並の割と普通なメニーコアCPUなので、CUDAの優位性はなくなった。
深層学習用途ならxeon phi版のpythonが用意されているので、普通に書けばGPU並の並列度で処理してくれる。
Re: (スコア:0)
テスラはテスラでnV Linkがあるからなー。あるだけでいまいち流行ってないが。
Re:ららびーのゆめ (スコア:1)
リアルタイム画像プロセッシングや自動運転、機械学習などを目的として開発されたって書いてるから、
今後そういった分野で、メニーコアが必要とされる、もしくは必要になると考えたから開発したんじゃない?
半導体開発企業に、そういうプロセッサは無いのかとか、作れないかとか問い合わせも来ててもおかしくないしね。
Re:ららびーのゆめ (スコア:1)
詰め込むだけならどうとでもできるんでしょうけど、一個あたりの小ささと性能の兼ね合い、効率よく協調動作させる、そんだけの並列駆動を活かす活用法を見出すとかが重点研究分野なんでしょう。
Re:ららびーのゆめ (スコア:1)
でしょうね…ググった先ではGPGPUもXeon Phiも最適化によって大きく性能が変わるが
その最適化に労力が掛かるんで、もにょってるよって話も出てましたね。
# Phiって後出しなのに使い物にならんってはっきり言えばいいのにと思う
Re:ららびーのゆめ (スコア:2, 参考になる)
また半可通がいいかげんなことを言う…
http://news.mynavi.jp/news/2015/07/14/540/ [mynavi.jp]
> TOP500に掲載されたシステムの性能を合計すると、361PFlopsとなり(前回は309PFlops)、1PFlops超のシステムも68システム(前回は50システム)へと増加した。また、何らかのアクセラレータ/コプロセッサを搭載したシステムは88システム(前回は75システム)となり、その内の52システムがNVIDIA、4システムがATI Radeon(AMD)、そして33システムがIntel MICアーキテクチャ(Xeon Phi)となっている。
Tianhe-2もXeon Phiだよ
Re:ららびーのゆめ (スコア:1)
http://news.mynavi.jp/articles/2014/12/16/gpu_mic/ [mynavi.jp]
(GPUとXeon Phi、どちらが計算処理アクセラレータに最適か? - 実際の実行性能を比較するワークショップを首都大学東京が開催)
すまんね、読んだ記事が古かったようだね…
Re: (スコア:0)
># Phiって後出しなのに使い物にならんってはっきり言えばいいのにと思う
パフォーマンスが出せないだけで、ナンチャッテでも動くってのは悪い事では無いと思う。
まぁ宣伝効果としては弱いけど、とりあえず動かして置いて、結果が出せそうなら後で詰めるって手は使える。
Re: (スコア:0)
CUDAのコンパイラは最適化を一切してくれないが、Intelコンパイラはある程度最適化をしてくれる
コンパイラの最適化が良くなればXeon Phiのほうが有利になるだろう...
Re: (スコア:0)
あなたの言う最適化とは何?
CUDA C++コンパイラはC++言語から中間コードへの変換を行うものだが、ここで最適化は行われている。
中間コードからGPUネイティブコードへの変換はグラフィックドライバの処理になる。
Re: (スコア:0)
GPUの方が性能でちゃうとかなんじゃね?
中途半端に複雑なコアを大量に必要とする研究やソフトがそうなかったのかも
Re: (スコア:0)
Core i7はいつまでたっても4コア8スレから、進化しないね
タスクマネージャーを見ても、めったに8スレどころか、4スレも使ってないから、今の状態じゃエンコードや機械学習ぐらいしか4スレ以上使い道なさそうだね
Windows自身がその場で機械学習するような必要が出てくれば、必要になるかもね
Re: (スコア:0)
10こあ20すれっどのくろいやつかえば
Re: (スコア:0)
Core i7には8コアあるけど
#Skylakeには無いけど、2011v3のもCore i7だよ
6コアのSandy Bridge-E使ってるけど、起動直後に12スレッド動いてるよ、駆除ソフトのスキャンや更新とかでw