NECのお高いPCIeカード型ベクトルエンジン(税別1,530,000円/枚)の店頭展示スタート 45
ストーリー by nagazou
アキバで売れるものなのか 部門より
アキバで売れるものなのか 部門より
NECのベクトル型スーパーコンピュータ「SX-Aurora TSUBASA」の中核コンポーネントである「Vector Engine」の展示を秋葉原のオリオスペックが実施しているそうだ。「Vector Engine」はコンパクトなPCIe規格カード。AKIBA PC Hotline! の記事によれば、カード1枚の演算性能は、10コアモデルが3.07TFlops、8コアモデルが2.45TFlops。メモリ帯域は1.53TB/s。2020年11月に8コアモデルのカード単体での販売が開始された。販売開始当時は1,144,000円(税別)だったそうだが、今現在は1,530,000円(税別)になってしまっているとのこと(AKIBA PC Hotline!)。
あるAnonymous Coward 曰く、
あるAnonymous Coward 曰く、
お金も無いけど、使いこなすには相応のスキルが求められそう。
幾らから使えるか? (スコア:4, 参考になる)
1ノードしかないけど、1時間600円、1日14,400円で使えると聞いた。予約が埋まってることも無さそう。
https://www.j-focus.or.jp/focus/ [j-focus.or.jp]
FOCUSはスパコン利用講習会も多数行っているが、SX-Auroraを使った講習会があるかは知らん。
エントリーがギリ間に合うプログラムコンテストで、実行環境を無償提供するとあるから、それを活用すして学ぶ手もある。(申込〆11/29)
https://www.itmedia.co.jp/news/articles/2211/10/news130.html [itmedia.co.jp]
公的機関じゃないと、初期費用が高いね。Initial 110k、Monthly88k。
https://it.impress.co.jp/articles/-/21425 [impress.co.jp]
※余談:SX-Auroraを解説してる方
https://vectory.work/sx-aurora-tsubasa/ [vectory.work]
※NEC Aurora Forum
https://sxauroratsubasa.sakura.ne.jp/NEC_Aurora_Forum [sakura.ne.jp]
※余談:新モデルも発売したそうだ。オリオの展示は前モデル。
https://xtech.nikkei.com/atcl/nxt/news/18/13879/ [nikkei.com]
Re: (スコア:0)
FMAで3TFlopsか。ふつうLinpackの性能で測るんじゃないの? 敵はGPUってことだからだろうか。
メモリ帯域1.53TB/sって全然足りなくね? もうベクトル使う問題領域でもキャッシュ効くほどキャッシュがでかいんだろうか。
Re: (スコア:0)
ベンチマークというのは競合に不利で自分にとって有利なものを使うのが基本です。 競合にとって有利で自分にとって不利なものは向こうが取ってくれます。 単品で買っても150万で買えるということは明らかに格安品ですしGPUの相手は狙ってないかもね。
Re: (スコア:0)
FMAで3TFlopsってのは、理論性能であってベンチマークではありませんが、
それはともかく、ある領域で標準的なベンチマークを使わないってことは、その領域外の商品だと思われるんですよ。
たしかに、実際にLinpackだと性能でないから出したくないってことも考えられますが……そうするとけっきょく敵はGPUでは?
Re: (スコア:0)
どういう意味で有利不利と言ってる? FMA単体で測ったほうがGPUに有利になると思うのだけど。
まさかNECはベンチマークの基本も守れてないという指摘か。
エコシステムを目指さないのか? (スコア:1)
メイドが目立つ秋葉に、かつてのジャンキーな雰囲気を戻すためにも展示とかもっと早くやれば良かったのに。
あとレノボに売却したPC部門で搭載機を積極的に売り出せばいいのに。
あとは、necのクラウドで、、、
ハードがあってもエコシステムを描けない日本企業の今が見えてくる製品。
残念。
Re:エコシステムを目指さないのか? (スコア:2)
不特定多数に製品を渡すことを極度に嫌がり、拡販を避け、血統を潰しますからね。当然、何を作っても売れずにポシャる。東西冷戦時代の輸出規制の雰囲気を未だに引きずってるのかな。
Re: (スコア:0)
「大多数の人たちがそれを望んでいないから」ってだけじゃないかな
昔を懐かしむオタクの爺さんたちは何でだ!っていうだろうけど
時代の流れってだけで
あと、そもそもこれってオリオスペックは補修パーツ売ってるだけじゃね?
Re: (スコア:0)
そりゃただの願望、妄想ですわ。
そういうのをターゲットにはしてないってことでしょう。
もうない (スコア:1)
店頭もいいけど、
ショールームに展示してほしかった
https://visit-chiyoda.tokyo/app/spot/detail/72 [visit-chiyoda.tokyo]
3機のベクターマシンの組み合わせで (スコア:0)
いろんな形態を取ることが出るのかな
Re: (スコア:0)
三つの心が ひとつになれ〜ば〜(違)
マイニング効率よいの? (スコア:0)
NVIDIA Quadro GV100 NVQGV100-32GHBM2 [PCIExp 32GB]が1,592,965円(本日時点価格コム調べ)だから、結局の所性能次第。
結局の所、マイニングやってどっちが効率いいのか?以外、市場は興味ないやろな。
コンテストのところに「C,C++,Fortran」とあるから、純粋にCで書かれたプログラムならソースをAX-Aurora用コンパイラに突っ込めんでとりあず動くのかね。
APIで提供すりゃいいものを。
Re:マイニング効率よいの? (スコア:1)
もともとダメじゃないかな
大得意先の地球シミュレーターでは、ベクターエンジンとは別にGPUのノード群を用意しているとおり、求める性能の方向がちがう。
https://www.jamstec.go.jp/es/jp/system/system.html [jamstec.go.jp]
https://srad.jp/story/21/03/10/1632233/ [srad.jp]
コンパイラは
NECは、C/C++/Fortranなどの汎用プログラミング言語で書かれたプログラムをベクトル演算用に自動的に最適化する独自のコンパイラも提供しており
だそうです
https://jpn.nec.com/press/202011/20201119_01.html [nec.com]
Re: (スコア:0)
浮動小数点演算の性能に特化してるからマイニングなんかやっても性能でないよ。
「Cで書かれたプログラム」とか書いとけば専門家気取りできると思ってる?
Re: (スコア:0)
bfloat16とか使えるんですかあと1BitのINTがコンパイラで標準対応かとかも大事らしい。
Re: (スコア:0)
当然APIはあるよ。あたりまえ。
でも、いわゆる一般的な意味での「API」のような疎結合では
スパコンで動かす科学技術計算処理の記述は面倒なので、
言語レベルで対応したものでないと使ってられない。
そういう言語コンパイラレベルで対応してるのがC/C++/Fortran、ということ。
ざっくり言えば、
for (i = 0; i < 100; i++) { a[i] = b[i] + c[i]; }
みたいなループ演算を、
ベクトルプロセッサではループではなくベクトル演算にしたり、
スカラープロセッサでは少数回数ずつ複数のプロセッサで分担したり、
といった最適化をしてくれる。
最適
Re: Re:マイニング効率よいの? (スコア:1)
CUDAが動かないだけで見込み客の7割位にそっぽ向かれる気はする。
Re: (スコア:0)
そっちは最初から見込んでないんじゃないか。
見込み客は既存顧客のリプレースだけだろう。
新規客を拡販する意思が欠片も見られない。
Re: (スコア:0)
そういう汎用的なライブラリで動けば面白いと思うんだけど
もしくは汎用的なライブラリ作って広げる努力してれば
と思ったけどそれ日本企業の苦手なことかもねw
そんなこと出来てればもっと成功してる企業多そう
Re: (スコア:0)
>演算自体は「並列演算対応のライブラリ」に任せられるような定番処理でプログラムはそれを呼び出すだけ
CUDAやらOpenCLは結局これで、似たようなものがないと売れないやろなぁと。
(理解間違ってるかな?)
「ベクトルコンピュータに合わせてソースを最適化できる人材」相手にビジネスしてても失敗するよね。
Re: (スコア:0)
CUDA書かなくてもコンパイラが自動的にオフロードしてくれるというところにメリットがあるんじゃよ
OpenMPより手軽かつ同程度の性能向上で、専用デバイスにオフロードしてくれるんじゃ
CUDAは版OpenMPたるpenACCというお手軽なものがあるが、あれ結局3割ぐらいしか性能でんのじゃ。あれでGPU化するならばCUDA命令をばりばり使ったほうがマシなレベル。
商売がヘタだなぁ (スコア:0)
高価ってことは、要はほとんど数が出てない or 出ないとあきらめちゃっているからでしょ。
できるかどうかは知らんが、「SX-Aurora TSUBASA」で仮想通貨のマイニングをやって、NEC自身が「ウン百億円掘り当てました」とか宣伝すれば、一時のnVIDIA並みに爆売れすると思うが。「いまどき仮想通貨かよ」とか言うなら、株価予想でも先物予想でも何でもいい。「ザクザク金儲けできる」っていうのがキモね。
そうなれば、少なくとも今の1/10ぐらいの価格で売れるぐらいの規模の生産ができる。
Re: (スコア:0)
売れるとすれば、エロ方面だろ。
ベクトルエンジンが必要といえば、流体計算。
となると条件反射的に、スカートのひらひらと、おっぱいの揺れと相場が決まっている。
NEC総力を挙げて、3Dフィギュアを作る
一昔前なら (スコア:0)
スペックとしては、倍精度3TFLOPS/単精度6TFLOPS/メモリ帯域1.5TBps/メモリ48GB
一昔前なら文句ないスペックなのですが、ライバルも進化してるので何とも。
Nvidiaで今買えるA100は、倍精度10TFLOPS/単精度20TFLOPS/メモリ帯域1.5TBps/メモリ80GB
先日発表されたIntelのXeonMAXは、CPUなのにメモリ帯域1TBps/メモリ64GB
ライバルはHBM搭載で飛躍的にメモリ帯域上げてるので、ベクトル型の特徴だったメモリ帯域も追いつかれてしまっている。
同じアクセラレーターとしてなら、Nvidia以外はまともなエコシステムが無いので、自力で全部何とかしないといけないし。
NvidiaならクラウドなりDGXなりスパコンなり先のスケールアップも容易だけど、SXシリーズだと企業が自由に使えるその先が無くて、稟議書く時に困りそう。
Re: (スコア:0)
メモリ帯域ってそれ自体が売りではなくボトルネックにならないよう上げていたものでは。だから問題はライバルもメモリ帯域をNEC製品と同等にしなければメモリ帯域がボトルネックになるようなスループットを実現したというふうに読み取るべきな気が。あれNECの現状はピンチ?
Re: (スコア:0)
> スペックとしては、
・先日発売の最新モデル(※)では、
コア数1.6倍最新プロセスノードにL3キャッシュ追加で性能2.5倍、メモリ帯域1.6倍・容量2倍(HBM2e)で、
概ね、倍精度5.2TFlops(*)/メモリ帯域2.4TB/s /メモリ96GB となった。
が、うーん。A100にメモリしか勝ってなくて、
今年の
・H100(PCIe)の、FP64 24TFLops、メモリ帯域2TB/s、80 GB(HBM3)
でさらに演算性能を引き離された上に、BFLOAT16/FP16/FP8/INT8とかのML系に応用が利かないのも辛すぎる。
(※) https://pc.watch.impress.co.jp/docs/news/1446099.html [impress.co.jp]
(*) = 21 PFlops / 4032
Re: (スコア:0)
安心の日本ブランド
Re: (スコア:0)
新モデル、"B401-8のダイはTSMCの16nm FinFETプロセス"。
https://monoist.itmedia.co.jp/mn/articles/2210/11/news058.html [itmedia.co.jp]
親コメのリンク先PC Watch記事の通り、新モデルのHBM2eもTSMC製造で、
実は↓のAnandTech記事冒頭のTSMCの 2x6 HBM2 スタックの写真が、
オリオ展示と同じVEカードのもの。
https://www.anandtech.com/show/16036/2023-interposers-tsmc-hints-at-20... [anandtech.com]
流石にパワーラインと基板とアセンブリは日本なんですかね?
台湾事変が気が気で
Re: (スコア:0)
まずTSMCはHBM製造してません。というか専用DRAM全般を製造してないです。
次にHBM2からはECCはDRAM内に内蔵できるようになっています。
AMDやNvidiaのHBM搭載GPUでも、HBM2版はECC内蔵しています。
ただし、ECC有効にするとスループット下がるそうで、有効無効をユーザが切り替えられるようになってます。
ちなみにサーバ機向けの低圧+高速な電源は日本弱いので海外製ではないでしょうか。
基板自体は日本の可能性は高いと思う。
Re: (スコア:0)
TSMCは積層パッケージングを提供してるんであって、HBMは作ってないんじゃないか?
https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/... [cadence.com]
2013年くらいの論文とかにTSMC DRAMみたいな表示を見かけるけども、今作ってないとおもよ。
Re: (スコア:0)
Nvidia A100検索したら183万円じゃん。
2020年発売時点で考えたら悪くないじゃない?
ベクトル型はある程度普通に書けるみたいだし。
153万円で買うのは確かに微妙だと思う。
そもそもほんとに必要な人(法人)は秋葉原の店頭で即買いはしないわな。
ところで誰かが比較上げてくれるかなと待ってたので助かる。
欲しい (スコア:0)
>お金も無いけど、使いこなすには相応のスキルが求められそう。
単純にベクトル長の長い演算をゴリゴリこなすのなら、スキル無しにコンパイラが最適化の面倒を見てくれる
スカラー機やGPUなんて使ってられるか!という分野の仕事の方には最適のマシン
#ベクトルエンジン向けに最適化したBLASがあって使えるなら本当に欲しい
Re: (スコア:0)
単純にベクトル長の長い演算をゴリゴリこなすだけなら、CUDA使って既存のライブラリに投げるだけでいいんじゃないの?
既に最適化されたcuBLASがあるし、もっとお手軽にPythonからこれらを呼ぶライブラリ群も充実してるし。
Re: (スコア:0)
CUDAで書いてコンパイルするかCかC++でコンパイルするかの違い。あとはハードウェアの特性の違い。つまりベクタータイプのプロセッサに慣れてる人向け。コボルとメインフレームみたいなもんですな。
Re: (スコア:0)
こんな未来の無いものに投資する奴はただのおバカ。
3年後や5年度、NVIDIA他がどれだけ性能上がっているか、そしてNECとやらはこの先ライバルに引き離されないようについてこれるものを、同じコストパフォーマンスで作って売る商売が続けられているのか。
ちょっと考えればこんなもの買ってはならないとわかる。
Re: (スコア:0)
そこまで先を見通すなら、国防的観点も足してほしいな
米ソ中が手を組む未来は、あるぞ
ガキのおもちゃではない (スコア:0)
スラド民には無用の長物です。
Re: (スコア:0)
スラド民はさすがにこれでゲーム作ればいいんじゃね?とは言わない。
Re: (スコア:0)
スラド民に老人は多くてもガキは少ない。
ET+2022で (スコア:0)
この前パシフィコ横浜であったET+2022で現物がマシンに刺さって動作しているものが展示してあったぞ
その時価格については尋ねなかったが面白そうだった
あまり高いとは思えない (スコア:0)
昔々64MBのメモリボードが400万円とか見ていたのが原因に違いない。
Re: (スコア:0)
98用ならPC-H98シリーズ用の860ボード (PC-H98-B06) が980,000円 (税別)。
それより高いからお高いでいいんじゃない。