パスワードを忘れた? アカウント作成
16161942 story
ハードウェアハック

NECのお高いPCIeカード型ベクトルエンジン(税別1,530,000円/枚)の店頭展示スタート 45

ストーリー by nagazou
アキバで売れるものなのか 部門より
NECのベクトル型スーパーコンピュータ「SX-Aurora TSUBASA」の中核コンポーネントである「Vector Engine」の展示を秋葉原のオリオスペックが実施しているそうだ。「Vector Engine」はコンパクトなPCIe規格カード。AKIBA PC Hotline! の記事によれば、カード1枚の演算性能は、10コアモデルが3.07TFlops、8コアモデルが2.45TFlops。メモリ帯域は1.53TB/s。2020年11月に8コアモデルのカード単体での販売が開始された。販売開始当時は1,144,000円(税別)だったそうだが、今現在は1,530,000円(税別)になってしまっているとのこと(AKIBA PC Hotline!)。

あるAnonymous Coward 曰く、

お金も無いけど、使いこなすには相応のスキルが求められそう。

  • by Anonymous Coward on 2022年11月23日 7時10分 (#4364236)

    1ノードしかないけど、1時間600円、1日14,400円で使えると聞いた。予約が埋まってることも無さそう。
    https://www.j-focus.or.jp/focus/ [j-focus.or.jp]
    FOCUSはスパコン利用講習会も多数行っているが、SX-Auroraを使った講習会があるかは知らん。

    エントリーがギリ間に合うプログラムコンテストで、実行環境を無償提供するとあるから、それを活用すして学ぶ手もある。(申込〆11/29)
    https://www.itmedia.co.jp/news/articles/2211/10/news130.html [itmedia.co.jp]

    公的機関じゃないと、初期費用が高いね。Initial 110k、Monthly88k。
    https://it.impress.co.jp/articles/-/21425 [impress.co.jp]

    ※余談:SX-Auroraを解説してる方
    https://vectory.work/sx-aurora-tsubasa/ [vectory.work]
    ※NEC Aurora Forum
    https://sxauroratsubasa.sakura.ne.jp/NEC_Aurora_Forum [sakura.ne.jp]

    ※余談:新モデルも発売したそうだ。オリオの展示は前モデル。
    https://xtech.nikkei.com/atcl/nxt/news/18/13879/ [nikkei.com]

    ここに返信
    • by Anonymous Coward

      FMAで3TFlopsか。ふつうLinpackの性能で測るんじゃないの? 敵はGPUってことだからだろうか。
      メモリ帯域1.53TB/sって全然足りなくね? もうベクトル使う問題領域でもキャッシュ効くほどキャッシュがでかいんだろうか。

      • by Anonymous Coward

        ベンチマークというのは競合に不利で自分にとって有利なものを使うのが基本です。 競合にとって有利で自分にとって不利なものは向こうが取ってくれます。 単品で買っても150万で買えるということは明らかに格安品ですしGPUの相手は狙ってないかもね。

        • by Anonymous Coward

          FMAで3TFlopsってのは、理論性能であってベンチマークではありませんが、
          それはともかく、ある領域で標準的なベンチマークを使わないってことは、その領域外の商品だと思われるんですよ。
          たしかに、実際にLinpackだと性能でないから出したくないってことも考えられますが……そうするとけっきょく敵はGPUでは?

        • by Anonymous Coward

          どういう意味で有利不利と言ってる? FMA単体で測ったほうがGPUに有利になると思うのだけど。
          まさかNECはベンチマークの基本も守れてないという指摘か。

  • by Anonymous Coward on 2022年11月23日 9時12分 (#4364253)

    メイドが目立つ秋葉に、かつてのジャンキーな雰囲気を戻すためにも展示とかもっと早くやれば良かったのに。
    あとレノボに売却したPC部門で搭載機を積極的に売り出せばいいのに。

    あとは、necのクラウドで、、、

    ハードがあってもエコシステムを描けない日本企業の今が見えてくる製品。
    残念。

    ここに返信
    • 不特定多数に製品を渡すことを極度に嫌がり、拡販を避け、血統を潰しますからね。当然、何を作っても売れずにポシャる。東西冷戦時代の輸出規制の雰囲気を未だに引きずってるのかな。

    • by Anonymous Coward

      「大多数の人たちがそれを望んでいないから」ってだけじゃないかな

      昔を懐かしむオタクの爺さんたちは何でだ!っていうだろうけど
      時代の流れってだけで

      あと、そもそもこれってオリオスペックは補修パーツ売ってるだけじゃね?

    • by Anonymous Coward

      そりゃただの願望、妄想ですわ。
      そういうのをターゲットにはしてないってことでしょう。

  • by st1100 (45287) on 2022年11月23日 20時55分 (#4364557)

    店頭もいいけど、
    ショールームに展示してほしかった

    https://visit-chiyoda.tokyo/app/spot/detail/72 [visit-chiyoda.tokyo]

    ここに返信
  • by Anonymous Coward on 2022年11月23日 7時36分 (#4364238)

    いろんな形態を取ることが出るのかな

    ここに返信
    • by Anonymous Coward

      三つの心が ひとつになれ〜ば〜(違)

  • by Anonymous Coward on 2022年11月23日 10時39分 (#4364274)

    NVIDIA Quadro GV100 NVQGV100-32GHBM2 [PCIExp 32GB]が1,592,965円(本日時点価格コム調べ)だから、結局の所性能次第。

    結局の所、マイニングやってどっちが効率いいのか?以外、市場は興味ないやろな。

    コンテストのところに「C,C++,Fortran」とあるから、純粋にCで書かれたプログラムならソースをAX-Aurora用コンパイラに突っ込めんでとりあず動くのかね。

    APIで提供すりゃいいものを。

    ここに返信
    • もともとダメじゃないかな

      大得意先の地球シミュレーターでは、ベクターエンジンとは別にGPUのノード群を用意しているとおり、求める性能の方向がちがう。
      https://www.jamstec.go.jp/es/jp/system/system.html [jamstec.go.jp]
      https://srad.jp/story/21/03/10/1632233/ [srad.jp]

      コンパイラは

      NECは、C/C++/Fortranなどの汎用プログラミング言語で書かれたプログラムをベクトル演算用に自動的に最適化する独自のコンパイラも提供しており

      だそうです
      https://jpn.nec.com/press/202011/20201119_01.html [nec.com]

    • by Anonymous Coward

      浮動小数点演算の性能に特化してるからマイニングなんかやっても性能でないよ。
      「Cで書かれたプログラム」とか書いとけば専門家気取りできると思ってる?

      • by Anonymous Coward

         bfloat16とか使えるんですかあと1BitのINTがコンパイラで標準対応かとかも大事らしい。

    • by Anonymous Coward

      当然APIはあるよ。あたりまえ。
      でも、いわゆる一般的な意味での「API」のような疎結合では
      スパコンで動かす科学技術計算処理の記述は面倒なので、
      言語レベルで対応したものでないと使ってられない。

      そういう言語コンパイラレベルで対応してるのがC/C++/Fortran、ということ。
      ざっくり言えば、
      for (i = 0; i < 100; i++) { a[i] = b[i] + c[i]; }
      みたいなループ演算を、
      ベクトルプロセッサではループではなくベクトル演算にしたり、
      スカラープロセッサでは少数回数ずつ複数のプロセッサで分担したり、
      といった最適化をしてくれる。

      最適

      • by Anonymous Coward on 2022年11月23日 12時13分 (#4364334)

        CUDAが動かないだけで見込み客の7割位にそっぽ向かれる気はする。

        • by Anonymous Coward

          そっちは最初から見込んでないんじゃないか。
          見込み客は既存顧客のリプレースだけだろう。
          新規客を拡販する意思が欠片も見られない。

        • by Anonymous Coward

          そういう汎用的なライブラリで動けば面白いと思うんだけど
          もしくは汎用的なライブラリ作って広げる努力してれば
          と思ったけどそれ日本企業の苦手なことかもねw
          そんなこと出来てればもっと成功してる企業多そう

      • by Anonymous Coward

        >演算自体は「並列演算対応のライブラリ」に任せられるような定番処理でプログラムはそれを呼び出すだけ
        CUDAやらOpenCLは結局これで、似たようなものがないと売れないやろなぁと。
        (理解間違ってるかな?)

        「ベクトルコンピュータに合わせてソースを最適化できる人材」相手にビジネスしてても失敗するよね。

        • by Anonymous Coward

          CUDA書かなくてもコンパイラが自動的にオフロードしてくれるというところにメリットがあるんじゃよ
          OpenMPより手軽かつ同程度の性能向上で、専用デバイスにオフロードしてくれるんじゃ

          CUDAは版OpenMPたるpenACCというお手軽なものがあるが、あれ結局3割ぐらいしか性能でんのじゃ。あれでGPU化するならばCUDA命令をばりばり使ったほうがマシなレベル。

  • by Anonymous Coward on 2022年11月23日 10時40分 (#4364275)

    高価ってことは、要はほとんど数が出てない or 出ないとあきらめちゃっているからでしょ。

    できるかどうかは知らんが、「SX-Aurora TSUBASA」で仮想通貨のマイニングをやって、NEC自身が「ウン百億円掘り当てました」とか宣伝すれば、一時のnVIDIA並みに爆売れすると思うが。「いまどき仮想通貨かよ」とか言うなら、株価予想でも先物予想でも何でもいい。「ザクザク金儲けできる」っていうのがキモね。

    そうなれば、少なくとも今の1/10ぐらいの価格で売れるぐらいの規模の生産ができる。

    ここに返信
    • by Anonymous Coward

      売れるとすれば、エロ方面だろ。
      ベクトルエンジンが必要といえば、流体計算。
      となると条件反射的に、スカートのひらひらと、おっぱいの揺れと相場が決まっている。
      NEC総力を挙げて、3Dフィギュアを作る

  • by Anonymous Coward on 2022年11月23日 11時20分 (#4364299)

    スペックとしては、倍精度3TFLOPS/単精度6TFLOPS/メモリ帯域1.5TBps/メモリ48GB
    一昔前なら文句ないスペックなのですが、ライバルも進化してるので何とも。

    Nvidiaで今買えるA100は、倍精度10TFLOPS/単精度20TFLOPS/メモリ帯域1.5TBps/メモリ80GB
    先日発表されたIntelのXeonMAXは、CPUなのにメモリ帯域1TBps/メモリ64GB

    ライバルはHBM搭載で飛躍的にメモリ帯域上げてるので、ベクトル型の特徴だったメモリ帯域も追いつかれてしまっている。
    同じアクセラレーターとしてなら、Nvidia以外はまともなエコシステムが無いので、自力で全部何とかしないといけないし。
    NvidiaならクラウドなりDGXなりスパコンなり先のスケールアップも容易だけど、SXシリーズだと企業が自由に使えるその先が無くて、稟議書く時に困りそう。

    ここに返信
    • by Anonymous Coward

      メモリ帯域ってそれ自体が売りではなくボトルネックにならないよう上げていたものでは。だから問題はライバルもメモリ帯域をNEC製品と同等にしなければメモリ帯域がボトルネックになるようなスループットを実現したというふうに読み取るべきな気が。あれNECの現状はピンチ?

    • by Anonymous Coward

      > スペックとしては、 
      ・先日発売の最新モデル(※)では、
       コア数1.6倍最新プロセスノードにL3キャッシュ追加で性能2.5倍、メモリ帯域1.6倍・容量2倍(HBM2e)で、
       概ね、倍精度5.2TFlops(*)/メモリ帯域2.4TB/s /メモリ96GB となった。
      が、うーん。A100にメモリしか勝ってなくて、
      今年の
      ・H100(PCIe)の、FP64 24TFLops、メモリ帯域2TB/s、80 GB(HBM3)
      でさらに演算性能を引き離された上に、BFLOAT16/FP16/FP8/INT8とかのML系に応用が利かないのも辛すぎる。
      (※) https://pc.watch.impress.co.jp/docs/news/1446099.html [impress.co.jp]
      (*) = 21 PFlops / 4032

      • by Anonymous Coward

        安心の日本ブランド

        • by Anonymous Coward

          新モデル、"B401-8のダイはTSMCの16nm FinFETプロセス"。
          https://monoist.itmedia.co.jp/mn/articles/2210/11/news058.html [itmedia.co.jp]
          親コメのリンク先PC Watch記事の通り、新モデルのHBM2eもTSMC製造で、
          実は↓のAnandTech記事冒頭のTSMCの 2x6 HBM2 スタックの写真が、
          オリオ展示と同じVEカードのもの。
          https://www.anandtech.com/show/16036/2023-interposers-tsmc-hints-at-20... [anandtech.com]

          流石にパワーラインと基板とアセンブリは日本なんですかね?
          台湾事変が気が気で

          • by Anonymous Coward

            まずTSMCはHBM製造してません。というか専用DRAM全般を製造してないです。
            次にHBM2からはECCはDRAM内に内蔵できるようになっています。
            AMDやNvidiaのHBM搭載GPUでも、HBM2版はECC内蔵しています。
            ただし、ECC有効にするとスループット下がるそうで、有効無効をユーザが切り替えられるようになってます。

            ちなみにサーバ機向けの低圧+高速な電源は日本弱いので海外製ではないでしょうか。
            基板自体は日本の可能性は高いと思う。

          • by Anonymous Coward

            TSMCは積層パッケージングを提供してるんであって、HBMは作ってないんじゃないか?
            https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/... [cadence.com]
            2013年くらいの論文とかにTSMC DRAMみたいな表示を見かけるけども、今作ってないとおもよ。

    • by Anonymous Coward

      Nvidia A100検索したら183万円じゃん。
      2020年発売時点で考えたら悪くないじゃない?
      ベクトル型はある程度普通に書けるみたいだし。

      153万円で買うのは確かに微妙だと思う。
      そもそもほんとに必要な人(法人)は秋葉原の店頭で即買いはしないわな。

      ところで誰かが比較上げてくれるかなと待ってたので助かる。

  • by Anonymous Coward on 2022年11月23日 11時25分 (#4364304)

    >お金も無いけど、使いこなすには相応のスキルが求められそう。

    単純にベクトル長の長い演算をゴリゴリこなすのなら、スキル無しにコンパイラが最適化の面倒を見てくれる
    スカラー機やGPUなんて使ってられるか!という分野の仕事の方には最適のマシン
    #ベクトルエンジン向けに最適化したBLASがあって使えるなら本当に欲しい

    ここに返信
    • by Anonymous Coward

      単純にベクトル長の長い演算をゴリゴリこなすだけなら、CUDA使って既存のライブラリに投げるだけでいいんじゃないの?
      既に最適化されたcuBLASがあるし、もっとお手軽にPythonからこれらを呼ぶライブラリ群も充実してるし。

      • by Anonymous Coward

        CUDAで書いてコンパイルするかCかC++でコンパイルするかの違い。あとはハードウェアの特性の違い。つまりベクタータイプのプロセッサに慣れてる人向け。コボルとメインフレームみたいなもんですな。

    • by Anonymous Coward

      こんな未来の無いものに投資する奴はただのおバカ。
      3年後や5年度、NVIDIA他がどれだけ性能上がっているか、そしてNECとやらはこの先ライバルに引き離されないようについてこれるものを、同じコストパフォーマンスで作って売る商売が続けられているのか。
      ちょっと考えればこんなもの買ってはならないとわかる。

      • by Anonymous Coward

        そこまで先を見通すなら、国防的観点も足してほしいな
        米ソ中が手を組む未来は、あるぞ

  • by Anonymous Coward on 2022年11月23日 18時51分 (#4364498)

    スラド民には無用の長物です。

    ここに返信
    • by Anonymous Coward

      スラド民はさすがにこれでゲーム作ればいいんじゃね?とは言わない。

    • by Anonymous Coward

      スラド民に老人は多くてもガキは少ない。

  • by Anonymous Coward on 2022年11月23日 20時35分 (#4364546)

    この前パシフィコ横浜であったET+2022で現物がマシンに刺さって動作しているものが展示してあったぞ

    その時価格については尋ねなかったが面白そうだった

    ここに返信
  • by Anonymous Coward on 2022年11月24日 8時35分 (#4364661)

    昔々64MBのメモリボードが400万円とか見ていたのが原因に違いない。

    ここに返信
    • by Anonymous Coward

      98用ならPC-H98シリーズ用の860ボード (PC-H98-B06) が980,000円 (税別)。
      それより高いからお高いでいいんじゃない。

typodupeerror

ナニゲにアレゲなのは、ナニゲなアレゲ -- アレゲ研究家

読み込み中...