アカウント名:
パスワード:
スペックとしては、倍精度3TFLOPS/単精度6TFLOPS/メモリ帯域1.5TBps/メモリ48GB一昔前なら文句ないスペックなのですが、ライバルも進化してるので何とも。
Nvidiaで今買えるA100は、倍精度10TFLOPS/単精度20TFLOPS/メモリ帯域1.5TBps/メモリ80GB先日発表されたIntelのXeonMAXは、CPUなのにメモリ帯域1TBps/メモリ64GB
ライバルはHBM搭載で飛躍的にメモリ帯域上げてるので、ベクトル型の特徴だったメモリ帯域も追いつかれてしまっている。同じアクセラレーターとしてなら、Nvidia以外はまともなエコシステムが無いので、自力で全部何とかしないといけないし。NvidiaならクラウドなりDGXなりスパコンなり先のスケールアップも容易だけど、SXシリーズだと企業が自由に使えるその先が無くて、稟議書く時に困りそう。
> スペックとしては、 ・先日発売の最新モデル(※)では、 コア数1.6倍最新プロセスノードにL3キャッシュ追加で性能2.5倍、メモリ帯域1.6倍・容量2倍(HBM2e)で、 概ね、倍精度5.2TFlops(*)/メモリ帯域2.4TB/s /メモリ96GB となった。が、うーん。A100にメモリしか勝ってなくて、今年の・H100(PCIe)の、FP64 24TFLops、メモリ帯域2TB/s、80 GB(HBM3)でさらに演算性能を引き離された上に、BFLOAT16/FP16/FP8/INT8とかのML系に応用が利かないのも辛すぎる。(※) https://pc.watch.impress.co.jp/docs/news/1446099.html [impress.co.jp](*) = 21 PFlops / 4032
安心の日本ブランド
新モデル、"B401-8のダイはTSMCの16nm FinFETプロセス"。 https://monoist.itmedia.co.jp/mn/articles/2210/11/news058.html [itmedia.co.jp] 親コメのリンク先PC Watch記事の通り、新モデルのHBM2eもTSMC製造で、実は↓のAnandTech記事冒頭のTSMCの 2x6 HBM2 スタックの写真が、オリオ展示と同じVEカードのもの。 https://www.anandtech.com/show/16036/2023-interposers-tsmc-hints-at-20... [anandtech.com]
流石にパワーラインと基板とアセンブリは日本なんですかね?台湾事変が気が気で
まずTSMCはHBM製造してません。というか専用DRAM全般を製造してないです。次にHBM2からはECCはDRAM内に内蔵できるようになっています。AMDやNvidiaのHBM搭載GPUでも、HBM2版はECC内蔵しています。ただし、ECC有効にするとスループット下がるそうで、有効無効をユーザが切り替えられるようになってます。
ちなみにサーバ機向けの低圧+高速な電源は日本弱いので海外製ではないでしょうか。基板自体は日本の可能性は高いと思う。
TSMCは積層パッケージングを提供してるんであって、HBMは作ってないんじゃないか?https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/... [cadence.com]2013年くらいの論文とかにTSMC DRAMみたいな表示を見かけるけども、今作ってないとおもよ。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
計算機科学者とは、壊れていないものを修理する人々のことである
一昔前なら (スコア:0)
スペックとしては、倍精度3TFLOPS/単精度6TFLOPS/メモリ帯域1.5TBps/メモリ48GB
一昔前なら文句ないスペックなのですが、ライバルも進化してるので何とも。
Nvidiaで今買えるA100は、倍精度10TFLOPS/単精度20TFLOPS/メモリ帯域1.5TBps/メモリ80GB
先日発表されたIntelのXeonMAXは、CPUなのにメモリ帯域1TBps/メモリ64GB
ライバルはHBM搭載で飛躍的にメモリ帯域上げてるので、ベクトル型の特徴だったメモリ帯域も追いつかれてしまっている。
同じアクセラレーターとしてなら、Nvidia以外はまともなエコシステムが無いので、自力で全部何とかしないといけないし。
NvidiaならクラウドなりDGXなりスパコンなり先のスケールアップも容易だけど、SXシリーズだと企業が自由に使えるその先が無くて、稟議書く時に困りそう。
Re: (スコア:0)
> スペックとしては、
・先日発売の最新モデル(※)では、
コア数1.6倍最新プロセスノードにL3キャッシュ追加で性能2.5倍、メモリ帯域1.6倍・容量2倍(HBM2e)で、
概ね、倍精度5.2TFlops(*)/メモリ帯域2.4TB/s /メモリ96GB となった。
が、うーん。A100にメモリしか勝ってなくて、
今年の
・H100(PCIe)の、FP64 24TFLops、メモリ帯域2TB/s、80 GB(HBM3)
でさらに演算性能を引き離された上に、BFLOAT16/FP16/FP8/INT8とかのML系に応用が利かないのも辛すぎる。
(※) https://pc.watch.impress.co.jp/docs/news/1446099.html [impress.co.jp]
(*) = 21 PFlops / 4032
Re:一昔前なら (スコア:0)
安心の日本ブランド
Re: (スコア:0)
新モデル、"B401-8のダイはTSMCの16nm FinFETプロセス"。
https://monoist.itmedia.co.jp/mn/articles/2210/11/news058.html [itmedia.co.jp]
親コメのリンク先PC Watch記事の通り、新モデルのHBM2eもTSMC製造で、
実は↓のAnandTech記事冒頭のTSMCの 2x6 HBM2 スタックの写真が、
オリオ展示と同じVEカードのもの。
https://www.anandtech.com/show/16036/2023-interposers-tsmc-hints-at-20... [anandtech.com]
流石にパワーラインと基板とアセンブリは日本なんですかね?
台湾事変が気が気で
Re: (スコア:0)
まずTSMCはHBM製造してません。というか専用DRAM全般を製造してないです。
次にHBM2からはECCはDRAM内に内蔵できるようになっています。
AMDやNvidiaのHBM搭載GPUでも、HBM2版はECC内蔵しています。
ただし、ECC有効にするとスループット下がるそうで、有効無効をユーザが切り替えられるようになってます。
ちなみにサーバ機向けの低圧+高速な電源は日本弱いので海外製ではないでしょうか。
基板自体は日本の可能性は高いと思う。
Re: (スコア:0)
TSMCは積層パッケージングを提供してるんであって、HBMは作ってないんじゃないか?
https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/... [cadence.com]
2013年くらいの論文とかにTSMC DRAMみたいな表示を見かけるけども、今作ってないとおもよ。