アカウント名:
パスワード:
4gmaer のレビューでは、> L2キャッシュを超える「4MB Range」以降で,Ryzen 7 1800Xの遅延状況が際立って悪化していることだ。> FX-9590より遅いというのは異常であり,正直,「キャッシュアクセスやメモリアクセス周りの最適化が十分でない」可能性が> 極めて高いのではないかと危惧しているが
で終わってしまっていますが、PC Watch のレビューでは補足があり> AMDによるとSandraやAIDA64などのベンチマークソフトでは、ZENマイクロアーキテクチャのキャッシュ帯域を適切に> 測定できないとしており、独自に測定した結果が案内された。
ということで(どうい
ということで(どういう理屈かわかりませんが)正しく計測すれば L2、L3 キャッシュともに Ryzen の方が早いと主張しています。
intelとAMDではCPUのキャッシュの実装が大きく異なっている。Zenはいつも以上に複雑。要するにAMDがよく言ううちの製品に最適化すれば速いってやつ。もっと言うとうちの製品に最適化したベンチを出すよってこと。今回は8MB以上のキャッシュ容量をターゲットにすればひとまず相当速くなりそうだけど。まあ語るも涙聞くも涙のAMDですな。昔からAMDのほうは設計図上回路を小さくケチケチ作ってるんだけど製造面で不利なんだからしょうがないよね。CPU
今回のZenでは、ニューラルネットワークをCPU内に適用して、コード実行やプリフェッチに関わる挙動を、動的にアップデートされてる機械学習の結果で制御してるようなので、今までの汎用CPUよりは、柔軟性が高くなると思いますけどね。ひょっとしたら、OS毎や使用目的毎にマイクロコードの一部を変更することで最適化を仕掛けることすら、顧客がコストを払うならばやってくるかもしれないですよ。例えば、WEBサーバとアプリケーションサーバと、仮想化ホストサービスで、同じブレードサーバでもマイクロコードを変えたりとか、ホストOSがWindowsかLinuxかで、これまたマイクロコードを変えてきたりすることで、それぞれに適した学習結果を導き出そうとしてくる可能性すらある。
>ニューラルネットワークをCPU内に適用して、コード実行やプリフェッチに関わる挙動を、動的にアップデートされてる機械学習の結果で制御してる
これってどこの情報ですか?本当ならソースお願いしたいです。ISSCCの発表では分岐予測にDNNを使った発表がありましたが、こちらは事前に学習したものを使って、CPU内でInferenceだけ動作しているようでしたが。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
普通のやつらの下を行け -- バッドノウハウ専門家
キャッシュレイテンシについて補足 (スコア:4, 参考になる)
4gmaer のレビューでは、
> L2キャッシュを超える「4MB Range」以降で,Ryzen 7 1800Xの遅延状況が際立って悪化していることだ。
> FX-9590より遅いというのは異常であり,正直,「キャッシュアクセスやメモリアクセス周りの最適化が十分でない」可能性が
> 極めて高いのではないかと危惧しているが
で終わってしまっていますが、PC Watch のレビューでは補足があり
> AMDによるとSandraやAIDA64などのベンチマークソフトでは、ZENマイクロアーキテクチャのキャッシュ帯域を適切に
> 測定できないとしており、独自に測定した結果が案内された。
ということで(どうい
Re: (スコア:1)
ということで(どういう理屈かわかりませんが)正しく計測すれば L2、L3 キャッシュともに Ryzen の方が早いと主張しています。
intelとAMDではCPUのキャッシュの実装が大きく異なっている。Zenはいつも以上に複雑。要するにAMDがよく言ううちの製品に最適化すれば速いってやつ。もっと言うとうちの製品に最適化したベンチを出すよってこと。今回は8MB以上のキャッシュ容量をターゲットにすればひとまず相当速くなりそうだけど。まあ語るも涙聞くも涙のAMDですな。昔からAMDのほうは設計図上回路を小さくケチケチ作ってるんだけど製造面で不利なんだからしょうがないよね。CPU
Re: (スコア:1)
今回のZenでは、ニューラルネットワークをCPU内に適用して、コード実行やプリフェッチに関わる挙動を、動的にアップデートされてる機械学習の結果で制御してるようなので、今までの汎用CPUよりは、柔軟性が高くなると思いますけどね。
ひょっとしたら、OS毎や使用目的毎にマイクロコードの一部を変更することで最適化を仕掛けることすら、顧客がコストを払うならばやってくるかもしれないですよ。
例えば、WEBサーバとアプリケーションサーバと、仮想化ホストサービスで、同じブレードサーバでもマイクロコードを変えたりとか、ホストOSがWindowsかLinuxかで、これまたマイクロコードを変えてきたりすることで、それぞれに適した学習結果を導き出そうとしてくる可能性すらある。
Re:キャッシュレイテンシについて補足 (スコア:0)
>ニューラルネットワークをCPU内に適用して、コード実行やプリフェッチに関わる挙動を、動的にアップデートされてる機械学習の結果で制御してる
これってどこの情報ですか?本当ならソースお願いしたいです。
ISSCCの発表では分岐予測にDNNを使った発表がありましたが、こちらは事前に学習したものを使って、CPU内でInferenceだけ動作しているようでしたが。