PCI Express 3.0 x1/x4/x8/x16でGPUを接続すると性能は低下するのか 29
ストーリー by hylom
低下しました 部門より
低下しました 部門より
PCと周辺機器を接続するための規格であるPCI Expressでは、グラフィックスカードなど多くのデータをやりとりするデバイスでは16レーン(x16)、あまり多くのデータをやりとりしないデバイスに対しては1レーン(x1)といったように、使用するデータ帯域に応じて異なる数のレーンを使用できる仕組みになっている。そこでPC Watchが、グラフィックスカードの接続に利用するレーン数を変えてベンチマークテストを行い、グラフィックスカードでは実際には何レーンが必要なのかを検証している。
実験では、PCI Express 3.0 x1スロットにPCI Express 3.0 x16仕様のカードを接続できるライザーカードと、搭載CPUに応じて接続レーン数を変更できるマザーボードを使用して検証が行われている。その結果、ベンチマークテストツール「3DMark」ではレーン数を減らしてもスコアは最大1割程度しか低下しなかったが、実際のゲームでは顕著に性能低下(フレームレートの低下)がみられるという結果となっている。
また、Thunderbolt 3接続でGPUを接続する「GPUボックス」についても検証されている。Thunderbolt 3ではPCI Express 3.0 x4に近い帯域が利用できるが、こちらについては実際のゲームではPI Express 3.0 x1接続程度のフレームレートしか出ないという結果が得られている。
Thunderbolt接続でGPU (スコア:2, 参考になる)
これディスプレイがどっちかでだいぶ変わるんですよ
ボックス側の外付け接続なら高く
本体側だと低い
理由は簡単で
本体側へデータ返す必要が出るから
その分だけ無駄な帯域がかかるのですん
Re: (スコア:0)
このテストでは外付けビデオカード側に直接モニター繋げてますね
性能差 (スコア:0)
なぜにゲームとベンチで顕著な差が出るのでしょうか…(棒
Re:性能差 (スコア:2)
GPU内で完結していれば性能差は出ないし、CPUを使っていれば低下しやすい。
画像エフェクトの処理をGPUに丸投げしていない古い作りだと、残念な事になりやすいとか、ありがちかもしらない。
Re:性能差 (スコア:2)
という事なので、前述した内容は無かったことにしていただきたく。
Re: (スコア:0)
拝承
- 以上 -
Re: (スコア:0)
FF11の話ですねわかります。
Re: (スコア:0)
テクスチャの容量が多すぎでVRAMには入り切らないのでメインメモリに読みにいくゲームを選んだからでしょう。
もっと使うテクスチャが少ないゲームだと差は減ると思うのですが。
Re:性能差 (スコア:2)
リンク先にそのまんま書いてありますね。
ゴーストリコンではほかのテストでは比較的性能の低下が緩やかだったGeForce GTX 1050がもっとも極端な性能低下を起こしている。これは2GBのVRAMしか持たないGeForce GTX 1050で、約4.7GBのVRAMを要求するテストを実行した結果、VRAMからあふれてメインメモリに置かれたデータとのアクセスに帯域を必要としているためだ。
# mishimaは本田透先生を熱烈に応援しています
Re: (スコア:0)
一つ上のACですが、テクスチャがVRAMに収まる場合でもベンチマークよりゲームの方が低下は大きいですね。
ベンチマークとゲームではスコアの付け方が(多分)違うから一律評価は出来ないのですが、メインメモリへのアクセスがゲームの方が多いってことでしょうか。
ベンチマークならCPU内のキャッシュへのアクセスで済むけど、ゲームだとメインメモリにガシガシ読みに行くのでメモリバスやCPU内バスを取られる時間が長くなるのが効く、とかってのはありそうですが
その辺はきっと詳しい人が説明してくれるでしょう。
Re: (スコア:0)
VRAMに収まってもゲーム側が動的にロード・アンロードしてるだけで転送量自体が多いとか
レーン経由でGPU内のメモリにアクセスが発生している間はGPU内でのメモリアクセスが阻害されるとかもありそう。
並列アクセス出来るようにはしてるだろうけど完全に並列で動かせるわけではないだろうし。
Re:性能差 (スコア:1)
VRAMが膨大な1080Tiでも性能低下してるので、オブジェクトやテクスチャをダイナミックロードする最近のゲームの傾向のせいでしょう。
Re: (スコア:0)
VegaPro SS爺「わしの時代が到来したのかもしれんのう。」
Re: (スコア:0)
ただ単にベンチの方がGPUをうまく扱えるからだろ。データの粒度が小さいとかだろうか。
Nの字とAの字による企業努力もといベンチマークへの最適化のおかげかもね。
まじかよ (スコア:0)
最悪だな、糞箱売ってくる!
Re:まじかよ (スコア:1)
いまの箱は格安UHD Blu-ray再生機としては神箱
異議はみとめる
PCI-Expressの分岐(おふとぴ) (スコア:0)
PCI-Expressは規格上、レーンを分岐(x16⇒x8×2)したり共有(x16⇒x16×2(共有))したり出来る(PCI-Express Switch)ので、任意に分割できるUSBハブ的な物がお手頃価格で出てきて欲しいです。今の所、業務サーバー用かハイエンドのマザーボード位しか無いんですよね……。
これがあったら、GPUはCPU内蔵の物を使って、GPU用のx16×2をx2×16に分割して、それぞれに玄人志向のSATA×10(PCIex2)をつけたら、HDD160個とかできて夢が広がるんですが。実用性は別にして、x1×32にして、2ポートNICつけて、64ポートルーターとか。PCI-Express Switchチップの値段を見るとそこまで高くないので、需要があればそこそこの値段で作れると思うんですけど、需要がないんですかね?
技術的には可能なのに製品が無くて出来ないと言うのが何とも残念です。
Re:PCI-Expressの分岐(おふとぴ) (スコア:1)
あの信号のタイミングとか見てたらそんな恐ろしいこと言えません
言えません言えません
いえないっていってんだろ
Re: (スコア:0)
こんなんじゃだめ?よくわからないけど。
https://hothardware.com/news/asus-b250-expert-mining-ethereum-motherbo... [hothardware.com]
Re: (スコア:0)
これは上のコメで書いてある
> ハイエンドのマザーボード位しか
です。Switchチップがマザーボードに乗ってるタイプです。こういうのを、自分で自由にレーンとか弄って作れたら楽しいなーっと思うんですよ。
Re: (スコア:0)
買う気がないから知らないんだろうけど、マイニングはコスパ命だからマイニングマザーは安いし台数が必要だから供給数は多いよ。
Re: (スコア:0)
ん?別に元コメ値段が高いとかいってなくね?マザーに最初から組み込まれてるとレーンが分けの柔軟性が足りないからダメってことだろ。
そもそも、マイニングマザーでPCI Express x2が16本とか、x1が32本とか無いよね?
Re: (スコア:0)
お手頃価格で出てきて欲しいです。今の所、業務サーバー用かハイエンドのマザーボード位しか無いんですよね……。とかPCI-Express Switchチップの値段を見るとそこまで高くないので、需要があればそこそこの値段で作れると思うんですけどとか
元コメは高いからヤだって言ってるようにしか見えない
Re: (スコア:0)
マイニング用の変態ボードはお手頃価格にならなそう
Re: (スコア:0)
仕方ないよ
HDD160個みたいなロマンを実現する人は世間ではハイエンドユーザーと認識されるもん
Re: (スコア:0)
HDD160個のスピンアップに耐えられる電源なんて言ったら、そりゃハイエンドでしょうよ
Re: (スコア:0)
しかもHDDに搭載されるキャッシュというかバッファなメモリが効いてないと遅い、とかいう
メモリ階層がここでも効いてくるような状況+コスパに耐えられるのなら…
Re: (スコア:0)
その辺を自力で試行錯誤して解決するぐらいなら、まともなストレージシステム買った方が結局は安いという。
Re: (スコア:0)
時代はソフトウエア定義ですよ
個人でこの規模のストレージを組んでも中身は動画なんだからそうきにすることはない