
TLBエラッタを解消した新Phenomが登場 58
ストーリー by nabeshin
これがリリース版です 部門より
これがリリース版です 部門より
phenommer 曰く、
PC Watch によると、 AMDはTLBエラッタを解消した新ステッピングのPhenomを発表した。TLBエラッタのあるPhenomでは、 BIOSによってそのバグを回避することができるが、大きくパフォーマンスが落ちるため 自作ユーザからは買い控えが広がっていた。新しいPhenomによって、AMD CPUへの人気はまた 高まっていくのだろうか?
ちなみに、最高クロックは2.5GHzのPhenom 9850 Black Edition。 速報レビューも行われている。 TDP125Wと比較的高いので、Intel CPUと比べるとどうしても見劣りしてしまうが、AMDファンとしては 魅力を感じてしまう。
Opteronは (スコア:2, 興味深い)
4月初旬出荷 [dailytech.com]とかって話なんですけど, 最近のDDR3の値下がり具合を見てると, もう半年粘ってshanghaiを待とうかって気にもなっちゃってきました. これが半年前ならSocket F最終型ということで, barcelonaを使った新規PCを導入することに躊躇しなかったんですが.
まあいまだにAthlonMP1900+なんかを使っている身では, TDP68W版が出てこないと排熱がおっつかなくてダメなんですけどね.
AMD64 (スコア:2, 興味深い)
Re:AMD64 (スコア:1)
余計な邪推はしないでもらいたいですね。別にそのような願望はありません。
同僚から聞いた話ですが、内容はhttp://ja.wikipedia.org/wiki/Intel_Core_2#.E6.80.A7.E8.83.BD.E6.AF.94.... [wikipedia.org]にある記述とほぼ同じです。特に、同時使用レジスタ数が増えるとパフォーマンスが低下するというのが気になります。AMD64は引数渡しがレジスタ経由だし、せっかく64ビットになって汎用レジスタが増えたのに、意味が無くなるのではないかと思います。
Re:AMD64 (スコア:2, 興味深い)
Re:AMD64 (スコア:1)
という2点があるわけです。これらは、まだ推測の域を出ないものですが、一部でベンチマークによる裏づけがあるわけです。おっしゃる通り、いろいろなサイトでのベンチマークを見る限り、Phenomのパフォーマンスは確かにかなり期待はずれですが、64ビット環境で動かすソフトウェアによっては、PhenomがCore 2 Quad Q6600よりかなり速いという可能性もあるわけです。この辺りを深く考察した情報があれば良いのですがね。逆に、Core 2の64ビット環境でのレジスタ問題が無ければ、Phenomを買う動機はなくなり、安心してCore 2 Quadを買えるわけです。
結局は、自分が動かすコードでベンチマークを行うしかないのでしょうけど、買う前にやりたい。
Re:AMD64 (スコア:2, 興味深い)
→そもそもMacro-ops fusionの成立条件がとても限られているため、割とどうでもいい。
→このへんの問題は、実はPentium Proの頃から存在していましたが、
命令の同時実行数が増加し、レジスタ本数が増えた Core2 x64 ではかなり足枷になってしまいます。
IPC=3以上を狙って手で最適化すると、わりとすぐこの問題に遭遇することができます。
ただ、レジスタを直前に更新しておくなどして暖めておくとこの制限に引っかからなくなることがあるため
計測・実証には気をつけましょう。
私がx64で遊んだ感触では、同クロックにおける実用上のパフォーマンスは Core2 > Phenom です。
ただ、他の方の指摘・考察にあるように、Phenomは"遅くなりにくい"です。
# C2D も Phenom も飛びついてベンチ走らせたのでIDだ。
Re:AMD64 (スコア:1)
Phenomですか (スコア:1, 興味深い)
正直言って、期待はずれだと思います。というのも、発売前にあれこれAMDが威勢のいいことを言い過ぎていたので、実物を見て「アレ?」って思ってしまった人が多いんじゃないでしょうか。これが出てくればCore MAなんて、目じゃない、そんな印象を発売前には振りまいていたのに、実際出てきたら…。なんとか張り合える?という性能で、なおかつエラッタ入り。ようやく復活したかと思えば、今度は大手メーカー向けに低TDP製品、リテールには高TDP製品(AMD、不具合修正の新4コアCPUや3コアCPUを発表 [nikkeibp.co.jp]によれば「9850 Black Editionの下のモデルは2.4GHzの9750。TDPは2種類あり、大手メーカー製向けの出荷分は95W、店頭販売向けは125Wになるという。」)と、いったいなんなんだ、これ、という状態です。もう少しなんとかならないんでしょうか。
歩留まりとかでは…(Re:Phenomですか) (スコア:2, 興味深い)
あくまでも推測ですが、メーカ製のコンピュータの場合は、コストや大きさや顧客が要求する環境などの理由で熱設計をカツカツにせざるを得ない上に一回での生産ロットも非常に多い場合が多いですから、大手メーカからのTDP95W品のオーダーが集中してしまってるのでは。
従って、同じ設計・同じ生産工程で作っておいて、選品して95W以下に収まる物を納期が厳しいけどまとまった数を確実に買ってくれる大手メーカに優先的に回していたら、歩留まり的に95Wが保証できない品が残りの大半を占めたので、125W品としてその他の顧客に売り出しているのでは…?
多分、基本的に中身は同じだと思いますよ。「これ以下のTDPを保証出来ます」と言うあたりでランク分けてるだけで。
従って、生産技術的な部分で品質が安定してくれば、自然にTDP95W品が主流になっていくんじゃないですか?
# と言うか、電源周りとMPUの放熱や全体の排熱に関しては自作の方が融通効きやすいんだから…フルに4コア100%回してるのでなければ、
# 急激な電流変動でも安定している電源回路にしてあるマザーボードと電源ユニットを買って過激な電力制御を行えば、125Wでも95Wでも
# そんなに消費電力も発熱も変わらない気がしますけど…
メーカの品管の視点で見てみる(Re:歩留まりとかでは…(Re:Phenomですか) (スコア:1)
なるほど…謂わんとされていた所を間違えていましたね。
最終的には、品質管理の基準でTDP95W相当のスコアを出していて125Wのラベルで売る必要がある状況であろうと思います。
ユーザとしては無茶苦茶高くてもいいからTDP95Wのラベルを張って欲しいという、その気持ち自体はすっごくわかるんですよ。私ですら三十万くらい自由に使える金があれば同じ事を考えていると思います。(金額はもっと少なくても同じでしょう)
で、逆にメーカと言うか出荷者側の視点から考えてみます。
工業製品を売る側から見ると、「最大公差」とか「最悪値」と言うものをお客さんから示してもらった上でその範囲内に収まるように作って売る訳ですが(もしくは「最大公差」や「最悪値」をこちらから示してお客さんのニーズと合致すれば買ってもらう)、
ここで考えないといけないのは、
不良率=保証値を外れた異常に悪い性能を示す物の割合は0にできない
と言う、非常にややこしい現実があります。
それを踏まえた上で、売る側であれ買う側であれ物作りの現場では、以下の事も踏まえて商品の不良率を下げていきます。
・初期のロットでは不良率は高くなる
・その不具合の原因は出荷時検査や品質基準で項目外だったり、使用者側が製造者側の想定外の使用法を行う場合が大半である。
・製造者は使用者がどう製品を使ったかを聞いた上で、不良を起こした部品を回収して検査・原因を調べて改善する。
大体はこの三つのプロセスを繰り返していく事で製造者側は商品の品質を上げ、使用者側は「最適な使い方」のノウハウを学んで行きます。
これは、あくまでもメーカ対メーカのやりとりの場合に成立する物でして、そこでは両者の間に非常にシビアな関係が成立します。即ち、
・ロットあたり数千個の出荷の中で一個の不良品が出荷されてもロット全部が使用者から製造者から返品されてくると言うことも少なくない。
これを踏まえた上で、メーカ(もしくは商社)と個人の取引でのリスクを考えてみましょう。
この場合、在庫や納期は考えから除外します。
・個人で部品を購入して製作した場合には、各部品のメーカが想定していないような使われ方が頻繁に起きる。
→メーカからノウハウが上手く伝わらない状況で手探りで開発・製造するのだから仕方がないけど、厳密なメーカサポートが困難な事をも意味する。
特に、PCの場合にはオーバークロッカーの存在が半ば認められているので、熱や消費電力での最悪値と実際の平均値の間のマージンをかなり大きめに取る必要がある。
・メーカ(or 商社)と個人の直接取引だと、間にアセンブリメーカが挟まっていない分、メーカ側の製造者責任が重く問われるので、製作した物でトラブルが起きた場合、個人よりも部品製造者のリスクが高くなる
→MPUの場合だと、製作者の熱設計や電源周りの安定度が原因なのか、本来の製造不良なのか特定しにくい場合が少なくない。
特に、どういう電子部品でも共通ですが、熱に関する問題というのはすぐに結果が出るとは限らず、経年劣化で始めて露呈する場合が多い
そういう状況で、法的な製造者責任を問われた場合には責任所在を巡って泥沼化するリスクが高い
・商社経由での購入者が不良を出した場合、商社から製造者に当該ロットの全品が回収されてくる可能性が高い。
→逆に、そうでなければ品質管理の側では故障原因の一般化がやりにくくなるので、全品返品の方が有難い面も少なくない。
要は、TDP95Wとして売ったものの中にTDP100W相当の品が混ざっていた場合の製造者側のリスクは非常に高くなるが、「最悪値として」TDP125Wで販売して、故障が起こった場合には製造者側のリスクは低くできると言う事です。
あくまでも「多分」ですが、市場に出回るTDP125W品の殆どが、実は、TDP95Wとして出荷する条件をもう少しだけ緩くすれば95W品として売れなくはない品物ではないかと思います。
それでも敢えて125Wで出すというのは、使用者の想定する使い方と製造者の想定する最悪値のマージンをより大きく取れるからです。
例えば、熱設計がギリギリのケースでPCを組んでみた場合を考えます。
ここでマージンが小さいと、マシン(MPUやマザーボード)自体の寿命が極めて短かったり不良が頻発する機械が続出します。
逆にマージンが大きいと、この手の不良はかなり減ります。不良が出ても、原因を速やかに特定できる。
故に、TDP95Wで出荷しても大きくマージンを取れる段階まで商品が熟成されるまでは大事を取って、すべてを最悪(保証)値のTDP125Wで出荷するのが無難だと言うことになるんですが。
これが一回で数万個買って、直ぐに製造後の試験をやってくれるような顧客だとそれだけ不良品が早く割り出せますから
…購入したメーカが直ぐに組み立てて、その商品の出荷検査をキチンとやって、売った後もそれなりの社内サポートで故障状況をまとめてくれるというのは、売る側の品質管理の筋の物からすれば「人柱」としては最適な顧客でもあるんですよ。
場合によっては売る側が購入者の工場にサポートチームを常駐させてしまう場合も少なくないですから。この手の新規開発の品の場合には。
Re:Phenomですか (スコア:1, 興味深い)
技術競争で明らかに先行していた時期はポジティブスパイラルに寄与する傾向が
追いかける立場になると詰めの甘さから来るブースト圧不足に見えるから不思議
Re: (スコア:0)
Intelも独立L2キャッシュと共有L3キャッシュの構成にするようですし。
あと、チップセットの製造プロセスではAMDが一番進んでいる。
Re:Phenomですか (スコア:1)
工場のキャパが余ってて、チップセットを先端プロセスで作らないと工場の稼働率が上げられないのではないでしょうか?
インテルは工場のキャパが足りなくてチップセット供給不足を起こしていましたが。
Re:Phenomですか (スコア:1)
実は円高の影響で日本に輸出したくないだけなんじゃ…とか
アメリカには余ってるぜ!とか聞きましたが、そこんとこどうなんだろう。
日本の小売店に出回らないのは歩留りが悪いからとか
ノイズに弱いとかで選別品をXeonに回して残りを更に選別したのがでまわってるとか
どっちなんだろ?
Re: (スコア:0)
還元セールと言って安く売られるとブランドイメージに傷が…とか?
何にせよ円高に大きく振れる前からずっと弾不足だから為替は関係ないだろう。
Re: (スコア:0)
商社経由でも平行輸入でも、ドル決済で日本に持ってくるなら
為替レートは関係ないが。
リテールで足りないのは、PCメーカに回す分が好調なんでは?
# いくら45nmの300mmでも、チップがでかけりゃ玉数が減るし。
Re: (スコア:0)
いくら先端プロセスで作ってもAMDのキャパは埋められない。
TLBエラッタえらいこっちゃ (スコア:1, 興味深い)
MMU付きのCPUの場合はほとんどTLBを持っておりまして、論物変換を高速に引くためにTLBを使っていますんで。
で、TLBがミスヒットしたらアドレス解決するために、計算したりメモリ読んだりしないといけないです。
これを回避ということは、わざわざTLBクリーンしていたとかそういうことなのでしょうかね。
それともALLMiss状態。。。恐ろしや。
マルチコアだとCPUでのキャッシュの扱いとか、MMUの整合性処理が大変そうですね。。。
Re:TLBエラッタえらいこっちゃ (スコア:1)
つまりDOSを使えと。
# まるちこあ対応のDOSってあったっけ。
Re:TLBエラッタえらいこっちゃ (スコア:1)
> つまりDOSを使えと。
EMM386.SYS などのEMSドライバがMMUを使ってますね。
EMSが無い、HIMEM.SYSによるXMSのみのDOSとなると…1MB超のメモリはRAMDISKに使うぐらいしか使い道がないかなぁ…
Re: (スコア:0)
TLBを実装して使える場所は色々ありますが、今回は3rdキャッシュのTLBでMMU(Pageing)とは別のとこのTLBの話ですよ。
Re: (スコア:0)
ただ、バグが出る条件として L3 キャッシュがからんでいたので、
ページテーブルに関してはキャッシュ不能にして回避って話じゃ
ありませんでした?
Re:TLBエラッタえらいこっちゃ (スコア:5, 参考になる)
http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/41322.pdf
のProduct Errata #298。
概要だけ書いておくと、L2にあるTranslation tableのエントリのAccessedビットもしくはDirtyビットを立てるオペレーションがアトミックでないので、もしほかのCacheオペレーションと重なった場合、L2に最新のエントリが書き込まれる前に、L2に存在する古いエントリがL3に書き込まれる、といったバグ。
回避方法は親コメントにあるとおりTLBキャッシュを使用しない。
Re:TLBエラッタえらいこっちゃ (スコア:1)
TLBそのものを使用しないとなると、とんでもなくパフォーマンスが低下するんじゃないでしょうか。
命令フェッチやデータアクセスなどの「全てのメモリアクセス」が、
「MMUテーブルメモリの参照」と「実アドレスへのアクセス」という2段階の処理を行うことになるので、
メモリアクセス速度が半分になってしまいます。
ベンチマークの結果とかを見る限りでは、そこまでのひどいことにはなってないような。
「TLBそのものは使用するが、TLB用のデータはL1~L3キャッシュを利用しない」
(TLBへの書き込みは即メモリに書き出す)ってあたりが順当な気がします。
Re:TLBエラッタえらいこっちゃ (スコア:1)
なんかさっき書いたコメントが書き込まれてなかった。どうでもいいが。 (スコア:1)
Re: (スコア:0)
他のコメント見ると。
もっと深刻。
Re: (スコア:0)
Re: (スコア:0)
Re: (スコア:0)
4gamerの記事をもし見たのでしたら、そう思うかもしれませんが、他の記事を総合して考えると、4gamerじゃない記事の方が正しそうです。
タレコミ元のベンチスコアにもありますが (スコア:1)
Q9xxxが品薄で全く手に入らないとはいえ、なかなか数字を
気にするゲーマー、ベンチマーカーは手を出さないでしょうね。
正直、9100eや、4850eなど"選別品"の方が製品として魅力的です。
Re:タレコミ元のベンチスコアにもありますが (スコア:1)
ベンチマークがすべて!とか言う人は買わないだろうね。
消費電力もレビューサイトに載ってるやつは"最小の電源管理"設定になってねーんじゃねーかなと疑いたくなるようなものばっかりw
Phenomは"速くなるCPU"ではなく"遅くならないCPU"なんです。
コンシューマー向きではないかもなぁ。
Re:タレコミ元のベンチスコアにもありますが (スコア:2, 参考になる)
よく言われるAMD CPU(K8以降)の利点はこんな感じですね。(一部過去形)
しかし、1に関してはコンシューマ用途にはあまり魅力がありませんし、2は逆転されてしまいました、というかAMD自爆気味?
3は用途を問わずおいしい性質ですが、ベンチマークに表れにくいため評価は主観に頼らざるを得ず、どうにも信憑性に欠けてしまいます。
こうして見ると、コンシューマ向けに売るには向いているとは言い難いですね。
これがモバイル出身のCore2シリーズとサーバ出身のPhenomの差かなぁ。
とかいいつつ、5ヶ月前に注文した新Opteronの入荷案内が来るのをワクテカしながら待っていたり。長かった……
巧妙に潜伏したバグは心霊現象と区別が付かない。
Re:タレコミ元のベンチスコアにもありますが (スコア:2, 参考になる)
4. (Opteron/Barcelonaで)2CPU以上接続時、HT接続のメリットにより
North Bridge経由のXeonより有利。
5. (Opteron/Barcelonaで)FB-DIMMを使わなくてもメモリ上限の制約を受けにくい
= FB-DIMMの消費電力分有利
やっぱり鯖向けをデスクトップに落としてるCPUなんだなー、という感です。
1CPUでは今はちと分が悪いですね。
その手の用途はBEシリーズの方が…(Re:タレコミ元のベンチスコアにもありますが (スコア:2, 参考になる)
>1CPUでは今はちと分が悪いですね。
それは言わないお約束…と言うか、今時のアプリケーション環境では一個の物理CPUに負荷を集中させるような使い方をすると、最終的にはOSカーネルのスケジューラのパフォーマンスが急速に落ちて、システム全体を重くしてしまうという問題が出てきている訳でして
…基本的にLinuxerなので、カーネルを2.6.24系にしてからは一個の物理CPUだけの機械でえげつないような負荷がCPUにかかるようにしてもうまいこと逃げてくれてる臭いですけど、2.6.23系までは一個の物理CPUだけでフルに負荷をかけること自体が禁句だったというか、2個の物理CPUがあっても、1スレッドあたり%CPUが100%近いスレッドを四つ五つ流す状況にするとメモリがあっても他の%CPUが少ない「軽い」タスクの遅延が酷かったですから。
Windows XPだともっとそこいらの負荷のかかりかたでの遅延が露骨に出ていましたし…Vistaは触ったことないので評価保留しますが。
# あくまでも、ユーザランドのタスクについてです。カーネルモードのタスクは負荷が極限近くなっても
# うまいこと動いてはいましたが(あくまでも物理メモリが充分にあればと言う縛り付きで)
逆に言えば、デスクトップマシンやノートブックマシンで、事務処理とかの比較的「軽い」お仕事を中心にやらせる目的でAthlon64 (x2)BEシリーズがあるのではないかと思いますけど。
(あのクラスのCPUとしては)超低消費電力のマルチコアで2コア回したときにAthlon XPの上位CPU程度の処理速度能力を確保させていると言うのは明らかに「古典的なデスクトップ用途のBE」「ワークステーション向けのPhenom/Barcelona」と言う二極化路線を狙っているとしか思えないんですけど。
使ったことがないのでローカルビルドしながらプログラム開発して、デバッグが一段落したらソースコード管理サーバのリポジトリにソースコードを投げるような開発系のお仕事に耐えられるかどうかまではわかりませんけど、その手の用途でも時間の制約が緩ければ実用になる気がしますけど、どうなんでしょうね?
TDPなんて飾りです!エライ人にはそれがわからんのです! (スコア:0)
いや、付けっぱなしの状態が多いのでそう思うのです。でもAthlonX2 BEシリーズは大好きですよ。
値段も安いし、性能もそこそこ、TDPも低く設定されているので。
TDPが95Wぐらいになったら買います。
Re:TDPなんて飾りです!エライ人にはそれがわからんのです! (スコア:3, すばらしい洞察)
TDPが125Wなのは「Phenom X4 9850 Black Edition」「Phenom X4 9750」で、「Phenom X4 9650」「Phenom X4 9550」は95Wですよ。ぜひ買ってください。
まあ「~だったら買う」って奴は、結局、買わないんだけどな。
no signature
Re:TDPなんて飾りです!エライ人にはそれがわからんのです! (スコア:1)
それぐらいなら、失敗しても自分自身で納得できる・・・よね?
Re:TDPなんて飾りです!エライ人にはそれがわからんのです! (スコア:3, 興味深い)
#Athlon6250 + AMD 780G + ハイブリッドクロスファイアとか夢が広がりまくりんぐ。
#低電力ながらも、瞬発力もあるシステムになりそうだ・・・。
#とは言え、現状では AMD 690G マザーで満足してるので、多分買い換えるとしても
#CPU だけしか買わないだろうとは思うのだが・・・。
Re: (スコア:0)
#linuxとsolaris だから安いメモリに感謝
9150e出たら組みたいけど、OS何入れようかなと
#動かすときは複数台だから 気持ちだけでも 電力優先w
Re:TDPなんて飾りです!エライ人にはそれがわからんのです! (スコア:3, 興味深い)
KentsfieldのCore 2 Extremeで130W、Core 2 Quadで95W(B3以前は105W)。
YorkfieldのCore 2 ExtremeだとQX9775で150W、QX9770で136W、QX9650で130W、Core 2 Quadは95W。
ちなみにPhenomのTDPは以下。
Phenom X4 9850 BlackEditionは125Wですが、9750以下は95W(9750は125W/95Wって書いてあるんですが、両方あるってこと?)。
なお、低消費電力版の9100eは65Wだそうで・・・。
#ちなみにX3でもX4と同じ95W・・・ダイ一緒だからなぁ。
メモリコントローラを積んでる上、まだ65nmプロセスなのでPhenomの方が高くなるのはしょうがないんですけどね。
ちなみに、チップセットの消費電力はP35で16W(X38は36.5W)、770で10W以下らしいので消費電力高いっていうPhenomの評価は気の毒かもしれない。
とはいえ、性能でいえばだいたいCore 2 Quad Q6600≒Phenom X4 9850なので、CPU単体のTDPで30W、システムのピーク消費電力(ワットチェッカー)で50W(PC Watchのレビュー@DDR3使ってるあたりが少しIntelプラットフォームにとっては消費電力で有利かな)違うのはどうなのか・・・とは思いますが。
はやく45nmプロセス投入しないと離される一方ですね。
出来の悪い子ほど可愛い (スコア:0)
なんとなく惹かれるものがあるので、こちらを買っちゃうつもり。
Re:出来の悪い子ほど可愛い (スコア:1, 興味深い)
デュアルコアとシンゴルコアのデュアル構成という、変態マシンを作り出すことが出来るので良い時代になりました。
Re:出来の悪い子ほど可愛い (スコア:1)
#HTブリッジとか積まないとだめでコストかかりそうだし熱がやばいな・・・95Wx2+αで200W級。そしてメモリコントローラが無駄になる(AM2だと2チャンネルしか出せないし)。
Re: (スコア:0)
つXBOX360
つMD+MCD
+32XつSaturn
Re:出来の悪い子ほど可愛い (スコア:1)
http://www.coinop.org/g.aspx/100213/Xevious.html [coinop.org]
http://www.coinop.org/g.aspx/100020/Bosconian.html [coinop.org]
Re: (スコア:0)
Re: (スコア:0)
/ ̄ ̄ ̄ ̄ ̄\
| ・ ・ |
| |
⊂ ヽ__ __/ ⊃
ノ  ̄ ̄ (
(_________________________)
Re:エラッタって (スコア:2, すばらしい洞察)
Re: (スコア:0)
♪ ∠__ノ ∠__ノ ∠__ノ エーラッタ
〈,(・∀・;)ノ・∀・;)ノ・∀・;)ノ エーラッタ
└i===|┘i===|┘.i===|┘ ヨイヨイヨイヨイ
〈__〈 〈__〈 〈__〈