パスワードを忘れた? アカウント作成
この議論は賞味期限が切れたので、アーカイブ化されています。 新たにコメントを付けることはできません。

AMDプロセッサのコア数表記をめぐる訴訟、BulldozerコアCPU購入者が対象に」記事へのコメント

  • by Anonymous Coward

    Hyper-Threading みたいなもんか

    • by Anonymous Coward

      MSもそう判断してBulldozer用の最適化パッチ(KB2592546)をリリースしたけど、かえって速度低下を招いてしまい、あわててKB2645594とKB2646060で更新した。

      ちなみに以上の話はWin7の時代のことで、Win8以降はOSのスケジューラーが最初からBulldozerのナンチャッテ8コアに対応している。

      • by Anonymous Coward on 2019年01月28日 17時53分 (#3555912)

        実際どんぐらいナンチャッテだったんだろね…。
        AMD冬の時代だったので興味薄かったな。HTよりだいぶマシだったかとは思うけど。

        #Athlon64x2からずいぶん間開いてRyzen使ってる今。

        親コメント
        • by Anonymous Coward on 2019年01月28日 21時50分 (#3556042)

          命令を取ってくるフェッチユニット、命令デコーダ、浮動小数点演算ユニットとSIMDユニット、L2キャッシュが共有。
          整数演算ユニットとL1キャッシュが独立したコアらしい
          でも、ナンチャッテというのは可哀そうだと思う。

          ほとんどの用途で重要なのは整数演算であって、浮動小数点演算とSIMDはあまり使わない。
          特にサーバー用途では。
          だからトランジスタは整数演算ユニットに使って、あまり使われないユニットは共有し、節約したトランジスタをコアの数を増やすことに使うことで性能向上を図るというコンセプト。
          ただし、インテルに製造技術で一世代以上負けていて、一世代負けると半分のトランジスタしか使えないから、勝負にならなかった。

          あとBulldozerはx86命令が複雑なため消費電力が多いデコーダを共有、さらに同時命令発行数を4に抑えることで発熱を減らし、代わりにクロックを上げることでカバーする目論見だったみたい。
          この場合、2整数コアあっても、一度に最大4命令しか送れないので、2つのコアが両方、理想的に動いた場合、実行すべき命令で不足し、実行ユニットが暇になってしまう。
          そのためインテルに比べて、ピーク性能は低くなる。

          Bulldozerはシングルスレッド性能が大事なPCには向いておらず、肝心なコア数も製造技術で負けていて、マイクロアーキテクチャの有利さを生かせなかったので、悪い点だけが目立ったんだと思う。

          Ryzenはユニット共有をしてないけど、インテルより比較的トランジスタ数を抑えることと(AVXのユニットをインテルほどぜいたくにもっていない)、インテルとファウンドリーの製造技術差が縮まったことで、シングルスレッド性能では劣っているけど、マルチスレッド性能では価格性能比で有利となっている。

          そしてインテルの10nmとTSMCの7nmは互角?で、インテルの10nmはまだ予定通りにでるかは不明なため、今年はAMDのターンな年だと思う。

          親コメント
          • by Anonymous Coward

            と思うでしょ
            でもブル公はAlpha 21264に非常に近い設計なんだ
            共通のフロントエンド、2つの整数コア、共通のFPUとL2は21264の特徴だった
            ブル公との違いは整数コア間にデータパスがあることくらい
            このデータパス、けっこう重いので取っちゃってマルチスレッドにしたんじゃないかと想像している

          • by Anonymous Coward

            > あとBulldozerはx86命令が複雑なため消費電力が多いデコーダを共有、さらに同時命令発行数を4に抑えることで発熱を減らし、代わりにクロックを上げることでカバーする目論見だったみたい。

            これはたぶん違う
            x86のデコーダは命令の切れ目を見つけるために、way数に対して規模が組み合わせ的に増加する
            4wayの共有デコーダと3wayのデコーダ2つでは後者のほうがスループットが高いが、K10並みが2つですむ
            どうしても4wayデコーダを用意したかったと考えるべきで、それは共有FPUの性能が裏付ける

        • by Anonymous Coward

          4コアだと思ってfpuメインで使えばメモリ性能ともマッチしていて優秀
          たぶん4コアとして売るつもりで設計してたんだろうね

私は悩みをリストアップし始めたが、そのあまりの長さにいやけがさし、何も考えないことにした。-- Robert C. Pike

処理中...