Meteor Lake は L4 キャッシュ対応 | スラドハードウェア

Meteor Lake は L4 キャッシュ対応 69

ストーリー by headless 2023年04月16日 10時49分
追加部門より

Intel の第 14 世代 Core プロセッサー Meteor Lake では L4 キャッシュが利用可能になるようだ (Phoronix の記事)。

Intel の Fei Yang 氏が送った一連の「drm/i915/mtl: Define MOCS and PAT tables for MTL」と題するパッチの一つで明らかになった。このパッチでは L4 キャッシュの定義やオプションが追加されている。

この議論は賞味期限が切れたので、アーカイブ化されています。新たにコメントを付けることはできません。

記事ページを表示すべてのコメント取得

検索69コメント Log In/Create an Account

メモリボトルネックを解消するためかな (スコア:1)

by shesee (27226) on 2023年04月16日 13時28分 (#4445149) 日記

シリコンが余っているからといって、キャッシュの階層を重ねすぎるのもどうかと。
- Re:メモリボトルネックを解消するためかな (スコア:1)
  
  by Anonymous Coward on 2023年04月16日 14時13分 (#4445160)
  
  シリコンが余っているからではなく必要に迫られてですよ。
  DRAMの微細化も速度も消費電力も限界になってて、これ以上改善できなくなったから仕方なくやってる。
  SRAMはロジックの微細化に合わせて順当に進化できたのですが、DRAMは15nmぐらいから先ほとんど進化できなくて止まってます。
  DRAMもインターフェイス側の改良は続いていて、GDDRとかHBMとかで並列化によって帯域幅は向上できてるのですが、素子単体は改良できてないのでレイテンシが数十nsから速くなってないし消費電力も減ってない。
  業界的にはMRAMなりPRAMなりの次世代メモリにバトンタッチする予定だったのが、どれも研究開発は出来ても実用化の壁に当たってモノになってない。
  そこでCPUにはAMDの3D-VCacheのようにSRAMを積層してキャッシュ容量増やしたり、GPUでもNVIDIA、AMD共に最新世代では大容量SRAMキャッシュ追加してDRAMへのアクセス減らして性能改善してます。
  
  シェア
  
  親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    L1～L3増やせばよくない？
    キャッシュ階層を増やすと同期大変だしTLBバグみたいな元になるし、データのコピーがL1～L4まで4重に居座ることになって、シリコンが勿体なくない？
    素人考えなんだろうけどどうしても気になる。
    - Re:メモリボトルネックを解消するためかな (スコア:1)
      
      by Anonymous Coward on 2023年04月16日 16時03分 (#4445182)
      
      簡単に言えば、容量を増やせば増やすほど低レイテンシ、低消費電力というキャッシュメモリの特性を維持できなくなるからです。
      正確な理由は簡単ではないですが、容量が増えると物理的にサイズが大きくなるので距離が遠くなることと、アドレス変換のロスが重くなる。
      容量を増やしても性能を維持できるなら、L1単体で大容量にすればいいのはその通り。
      でも物理的な限界からそうできないから、仕方なく階層構造にしています。
      
      シェア
      
      親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        デバイスの設計上、高速のメモリほどセルサイズは大きく消費電力も大きくなり、大容量のメモリが遅くなるのは避けられない
        トレードオフの問題を回避するためには、特性の異なるメモリを組み合わせた階層構造にせざるを得ない
        という話は分かるが、ローエンドの組込プロセッサまでもシリコンが有り余ってARMやRISC-Vベースになりキャッシュがオマケについてくるのは止めてくれ.......
        ＃8051コアで満足できる男です
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      近い階層のキャッシュ増やすと、検索に時間がかかって性能上がらんのじゃね？
      L3増やせば、それは性能的にはL3なくしてL4積んだことにしかならないとか。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        CPUはメモリーを読み込んでないのでその辺は問題ない。
        CPUが読み込んでいるメモリデータはブロック単位です。
        ブロック単位で読み込んでブロック単位で書き込みをする…そんな仕組み
        メモリアクセスの状況からどこを読んでいるかわからない。
        必要とされる場所もしくは必要とされるであろう場所のブロックが読み込まれる。
        そのためキャッシュの効果が上がる。
        メモリーは並列読み込みで時間単位みかけで転送レートが上がればある程度は改善できる。
        さらにCPUが早くなるのであれば、メモリー2枚差しじゃないと動かなくなるかもしれません。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        キャッシュ容量を上げた場合検索により時間がかかるようになったり本来キャッシュすべきではないものをキャッシュしやすくなるがまあそれでも速くはなるからな。
        むしろ問題は高速なキャッシュほど高価というところらしい。
        このまま行ったらハイエンドはそのうちCPUのキャッシュ階層が6段くらいになりさらにモジュール側にHBMがありその下にDDRがありその下にNVDIMMがありというふうになりそう。
        今のシンプルな構成から比べると恐ろしく複雑。
        そりゃ昔はCPUキャッシュもRAMもなかったかもしれんが…
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      既に3階層になっているものを4階層に増やすという話はそこまで奇異だろうか
      3階層のままで増やせばというなら、同じ理屈で1階層で十分だろとは思わない?
      - Re:メモリボトルネックを解消するためかな (スコア:1)
        
        by shesee (27226) on 2023年04月17日 0時22分 (#4445322) 日記
        
        キャッシュ階層の数がラグランジュポイントの数を超えるのももうすぐだな。
        
        シェア
        
        親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      歩留まりの問題じゃね？
      どんだけコスト掛けてどんだけ不合格品を出してもいいなら全部最速爆速のL1でOK。
      あとL2ってCPUダイの外に出してたし。これもやはり歩留まり(と技術的な限界)が要因。
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    DRAMを外部記憶と呼ぶ時代になるのかなあ
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      不揮発性メモリに置き換わらないとちょっと…
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        アプリケーションからはNVDIMMが揮発性メモリに見えるのだろうな。
  - - - Re:メモリボトルネックを解消するためかな (スコア:1)
        
        by taka2 (14791) on 2023年04月17日 18時55分 (#4445750) ホームページ日記
        
        「半導体の面積として大差無」いってのが空論
        DRAMとSRAMの面積あたりの容量の差が桁違いなので、少々SRAMの集積度が上がったところで、SRAMはDRAMを代替できる容量になりません。
        7nmプロセスで42mm²のSRAMが256Mbit [impress.co.jp]ってぐらいなので、
        DRAMが1チップで16Gbitぐらいなのと比べると、容量が2桁少ないんです。
        
        シェア
        
        親コメント
ロジックICの多層化って出来ないの？ (スコア:0)

by Anonymous Coward on 2023年04月16日 10時52分 (#4445106)

いまはNANDはどんどん多層化してるが、
たとえばロジックICを多層化して、SRAM層とロジック層みたいなのが出来れば、
キャッシュ容量を大幅に増やせると思うのにね
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ロジック層の重ねても熱を逃がせないと同時にフル稼働できないやろ
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    鍼みたいな熱伝導体かませばいけるやろ
    - Re:ロジックICの多層化って出来ないの？ (スコア:1)
      
      by nekopon (1483) on 2023年04月17日 8時39分 (#4445386) 日記
      
      ツボ探しが大変そうですが > 鍼
      
      シェア
      
      親コメント
- Re: (スコア:0)
  
  by Anonymous Coward
  
  モノを知らないって怖いね。
  多層化なんて各社すでにやってるだろう。
  https://www.intel.co.jp/content/www/jp/ja/silicon-innovations/6-pillar... [intel.co.jp]
  https://www.amd.com/ja/technologies/3d-v-cache [amd.com]
  3D積層技術は
  発熱はm3の体積に比例して増えるのに対して、放熱はm2の面積に比例してでしかできない点
  垂直配線をm
  - Re:ロジックICの多層化って出来ないの？ (スコア:1)
    
    by Anonymous Coward on 2023年04月16日 14時31分 (#4445162)
    
    シリコンを縦にスタックして貼り合わせる3D積層化と、成膜とエッチング工程を増やすNANDフラッシュの多層化とは別の技術です。
    層を２倍にしてもスルーホールを増やさないといけないからロジック数は２倍にならないし、歩留まりは低下するからコストは２倍以上になるし、今のところはロジックではメリットの薄い技術でもある。
    チップレット化が行き詰まった先でようやく採用される技術なんじゃないかな。
    
    シェア
    
    親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      まあでもすぐ行き詰まるのが見えてるし
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    ＞モノを知らないって怖いね。
    こういうマウントを取るようなワードを入れるコメントがたまにあるけど、全部おなじヤツなのかね。
    おそらく、リアル世界で虐げられてストレスたまってるんだろうけど、スラドに持ち込まないで欲しいね。
    - Re:ロジックICの多層化って出来ないの？ (スコア:2)
      
      by 90 (35300) on 2023年04月16日 17時44分 (#4445201) 日記
      
      全部同じではないと思います。ペルソナを作って放っておくと時々子孫が生えるのを観測しているので。その時にトリビアを入れておくと一個二個はついでに持っていってくれるんですが、ほとんどは構文だけで態度や背景まで真似てくれないので残念。
      
      シェア
      
      親コメント
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      むしろ日本では「こんなことも知らねえのか？」系のワードは義務教育期間から学生バイト、そして会社で働くようになっても
      日常生活であまりにも頻繁に使われすぎているので、その程度のことで一々「マウント取られた」とかいってたら生きてけないでしょ
      リアルで引きこもりでもやってんの？
      ＃こういう人が子供を持ったら、ある日子供に「お父さん、そんなことも知らないの？」とか言われてキレて虐待とかしでかしそう
      - Re:ロジックICの多層化って出来ないの？ (スコア:1)
        
        by Anonymous Coward on 2023年04月16日 20時07分 (#4445247)
        
        会社とスラドの区別がつかないから、会社のうっ憤をスラドに持ち込んじゃうんだね。
        会社のうっ憤は会社で晴らそうね。
        
        シェア
        
        親コメント
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        そんな、昭和98年な会社はやだな
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        っつかスラドが昭和のジジィばかりだからなｗ
        あと「こんなことも知らねえのか？」ってマウント取ってるジジィって話す速度でフリック入力もできねーとか
        逆の立場から見たらお前が無能ってことにも気付けと。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  ロジックとメモリの積層だと、チップ単位の積層は既に実用化されてるし、別コメにもあるので割愛。
  ロジック自体の積層なら CFET が答えです。
  1nm世代以降に向けて研究開発してます。
  https://xtech.nikkei.com/atcl/nxt/column/18/00001/07897/ [nikkei.com]
髭剃りの前例にならうと (スコア:0)

by Anonymous Coward on 2023年04月16日 11時12分 (#4445109)

6次キャッシュまではいける。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  HDDのプラッタも5枚程度で限界だったのも今や昔の話
  ヘリウムだの力技使ってはいるけど、10枚とか製品化されてるものなぁ
ついにMRAM？ (スコア:0)

by Anonymous Coward on 2023年04月16日 12時08分 (#4445119)

intelがSTT-MRAMによる1GB4次キャッシュの話が出たのはもう４年も前だった
MRAMそろそろもっと来てほしい
https://pc.watch.impress.co.jp/docs/news/event/1224746.html [impress.co.jp]
- Re: (スコア:0)
  
  by Anonymous Coward
  
  不揮発なんやな。
  1GBの不揮発メモリ、使い道は思いつかないな。不揮発性はおまけで、大容量キャッシュとしてもメリットがメインか？
  SSHD的な使い方には電断時のデータ保護によさそうだが、SSHDが流行らないからなあ。
  - Re:ついにMRAM？ (スコア:2)
    
    by ogino (1668) on 2023年04月16日 12時46分 (#4445126) 日記
    
    不揮発なんやな。
    1GBの不揮発メモリ、使い道は思いつかないな。不揮発性はおまけで、大容量キャッシュとしてもメリットがメインか？
    不揮発ということは、記憶保持に電力が不要ということで、省電力ということです。おまけではないと思います。
    
    シェア
    
    親コメント
    - Re:ついにMRAM？ (スコア:1)
      
      by Anonymous Coward on 2023年04月16日 13時04分 (#4445137)
      
      PC Watchには
      　STT-MRAMには、書き込み動作を高速化すると、書き込み電流が急激に増加するという弱点がある。この弱点のために、MRAMキャッシュは消費電力がSRAMキャッシュに比べて増えてしまう恐れが少なくない。
      とあるので、そこまで単純じゃなさそう。SRAMは揮発性だけど電源が入っている限りリフレッシュ動作は不要だし。スリープ時に消費電力ゼロを活かせるのはキャッシュよりメインメモリじゃないかな。ただしOSにも不揮発性メモリの知識が必要だけど
      
      シェア
      
      親コメント
      - Re:ついにMRAM？ (スコア:2)
        
        by ogino (1668) on 2023年04月16日 13時32分 (#4445154) 日記
        
        それは STT-MRAM の書き込みを高速化したときの問題で、MRAM 全般の問題ではないという認識でいます。
        PC Watch: 超高速の不揮発性キャッシュを実現する次世代MRAM技術 [impress.co.jp]（2019年5月27日）
        　試作した記憶素子は、STT-MRAMモードのスイッチングとSOT-MRAMモードのスイッチングの両方で動作した。STT-MRAMモードのスイッチングに必要な電圧は約0.5V～1.0Vで、スイッチング(平行状態から反平行状態への遷移)に必要な電圧パルスの時間は5ns～20nsだった。なお、外部磁界は印加していない。
        　SOT-MRAMモードのスイッチングに必要な電圧は約0.3V～1.0Vで、スイッチングに必要なパルスの時間は0.28ns(280ps)～5nsだった。外部磁界の大きさは24mTである。同じスイッチング電圧で比較すると、STTモードで5nsのときに、SOTモードでは280psとスイッチング時間が10分の1以下に短くなっていた。
        　そしてスイッチングに必要なエネルギーは、STTモードが5nsのスイッチングで約470fJであるのに対し、SOTモードが280psのスイッチングで約350fJで済んだ。高速かつ低消費エネルギーになっている。
        製品が出荷されている STT-MRAM に比べ SOT-MRAM は研究開発中ですが。最近の記事だと TECH+: 連載高密度ラストレベル・キャッシュメモリ・アプリへの扉を開く新たなSOT-MRAMアーキテクチャ [mynavi.jp]（2023/03/15-16）とかがありました。
        この不揮発性SOT-MRAMメモリを市場に投入するには、さらにいくつかの開発が必要である。
        AIブームで進行する第4次“熱危機”、スピン利用で消費電力が1000分の1に [nikkei.com]
        このあたり読みたいんですが、脱会してしまったので読めない。
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        SOT-MRAMはかなり有望な技術だし、L1は無理にしてもL3キャッシュなら代替できる性能に近づいてます。
        ただし、それでSRAMを置き換えられるかというと難しい。なにせSRAMに比べてキャッシュ用途での利点が無いから。
        キャッシュだとNVメモリの利点を生かしきれません。
        保持電力が低いと言ったって、それが有効になる用途だと今のSRAMキャッシュでも電力停止したり、保持電力ぎりぎりまで電圧下げてリーク削減したり、既に対策があります。
        それに対して、SOTで削減したと言ってもSRAMより書き込み時の電力が数倍大きいのは解消する目途が無いし、速度もSRAMには及ばない。
        追加の製造コスト払ってまでわざわざSRAMから乗り換える理由が見えないのが現状です。
      - Re: (スコア:0)
        
        by Anonymous Coward
        
        じゃあ386時代みたいに外付けスロットキャッシュメモリとして使えば冷却は楽になるんじゃ。
        （システム）ストレージドライブ用フラッシュメモリもあれだけ高熱を発するから内蔵化困難なのだし（実際にはコントローラーの発熱が大きいらしいが）。
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        外付けは遅い。CPU外まで高速バス作る技術的なハードルも高い。
    - Re: (スコア:0)
      
      by Anonymous Coward
      
      なるほど。そういうことか。
      1GBもあれば電力消費も多いだろうし。
      それにしても、メインメモリが8GBとかの現状で、+1GBというのは無視できないな。
      キャッシュではなく、メインメモリの一部として使った方がいいんじゃね？
      というのと、お高いのでしょう？　という気がする。
      全コアプロセッサに載るんだろうか？
      - Re:ついにMRAM？ (スコア:2)
        
        by 90 (35300) on 2023年04月16日 17時56分 (#4445203) 日記
        
        数年内にそのキャッシュメモリの方を実装上はメインメモリとしてDRAMはswapにするロードマップが見える気がしません? 高速CPUと低速CPUとサウスブリッジと磁気コアMRAMを高密度基板に乗せて……VLSI以前の時代にそんな感じのパッケージをIBMが"マイクロ-ミニチュア"方式と呼んで推していたとか聞いたことがありますが……
        
        シェア
        
        親コメント
        
        Re: (スコア:0)
        
        by Anonymous Coward
        
        多分低価格帯向けにはその手の大容量キャッシュなしになると思う。中ランクがその手のキャッシュあり高価格は両方選べるみたいな。
        高価格帯のXeonだとオンパッケージでHBM載ってたりする。HBMをメインメモリにしてDDRをスワップにするのとDDRをメインメモリにしてHBMをキャッシュにするのの二択らしい。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  検索すると2024年には市場規模が40倍になるなんて威勢のいい2020年の記事が出てくるけど目標は達成できそうなんだろうか
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    Meteor Lakeに載れば、余裕で達成できそうな気がする。
確実に効果を出さないと (スコア:0)

by Anonymous Coward on 2023年04月16日 13時29分 (#4445151)

「L4キャッシュは無効にしたほうが早い」が初代機で定番になり、悪名がつく気がする。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  あれだよ、ベンチと一部ゲームでは有効にすると速くなるが、殆どの環境では遅くなる。
  もしくは、すぐに熱くなって性能が打ち止めに、液冷か窒素なら速いとか。
- Re: (スコア:0)
  
  by Anonymous Coward
  
  多重下請け構造の如く、
  CPU「L1キャッシュが覚えるから俺は覚えなくてヨシ！」
  L1「L2キャッシュが覚えるから俺は覚えなくてヨシ！」
  L2「L3キャッシュが覚えるから俺は覚えなくてヨシ！」
  L3「L4キャッシュが覚えるから俺は覚えなくてヨシ！」
  L4「CPUが何とかするから俺は覚えなくてヨシ！」
  と無責任構造になりそう。
  - Re:確実に効果を出さないと (スコア:1)
    
    by Anonymous Coward on 2023年04月16日 19時19分 (#4445230)
    
    キャッシュ階層には2種類あります。
    親分が覚えているものは子分も覚えている方式と親分が覚えていないといけないことを親分が、親分が覚えきれない分を子分が覚える方式です。
    当然前者のほうが容量上無駄が出るが高速で後者のほうが容量を無駄なく使えるが低速です。
    必然的にパソコン向けCPUメーカー大手の青い方は前者を緑の方は後者を使っていたのですがまあ青い方も音を上げて後者にしましたね。
    
    シェア
    
    親コメント
  - Re:確実に効果を出さないと (スコア:1)
    
    by shesee (27226) on 2023年04月17日 1時17分 (#4445338) 日記
    
    それでもメモリさんが何とかするから、動いてはいるという悪夢。
    
    シェア
    
    親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    それってまぁ、2番目が全責任を引き受けて腹切ればトップの体面と組織自体は守れるっていう日本人の叡智なんだけどね。
    2番目が責任取らないどころかトップの後釜を狙ったり下に責任を押し付けるようなことをやらかすから全員無責任って状態になったんだけど。

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

メモリボトルネックを解消するためかな (スコア:1)

Re:メモリボトルネックを解消するためかな (スコア:1)

Re: (スコア:0)

Re:メモリボトルネックを解消するためかな (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:メモリボトルネックを解消するためかな (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:メモリボトルネックを解消するためかな (スコア:1)

ロジックICの多層化って出来ないの？ (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:ロジックICの多層化って出来ないの？ (スコア:1)

Re: (スコア:0)

Re:ロジックICの多層化って出来ないの？ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re:ロジックICの多層化って出来ないの？ (スコア:2)

Re: (スコア:0)

Re:ロジックICの多層化って出来ないの？ (スコア:1)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

髭剃りの前例にならうと (スコア:0)

Re: (スコア:0)

ついにMRAM？ (スコア:0)

Re: (スコア:0)

Re:ついにMRAM？ (スコア:2)

Re:ついにMRAM？ (スコア:1)

Re:ついにMRAM？ (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:ついにMRAM？ (スコア:2)

Re: (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

確実に効果を出さないと (スコア:0)

Re: (スコア:0)

Re: (スコア:0)

Re:確実に効果を出さないと (スコア:1)

Re:確実に効果を出さないと (スコア:1)

Re: (スコア:0)