
GPU業界にとって興味深い展開として、PCIe接続メモリはGPUメモリの容量と性能に対する考え方を変える可能性があります。韓国のKAIST研究機関の支援を受けるPanmnesia社は、GPUがPCIeインターフェースを介して外部メモリリソースを利用できるようにするCompute Express Link(CXL)と呼ばれる技術に取り組んでいます。
従来、RTX 4060のようなGPUはオンボードVRAMによって制限されており、AIトレーニング、データ分析、高解像度ゲームなど、メモリを大量に消費するタスクではパフォーマンスがボトルネックになる可能性があります。CXLは高速PCIe接続を活用し、外部メモリモジュールをGPUに直接接続します。
おすすめ動画
この方法は低レイテンシのメモリ拡張オプションを提供し、パフォーマンス指標は従来の方法と比較して大幅に向上しています。報告によると、この新技術は2桁ナノ秒のレイテンシを実現しており、これは標準的なSSDベースのソリューションと比較して大幅な短縮となります。

さらに、この技術は従来のRAMだけに限定されません。SSDはGPUメモリの拡張にも使用でき、汎用性と拡張性に優れたソリューションを提供します。この機能により、RAMの速度とSSDの容量を組み合わせたハイブリッドメモリシステムを構築でき、パフォーマンスと効率性をさらに向上させることができます。
CXLはPCIeリンク上で動作しますが、この技術をGPUに統合するのは容易ではありません。GPUには、DRAMやSSDエンドポイントをサポートするために必要なCXLロジックファブリックとサブシステムが不足しています。そのため、CXLコントローラーを単純に追加するだけでは実現不可能です。
GPUキャッシュおよびメモリシステムは、統合仮想メモリ(UVM)を介した拡張のみを認識します。しかし、Panmnesiaによるテストでは、ページフォールト発生時のホストランタイム介入によるオーバーヘッドとページレベルでの非効率的なデータ転送が原因で、テスト対象GPUカーネルの中でUVMのパフォーマンスが最も低いことが明らかになりました。
この問題を解決するため、Panmnesiaは主要なCXLプロトコルをすべてサポートし、統合コントローラに統合された一連のハードウェアレイヤーを開発しました。このCXL 3.1準拠のルートコンプレックスには、PCIe経由の外部メモリ用の複数のルートポートと、ホスト管理デバイスメモリデコーダを備えたホストブリッジが含まれています。このデコーダはGPUのシステムバスに接続してシステムメモリを管理し、ロード/ストア命令を介して拡張ストレージに直接アクセスできるようにすることで、UVMの問題を効果的に解消します。
この技術の影響は広範囲に及びます。AIや機械学習においては、メモリを増設できることで、より大きなデータセットをより効率的に処理し、学習時間を短縮し、モデルの精度を向上させることができます。ゲームにおいては、開発者はVRAMの制限に縛られることなく、グラフィックスの忠実度と複雑さの限界を押し広げることができます。
PanmnesiaのCXLテクノロジーは、データセンターやクラウドコンピューティング環境において、既存のインフラストラクチャをコスト効率よくアップグレードする方法を提供します。PCIe経由でメモリを追加することで、データセンターは大規模なハードウェアのオーバーホールを必要とせずに計算能力を強化できます。
Panmnesiaは大きな可能性を秘めているものの、業界全体での普及には大きな課題に直面しています。AMDとNvidiaの最高級グラフィックカードはCLXをサポートしておらず、今後もサポートされない可能性があります。また、業界関係者がGPU向けに独自のPCIe接続メモリ技術を開発する可能性も高いでしょう。とはいえ、PanmnesiaのイノベーションはGPUメモリのボトルネック解消に向けた一歩であり、ハイパフォーマンスコンピューティングとゲーミングに大きな影響を与える可能性があります。