“Fermi”を採用したGF100の機能をデモ画面でチェックする(1/3 ページ)

» 2010年01月19日 10時30分 公開
[鈴木淳也(Junya Suzuki),ITmedia]

 米NVIDIAは1月17日(現地時間)、「Fermi」の開発コード名で呼ばれていたアーキテクチャを採用した最新GPU「GF100」の概要を公開した。2010 International CESのリポートでもGF100のライブデモが紹介されていたが(詳しくはCESでもPCパーツは忘れずに──最新チップセット搭載マザーとGF100にがぶり寄りを参照のこと)、製品は2010年第1四半期にも登場する予定だ。このGF100に実装される新機能について、デモ画面などを交えて見ていこう。

 なお、GF100という名称も開発コード名で、“GeForce GF100”のような製品名ではない。従来の“GT200”に相当すると考えればいいだろう。ちなみに、“GF”とは「GeForce Fermi」の頭文字をとったもので、正式な製品の型番は、後日公開される。

GF100のパフォーマンスはGT200世代の8倍に

 今回公開された資料には、GF100のダイ写真とブロックダイヤグラムが含まれる。512基のCUDAコア、16基のジオメトリユニット、4基のラスターユニット、64基のテクスチャーユニット、48基のROP(ラスターオペレーション)ユニットが実装され、グラフィックスメモリには384ビットのGDDR5メモリインタフェースで接続する。

 GPU内部は4つのGPC(Graphics Processing Cluster)に分かれ、各GPCは4つのSM(Streaming Multiprocessor)を持ち、ラスターエンジンに接続されている。1つのSMは32基のCUDAコアで構成され、共有メモリと1次キャッシュメモリに接続する。

 CUDAコア数と共有メモリの容量はGT200世代から増強されている。1次キャッシュメモリではレジスタ、命令、ロード/ストアなどの情報を保持し、2次キャッシュメモリではバーテックス、SM、テクスチャ、ROPなどのデータを保持する。これらキャッシュメモリを活用することで処理がGPUのダイ内部で完了し、より高いパフォーマンスを得ることができる。SMやGPCでデータを共有できる2次キャッシュメモリの容量が増えたことでデータの再利用が容易になり、また、一般的なロード/ストアが高速化されたことで物理演算やレイトレーシングなどの処理で大きなメリットを得ることができるという。

NVIDIAが公開したGF100のダイ画像(写真=左)と、ブロックダイヤグラム(写真=中央)。GF100は16のSMに分割され、各SMには32個のCUDAコアが搭載される(写真=右)

高速になった処理能力を“滑らかな”描画に使う

 GF100でどのような処理が可能になるのかを、具体的に見ていこう。GF100の特徴として、パフォーマンスの向上だけでなく、これまでにないリアルなジオメトリ処理や映像品質の向上などが挙げられる。世代を経るごとにリアルな映像表現が可能になったGPUの世界だが、一方で、動きの激しいアクションや多数のオブジェクト書き込みに対応するため、リアルさと性能のトレードオフが発生している。例えば、3Dゲームの静止画像を見るとオブジェクトの頂点が見えてしまっていたり、布地の表現などが簡素化されてしまっていたりと、画質の“アラ”に気がついてしまう。髪の毛の表現なども難しく、登場人物が帽子やヘルメットなどをかぶっていることが多いのも、“アラ”を隠すためのテクニックといえる。

 GF100がサポートするDirectX 11では、いくつかの点で大きな進歩がある。1つはDirectX 9やDirectX 10の世代でサポートしていなかった、GPUでのジオメトリ処理だ。あらゆる処理をGPU側で行うというGPUコンピューティング的な考えがDirectX 11世代の特徴だが、これにより、CPUに負荷をかけずに、かつ、CPUをボトルネックにすることなく、GPUでジオメトリ処理をフル稼働させることが可能になる。NVIDIAによれば、DirectX 11のサポートによりGF100では従来比8倍のパフォーマンスが実現できるという。

3画面を用いた3D Visionによるレーシングゲームのデモ。立体視にはシャッター式の専用メガネを使用する

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー