私の 4K 100 フレーム! NVIDIA GeForce RTX 4090 グラフィックス カード テスト レポート

NVIDIA GeForce RTX 4090

創造的な武道とゲームの魔法、私は NVIDIA GeForce RTX 4090 です。NVIDIA の新世代の Ada Lovelace GPU アーキテクチャは、最初のフラッグシップ カードの後に​​正式に発売され、プロセスのアップグレードとクロックの急上昇だけでなく、また、Tensor コアと RT コアのアップグレード、新世代の DLSS 3、AI フレーム フィリング テクノロジにより、GPU アクセラレーションの時代が開かれます。同時に、AV1 デュアル エンコーディング エンジンを搭載しています。ゲーマーの夢である 4K 100 フレームを実現するだけでなく、3D レンダリング、作成、シミュレーション、コンピューティングの専門家でもあります。この新世代のカードをアーキテクチャ、仕様、パフォーマンスの観点から見てみましょう。エクスペリエンスをアップグレードします。

新世代のフラッグシップ カード Ada Lovelace、NVIDIA GeForce RTX 4090 に出会った後

NVIDIA の新世代 Ada Lovelace マイクロ アーキテクチャ、RTX 40 シリーズ、最初のフラッグシップ GeForce RTX 4090 は、明日 10 月 12 日に正式に販売され、価格は 1599 ドルです。その後、GeForce RTX 4080 16GB と 12GB の 2 つの新しいカードも 11 月に発売され、価格は 1199 ドルと 899 ドルになります。

エイダ・ラブレス – 量子の飛躍。

この世代の NVIDIA は、TSMC 4N カスタム プロセスと Ada Lovelace マイクロ アーキテクチャに切り替わり、GPU がより多くの SM ユニットを搭載できるようになり、CUDA、Tensor コア、RT コアなどの数がさらに増加し​​ました。 TMU や ROP などのユニットの数が増加し、2.5 GHz ブーストの超高クロックと相まって、RTX 4090 は RTX 3090 Ti を上回る 2 ~ 4 倍の高速パフォーマンスを実現します。

GeForce RTX 4090 には、16,384 個の CUDA コア、512 個の第 4 世代 Tensor コア、128 個の第 3 世代 RT コア、2.52 GHz のブースト クロック、24 GB の GDDR6X メモリが搭載されています。プロの制作、レンダリング、そして主力ゲーマーのニーズを同時に満たす超クレイジーな仕様を備えたこの超クレイジーなグラフィックス カードの価格は NT$ 56,990 です。

GeForce RTX 4080 には 2 つの仕様があり、RTX 4080 16GB は CUDA 9728、Tensor Core 304、RT Core 76、2.51GHz Boost クロックを備え、NT$ 42,990 から始まります。RTX 4080 12GB は CUDA 7680、240 Tensor コア、60 RT コア、2.61 GHz ブースト クロックで、NT$31,990 から始まります。

RTX 4090、RTX 4080 スペックシート。
RTX 4090 は RTX 3090 / Ti 製品を置き換え、RTX 4080 は RTX 3080 12GB / Ti 製品を置き換えます。

米ドル価格の観点から見ると、この世代の RTX 4080 の方が高価であるのは事実ですが、NVIDIA が提供する現在のパフォーマンス基準によれば、RTX 4090 は RTX 3090 Ti より 2 ~ 4 倍高速です、一方、RTX 4080 は RTX 3080 Ti の時間より 2 ~ 4 倍高速です。したがって、パフォーマンスと価格の点で、RTX 4090 の価格/パフォーマンス比は RTX 3090 Ti よりも明らかに優れています。たとえ RTX 4080 12GB のパフォーマンスが RTX 3090 Ti と競合できるとしても、この世代の RTX 4080 の価格はそれに応じて上昇します。

最後に、なぜ NVIDIA は各世代のパフォーマンスをこれほどまでに 2 ~ 4 倍向上させることができるのでしょうか? プロセスの改善とクロックの高速化に加えて、より重要なのは、Ada Lovelace Engine の新アーキテクチャによってもたらされる新技術 SER、Displaced Micro-Mesh Engine、Opacity Micro Map、さらにはオプティカル フロー アクセラレータと DLSS 3 の AI です。補足フレーム、これは NVIDIA の最も優れた技術力です。

エイダ・ラブレスの主要テクノロジー。

Ada Lovelace: プロセス クロックのアップグレード、高度なレイ トレーシング、デュアル AV1 エンコードを備えた完全なコア AD102 GPU

Ada Lovelace のマイクロ アーキテクチャ。トランジスタ数は 763 億に達し、合計 12 セットの GPC、72 セットの TPC、および 144 セットの SM ユニットを備えています。つまり、合計 18432 個の CUDA、576 個の CUDA があることを意味します。 Tensor コアと 144 の RT コア。この世代の現在の主力製品である RTX 4090 は、SM ユニット数が 128 未満にすぎません。これは、RTX 4090 Ti が将来的に現在の主力製品を超える可能性がまだあることを意味します。

SM ユニットの改良に加え、Ada には GDDR6X 高速メモリ、AI 推論パフォーマンスを向上させる第 4 世代 Tensor コア、レイ トレーシングの品質を向上させる第 3 世代 RT コアも搭載されています。 AV1 ハードウェア エンコーディングをサポートする第 8 世代のオーディオおよびビデオ エンコーダー。DLSS 3 から 2 ~ 4 倍のパフォーマンス アップグレードが行われます。

AD102 の全身 GPU ブロック図。

ADA Gen 4 Tensor コア

Tensor Core は、ディープ ラーニングのトレーニングと推論に必要な行列計算の画期的なパフォーマンス向上をもたらす高性能コンピューティング コアです。コアは「行列の乗算」と「累積算術演算」を目的としています。AI と HPC の適用において、デザインは非常に重要な役割を果たします。

Ada は、Ampere アーキテクチャと比較して、FP16、BF16、TF32、INT8、INT4 の 2 倍の Tensor TFLOPS パフォーマンス向上をもたらします。同時に、Hopper アーキテクチャの FP8 Transformer Engine を追加すると、1.3 ペタ FLOPS の Tensor コア パフォーマンスを提供できます。

エイダ・ラブレス。

ADA 第 3 世代 RT コアと新しい光学トラッキング テクノロジーを備えた第 3 世代 RT コア

Ada アーキテクチャにより、Ray-Triangle Intersection の出力パフォーマンスが 2 倍高速になります (以前の Ampere と比較して)。新しく追加された「 不透明マイクロマップ エンジン " を使用すると、オブジェクトにマイクロトライアングルの仮想メッシュを持たせることができます。これを使用して、オブジェクトの不透明な状態 (不透明、透明、不明の 3 つの状態) を記録することができます。

ADA の不透明度マイクロ マップ エンジンにより、オブジェクトが仮想メッシュの不透明度状態を記録できるようになります。

レイが不透明な表現までトレースされた場合、「ヒット」が記録されて返され、それが透明な領域の場合、レイ トレーシングは直接無視され、未知の領域が引き渡されます。 SM は、様式化されたシェーダーを通じて光線の交差を処理します。Opacity Micro マップ エンジンは、不透明マスク、つまり重心座標を使用して「光線/三角形」の交差を報告する正三角形マスクを評価するために使用されます。

Opacity Micro マップ エンジンを通じて、ジオメトリのアルファ テストを直接実行できるため、シェーダーのアルファ計算の負担が軽減されます。この機能により、開発者はより複雑な形状、シダ、フェンスなどの半透明のオブジェクトを描画できるようになります。およびその他のオブジェクト、および Ada RT コアを介して効率的なレイ トレーシングを実現します。

ゲーム画面の煙のように、Opacity Micro Map Engine テクノロジーを使用すると、レイ トレーシングの複雑さを軽減できます。
上の図の左側が元のレイ トレーシング量です。色が暗いほど、より多くの光が計算されますが、煙のエフェクトがかなり半透明であることは明らかですが、全体的なパフォーマンスは低下します。写真の右側は 不透明度マイクロマップ適用後に必須 エンジン。レイ トレーシングの計算量が増加するため、複雑なオブジェクトや透明効果を扱う際のレイ トレーシングのパフォーマンスが向上します。

さらに、Ada RT Core は ” 置き換えられたマイクロメッシュ エンジン " は、ますます複雑になる幾何学的シーン、レイ トレーシングの計算負荷、BVH データに必要なメモリ/ストレージ容量の削減を解決します。変位マイクロメッシュは、幾何学的空間の相関関係を使用して、参照三角形点と変位方向を含む複雑なジオメトリを表現します。

このようにして、レイ トレーシング中に多数の BVH 構造の生成を回避でき、BVH トラバーサルのパフォーマンスをより効果的にすることができ、既存のマイクロメッシュ LOD をレンダリングに使用できます。ラスター化中の元のジオメトリ。つまり、ディスプレイスド マイクロメッシュ エンジンは、単純な BVH、データム三角形点、ディスプレイスメント方向マップを使用して、非常に詳細な幾何学的レイ トレーシングを作成できます。

レイ トレーシングを使用してカニの甲羅を詳細にレンダリングするには、カニを 1024 個の三角形に分割し、BVH アルゴリズムを使用して各位置の光の変化を計算する必要があります。非常に大量の BVH データとパフォーマンスの損失。
Ada の変位マイクロメッシュ エンジンは、単純な BVH 計算のみが必要となるように、変位方向マップに 1 つの三角形を含む複雑な表面を追加し、変位方向マップを使用して光の変化を計算します。それぞれの場所で。

この世代のエイダには新しい ” シェーダー実行の並べ替え " (SER) 関数。シェーダーを動的に配置して光を処理し、実行上の利点を実現します。

簡単に言うと、シーンでレイ トレーシングを計算する場合、メイン レイから開始して遭遇するオブジェクトを計算し、その後、メイン レイによって生成された反射と周囲拡散によって 2 番目のレイ トレーシングが実行されます。 、しかし、2番目のレイトレーシングは厄介です。この状況の順序は、2 番目のレイ トレーシングのシェーダーのパフォーマンスの低下にもつながります。

つまり、SER はレイ トレーシングのシェーダーを最適化し、動作をより効率的にすることができます。

したがって、シェーダー実行の並べ替えがレイ トレーシング パイプラインに追加された後、2 番目のレイ トレーシングでヒットした同じシェーダーを並べ替えてグループ化できるため、レイ トレーシング シェーダーの効率が向上します。SER により RT シェーダーのパフォーマンスが 2 倍向上し、サイバーパンク 2077 がオーバードライブ モードで実行されている場合、SER の結果ではパフォーマンスが 44% 向上しました。

この図は SER 機能をよりよく説明しています。 
最初の光線追跡の計算は逐次的な状態ですが、2 番目の光線追跡には反射、屈折、拡散が含まれます。したがって、シェーダーは計算の乱れにより最高のパフォーマンスを発揮できません。SER によって最適化できます。パフォーマンスが大幅に向上しました。

大加速時代の DLSS 3 とオプティカル フロー アクセラレータ

ゲームには豊富なオブジェクト、より複雑なジオメトリ、美しい世界、物理的にリアルなレイ トレーシングなどのテクノロジーのスタックが含まれているため、従来の GPU レンダリング パフォーマンスでは現代のゲームのニーズに追いつくことができないため、NVIDIA はAI ディープ ラーニング アクセラレーションのための DLSS テクノロジーの開発により、さまざまな GPU メーカーが独自のアクセラレーション テクノロジーを発表できるようになり、GPU アクセラレーションの時代が正式に到来しました。

2018 年に「Battlefield V」がリリースされたとき、インポートされたレイ トレーシングは 1 ピクセルあたり 39 個のレイ トレーシングしかありませんでしたが、4 年後の「Electric Rider 2077」では 1 ピクセルあたり 635 個のレイ トレーシングに達することができます。非常に効率的です。しかし、大きな変化がありました。

RTX 40 の独自の「DLSS 3」は、DLSS 2 の技術をベースに、オプティカル フロー アクセラレータの機能である「AI 補完フレーム」の概念を追加したものです。オプティカル フローは、連続画像内の各ピクセルの動きの方向と量を計算するためにコンピューター ビジョンで使用されるオプティカル フロー手法です。

DLSS 3 テクノロジーでは、ゲーム エンジンが以下を提供する必要があります。低解像度のレンダリング画像とモーション ベクトル、DLSS の深層学習ネットワークを介した高解像度画像の推論、および画像をオプティカル フロー アクセラレータに提供して、各ピクセルの移動方向と移動量を決定し、最後に光学マルチフレーム生成を経てAI補助フレーム画像を生成します。

DLSS 3 は、オプティカル フロー アクセラレータを使用して、オプティカル フローの移動方向と画像ピクセルのベクトルを計算し、オプティカル マルチ フレーム生成の AI を使用して、AI である Frame2 の画像を推定します。現地語による補足フレーム。
AI 補完フレームにオプティカル フロー アクセラレータが必要な理由は何ですか? 
主な理由は、上の画像のオブジェクトはゲーム エンジンのモーション ベクトルを通じて動きの方向を知ることができますが、地面の影がオブジェクトではない場合、その動きベクトルは影が失われ、フレームを補完するときに問題が発生します。
エンジンのモーション ベクトルとオプティカル フローのピクセル ベクトルを組み合わせることで、より安定した AI 補完フレームを生成できます。

ゲームが DLSS 3、フレーム生成をオンにし、Reflex による遅延を軽減すると、ゲーム画面の Frame1 のピクセルの 1/4 がゲームによってレンダリングされ、残りの 3/4は DLSS 超解像度によって推定されたピクセルになり、次の A ピクチャ Frame2 に進みます。これは DLSS Frame Generation によって生成されるため、Frame1 Frame2 の合計 7/8 のピクチャが AI によって生成されます。 DLSS 3 の。

フレーム 1 は低解像度画像 (1/4) をレンダリングするためにエンジンによってレンダリングされ、残りの 3/4 の画像は DLSS によって生成され、その後、フレーム 2 は DLSS フレーム生成によって完全に描画されます。 2 つのフレームの合計 7/8 が DLSS によって生成されます。DLSS の AI 推論が誕生しました。

DLSS 3 は、ネイティブ レンダリングと同様の画質を維持しながら、AI フレームの補完を通じてゲーム パフォーマンスを 2 ~ 4 倍向上させることができますが、ゲーム全体の遅延も増加するため、NVIDIA は DLSS 3 にReflex テクノロジーを使用すると、レンダー キューをキャンセルすることで、CPU の処理が完了した後、GPU がすぐにレンダリングを引き継ぎ、システム レイテンシーの短縮を実現できます。

したがって、DLSS 3 は、第 4 世代 Tensor コア、オプティカル フロー アクセラレーター、および AI のトレーニングに NVIDIA が使用するスーパーコンピューターを利用して、AI 超解像度、フレーム生成、ReFlex などのテクノロジーを組み合わせ、次世代ゲーマー向けの 4K100fps の究極のパフォーマンス。

DLSS 3 フルスタック。

DLSS 3 では、フレーム生成で望ましいパフォーマンスの向上を実現するには、Ada のオプティカル フロー アクセラレータ ハードウェアが必要です。そのため、DLSS 3 は現在 RTX 40 シリーズの独占的な機能であり、将来のゲームでも DLSS 3 をサポートする予定です。 DLSS 2 と互換性があること。DLSS Super Resolution と NVIDIA Reflex は GTX 900 以降でサポートされています。

DLSS 3 = 超解像度 フレーム生成 リフレックス。 
元の DLSS 2 には超解像度のみが必要です。

デュアル AV1 オーディオおよびビデオ エンコーディング、Portal RTX が 11 月に発売

上記のアップグレードに加えて、Ada Lovelace にはデュアル第 8 世代 NVENC エンコーディング エンジンも搭載されており、主に AV1 のオーディオおよびビデオ エンコーディング機能が追加されています。デコードに関しては、第5世代NVDECはAmpereと同じです。結局のところ、NVDEC はすでにあらゆる種類のオーディオとビデオをデコードする機能を完全にサポートしています。

エイダ・ラブレス。

RTX 40 シリーズには、主に AV1 オーディオおよびビデオ エンコーディングの機能を含む、デュアル第 8 世代 NVENC エンコーディング エンジンが搭載されています。これは将来の主流のオーディオおよびビデオ ストリーミング エンコーディングでもあり、H.264 よりも優れた信号対雑音比を持っています。ビットレートで比較すると、AV1 のイメージ画像は H.264 エンコードよりも優れています。

AV1 オーディオおよびビデオ エンコーディングは、より良い画質とパフォーマンスの向上を実現できます。これは、将来のストリーミングの主要なオーディオおよびビデオ エンコーディングでもあります。
左の AV1 と右の H.264 の同じ 8Mbps ビット レートでも、床の細部はかなり異なります (4K SBS 比較)。
同じ 8Mbps ビットレートの左 AV1、右 H.264、道路の質感の違いがはっきりとわかります (4K SBS 比較)。

デュアル第 8 世代 NVENC エンコード エンジンでは、ビデオ出力パフォーマンスを 2 倍向上させるために、DaVinci Resolve、Voukoder、Jianying などのビデオ編集ソフトウェアのサポートが必要です。RTX 40 デュアル エンコード エンジンはサポートされます。初めて。Adobe Premiere Pro は将来のアップデートを待つ必要があります。

たとえば、8K60 画像を記録する場合、パフォーマンスを向上させるために、それぞれが 7680 x 2160 の解像度を担当するデュアル エンコーダーを使用できます。

デュアルエンコードエンジン。

AV1 エンコードとデュアル エンコード エンジンに加えて、NVIDIA Omniverse は新しい DLSS 3 テクノロジーと、RTX Remix の神レベルのゲーム Mod 制作ツールもサポートしています。

ただし、プレイヤーの場合は、クラシック ゲーム Portal With RTX が 11 月に無料 DLC をリリースし、Vulkan RT 互換 GPU をサポートします。もちろん、最高のエクスペリエンスは RTX 40 と DLSS 3 を使用することです。

エイダのクリエイティブな焦点。
Portal With RTX は 11 月に無料 DLC をリリースします。RTX リミックスは間もなくリリースされます。

NVIDIA GeForce RTX 4090 Founders Edition グラフィックス カードは箱から出してすぐに使用可能/背面は前面のクラシックが再強化されたもの

Ada Lovelace カードの後、NVIDIA GeForce RTX 4090 創設バージョンは、Ampere 世代によって開拓された新しいグラフィックス カードの美的デザイン「裏が表」と「劣っているが優れている」GeForce を維持しています。ファウンダーズ エディションは、X フレーム用の頑丈で耐久性のあるアルミニウム合金フレームを特徴とし、プレミアム仕上げのための陽極酸化仕上げと金色のメタリック仕上げが施されています。

メディア エディション NVIDIA RTX 4090 ファウンディング エディション。
箱の中には特別なデザインが入っています。

フレーム内部は放熱フィンで満たされており、その内部は蒸気室となってGPUやVRAMの熱を放散し、廃熱は熱を介して放熱フィンに導かれますパイプ。この世代の RTX 4090 初期バージョンは、より大型の 116 mm、FDB、7 ブレード デュアル ファンを使用し、グラフィックス カードの厚さが 3 スロットに増加し、グラフィックス カードの長さが 30.48cm (12 インチ) に短縮されています。

この世代のベーパー チャンバーも最適化されており、ベーパー チャンバーが GPU とより均等に接触できるようにメモリ専用のカットアウトがあり、メモリのサーマル パッドが 1.5 に削減されています。熱伝導効果を高めるには mm。この世代のラジエーターは、最大 650W Qmax の冷却能力をサポートできます。

背面は従来の前面、RTX 4090、およびグラフィックス カード前面の貫通冷却エアフローです。
オリジナルの前面にも冷却フィンと背面ファンを備えた金属フレームが埋め込まれており、独特の美的デザインをもたらしています。

RTX 4090 は、PCIe 12 4 ピン (12VHPWR) 電源インターフェイスに完全に置き換えられ、1 つのラインで最大 600 W の電力消費を伝送でき、また、ライン全体がより美しくなります。新しいカードが取り付けられています。もちろん、初期バージョンでは 12VHPWR から 4 本の PCIe 6 2pin ケーブルも提供されます。

通常、変換には少なくとも 3 つの PCIe 6 2 ピンを接続することをお勧めします。新しい電源を購入する場合は、ATX12 V3.0 および EPS12V V2.92 仕様に準拠した新しい電源を選択することをお勧めします。このようにして、12VHPWR ケーブルがグラフィックス カードに必要な電力を供給できる限り、醜い大砲を片付けることができます。

RTX 4090 は電源に PCIe 12 4 ピン (12VHPWR) を使用します。
12VHPWR は 4 本の PCIe 6 2pin ケーブル (タワー) のアクセサリに含まれています。
プロフェッショナル向けの新しい電源は、ケーブル 1 本で RTX 4090 の電源ニーズを満たすことができます。

RTX 4090 ディスプレイ出力は、VRR、4K120Hz / 8K60Hz HDR をサポートする 1 つの HDMI 2.1a、および 12 ビット 4K240Hz HDR / 12 ビット 8K60Hz HDR およびその他の出力機能をサポートする 3 つの DisplayPort 1.4a DSC を提供します。同時に最大 4 つの画面出力を接続できます。

RTX 4090 ディスプレイ出力。

NVIDIA GeForce RTX 4090 クリエイティブ ビデオ出力、GPU レンダリング パフォーマンス テスト

このテストには、Adobe Premiere Pro 2020、DaVinci Resolve 18、Blender などのクリエイティブ テストが含まれており、ゲームは 2160p、1440p 解像度、フルエフェクト、e スポーツ、AAA ゲーム、ライティングでテストされます。パフォーマンスを追求してくださいゲームの概要を説明し、DLSS 3 の事前テストを追加して、プレーヤーが RTX 4090 が強力である (非常に高価である) 理由を完全に理解できるようにします。

最も強力なグラフィックス カードは、NVIDIA GeForce RTX 3090 Founders Edition です。

テストプラットフォーム
プロセッサー: Intel Core i9-12900K
マザーボード: ASRock Z690 PG Velocita
メモリ: CORSAIR DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz
グラフィックス カード: NVIDIA GeForce RTX 4090 Founding Edition、NVIDIA GeForce RTX 3090 Founding Edition
システムディスク: Solidigm P41 Plus 1TB PCIe 4.0 SSD
クーラー: ASUS ROG STRIX LC II 280mm
電源:Seasonic PRIME PX-1000
オペレーティング システム: Windows 11 Pro 21H2 64 ビット、サイズ変更可能な BAR オン
ドライバーバージョン: NVIDIA 521.90

GPU-Z NVIDIA GeForce RTX 4090 情報、4nm プロセスの AD102 GPU、16384 レンダリング CUDA コア、24576 MB GDDR6X (Micron) メモリを表示できます。GPU はクロックが 2235 MHz にプリセットされ、ブーストが 2520 MHz です。 MHz。

GPU-Z.
DXVA チェック デコーダ テスト。現在、すべてのビデオ コーデックはさまざまな解像度のデコードをサポートしています。

DaVinci Resolve 18 は、強力な色補正と特殊効果機能を備えた純粋に GPU アクセラレーションのビデオ編集プログラムであり、CUDA コア コンピューティングを直接使用しているため、ビデオ クリップの再生と出力は非常に優れたパフォーマンスを発揮します。ベータ版には、NVIDIA AV1 エンコーディングのサポートが含まれています。

DaVinci Resolve 18.

このテストは 2 つの部分に分かれています。最初のテスト プロジェクトは 4K Blackmagic RAW 画像を使用し、それぞれに Wedding_Heavy_Styles タイムラインがあります。このビデオは、OFX などの Resolve エフェクトを多用しており、光線 / グロー / スケッチなど、かなりハイスタイルな映画ジャンルを出力しています。

Bride_FaceRefine_Selective_Color は顔追跡に Face Refinement を使用し、メインの花嫁を色でハイライトします。50% リタイムとオプティカル フロー – Enhanced Better はどちらもオプティカル フロー テクノロジーを使用して、画像の速度を 50% 削減します。

SuperScale2x 4K ソースは、4K ProRES ソース ビデオを使用して、被写体を 2 倍ズームインした 4K ビデオ出力を生成します。SuperScale4x HD_Source は HD H.264 ソース ビデオを使用し、Resolve Super Scale を使用して 4K ビデオを出力します。

RTX 4090 のこの部分のパフォーマンスは、特にオプティカル フロー テストにおいて非常に優れていると言えます。出力時間が 2 倍近く節約され、クリエイターはより高速な出力パフォーマンスを得ることができます。

DaVinci Resolve 18、時間は短いほど良い。

2 番目のテストは、デュアル NVENC エンコーディングを使用した AV1 および HEVC エンコーディング テストです。テスト プロジェクトは、Blender Open Movie プロジェクト「Tears of Steel」の 44 秒の短編フィルムで、8K Prores442HQ 30FPS および 4K Prores422HQ 30FPS ビデオがあり、HEVC、AV1 エンコーディングの出力パフォーマンスをテストするために利用できます。

出力設定は主に NVIDIA エンコーダを使用、品質: 80000 Kb/s に制限、エンコーディング プロファイル: Main
レート制御: 固定ビットレート、プリセット: 高速、チューニング: 高品質、2 パス: 無効およびその他の出力設定。

パフォーマンスの点では、4K30 出力時の RTX 4090 のパフォーマンスは RTX 3090 のパフォーマンスとあまり変わりませんが、8K 出力を処理する場合、RTX 4090 のデュアル エンコード エンジンにより HEVC 出力時間が 2 倍高速化されます、AV1 エンコードの速度も非常に速いため、ビデオ編集ソフトウェアが RTX 40 デュアル エンコード エンジンをサポートしている限り、優れたエンコード パフォーマンスの向上を実現できることがわかります。

DaVinci Resolve 18 デュアル NVENC エンコード テスト、短いほど良い。

Adobe Premiere Pro 2022 自社開発の Mercury Playback Engine GPU アクセラレーションを使用するビデオ編集ソフトウェアは、GPU のエンコード エンジンを使用して画像出力速度を高速化できます。テスト プロジェクト 1 は、同社の 1080p60fps のすぐに使えるビデオです。BigMix4K プロジェクトは、FinalAdjusted_MPE 1920×1080 画像の 3 セグメントを使用して、H.264 および HEVC 形式出力用の 4K タイムラインを形成します。

(テスト済みの Premiere Pro 2022 はまだ RTX 4090 デュアル エンコーディング機能をサポートしていません。)

RTX 4090 はパフォーマンスの点で RTX 3090 よりも速い出力速度を持っていますが、サポートされている DaVinci Resolve とは異なり、出力時間を大幅に短縮できます。したがって、このテストは主に参考のために提供されています。

Adobe Premiere Pro 2022.
Adobe Premiere Pro 2022 の出力、短いほど優れています。

ブレンダー は、モデリング、リギング、アニメーション、シミュレーション、レンダリング、合成、モーション トラッキングなど、さまざまな 3D タスクをサポートするクロスプラットフォームのオープンソース 3D オーサリング ツールです。テストには、Blender Benchmark 3.3.0 を使用して、デモ プロジェクトのレンダリング作業をテストします。

Blender Benchmark 3.3.0 テストでは、3 つのシーンで RTX 4090 の 1 分あたりのサンプル数 (効率) が RTX 3090 の約 2 倍となっており、3D の作成が容易であることがわかります。エイダ・ラブレスの強さ。

Blender、パフォーマンスが高ければ高いほど良いです。

V-Ray ベンチマーク Chaos Group によって開発されました。V-Ray は物理法則に基づいて設計されたレイ レンダリング ソフトウェアで、CPU と GPU それぞれのレイ トレーシングのレンダリング画像に対して計算テストを行うことができます。

V-Ray GPU RTX であれ CUDA 計算であれ、RTX 4090 は Vpath 数の 1.9 倍で RTX 3090 を上回りました。

V-Ray ベンチマーク、パフォーマンスが高いほど優れています。

SPECviewperf 2020 プロのアプリケーションによって開発された標準的な描画パフォーマンス テスト ツールに基づいており、3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks などのさまざまなプロのコンピュータ グラフィック ソフトウェアやその他の描画テストをテストします。およびエンジニアリング シミュレーション。

テストは解像度 1920 x 1080 で、結果は FPS です。このパフォーマンスは、使用されるツールに関連しています。プログラムやテストの状況にもよりますが、RTX 4090 のパフォーマンスは約 1 ~ 2.9 倍向上します。

SPECviewperf 2020、FPS が高いほど優れています。

NVIDIA GeForce RTX 4090 – 3DMark ベンチマーク パフォーマンス テスト

3DMark Fire Strike パフォーマンス テストは、主流の DirectX 11 API テスト シナリオであり、それぞれ 1080p、Extreme 1440p、Ultra 2160p のパフォーマンスをテストします。

RTX 4090 の Fire Strike スコアは 54174 で、Ultra Graphics スコアは RTX 3090 より 2 倍、Extreme は 1.8 倍、FHD は 1.6 倍でした。

3DMark Fire Strike、スコアが高いほど良いです。

3DMark Time Spy は、DirectX 12 API で設計されたテスト シナリオです。これも AAA ゲーム レベルにロックされており、それぞれ 1440p と Extreme 2160p のパフォーマンスをテストします。

RTX 4090 は Time Spy で 32638 ポイントの合計スコアを達成しました。これは、RTX 3090 のそれぞれ 1.8 倍と 1.9 倍です。

3DMark Time Spy、スコアが高いほど優れています。

レイトレーシングテスト用 3DMark ポート ロイヤルAAA ゲームのシーンにレイ トレーシングを追加すると、新世代の GPU がハードウェア レイ トレーシングを高速化する能力がテストされます。同時に、XDR テストは DirectX Raytracing API を使用した機能テストでもあります。

DLSS がなくても、RTX 4090 は非常に驚くべきレイ トレーシング パフォーマンスを発揮します。Port Royal は 119 FPS と XDR 138 FPS を達成します。RTX 3090 と比較すると、1.95 倍と 2.44 倍のパフォーマンス向上ももたらします。

3DMark Port Royal、高いほど良い。

3DMark DLSS 機能テスト DLSS 3 および DLSS 2 のパフォーマンス テストを実行できます。3840 x 2160 およびパフォーマンス アクセラレーションに設定すると、RTX 4090 は DLSS 2 で 138 FPS / 2.3 倍のパフォーマンス向上を実現できます。DLSS 3 が AI を使用した後、画像を生成すると、最大 193 FPS / 3.3 倍のパフォーマンス向上が可能です。

将来的には、このゲームを使用して DLSS 3 のパフォーマンスを測定します。

3DMark DLSS 機能テスト、高いほど優れています。

NVIDIA GeForce RTX 4090 – 4 つの e スポーツ ゲームのパフォーマンス テスト

4 つの e スポーツ ゲーム: 「Rainbow Six: Siege」、「League of Legends」、「APEX Heroes」、「CS:GO」などはいずれも高度なスキル、チームワーク戦術的な対戦シューティング、DOTA タイプのゲームです, したがって、ゲームの画質と詳細が低い条件では、ゲームの FPS も平均 100 フレームを超えます。2160p、1440p、および特殊効果の最高設定でテスト済み。

e スポーツ ゲームの場合、RTX 4090 によるパフォーマンスの向上は明らかではありません。結局のところ、RTX 3090 は 2160p の e スポーツ ゲームでも非常に強力なパフォーマンスを提供できます。テストでは、明らかにパフォーマンスが向上したのは「Rainbow Six: Siege」のみでした。、他の 3 つは比較的近いです。

2160p e スポーツ ゲームのテスト、FPS が高いほど優れています。
1440p ゲーム テスト、FPS が高いほど優れています。

NVIDIA GeForce RTX 4090 – 11 ゲームのパフォーマンス テスト

AAA 試合 11 試合の平均パフォーマンス 、フルエフェクトをオンにして 2160p、1440p でもテストしました。このテストでは F1 にライト チェイスのみを使用し、残りのゲームにはライト チェイスや DLSS アクセラレーションはありません。GPU の実際の従来のレンダリングをテストします。ゲームのパフォーマンス。

ゲームテストリストには、エントリーレベルの「F1 2021」、「Forza Horizo​​n 5」レースゲーム、「Tomb Raider: Shadow」、映画ゲーム「Death Stranding」、「Gears of War 5」が含まれます」、「ディビジョン 2」、「ホライゾン: エクスペクティング ドーン」のほか、「ボーダーランズ 3」、「アサシン クリード: バイキング エイジ」、「レッド デッド 2」、「ゴッド オブ ウォー」などのパフォーマンス重視のテストも含まれます。

RTX 4090 は、2160p および AAA ゲームでかなり優れたパフォーマンス向上を実現し、11 ゲームで平均 148 FPS を達成しました。これは、RTX 3090 の平均と比較して約 1.7 倍の平均パフォーマンス アップグレードを達成できます。 89 FPS。

ただし、解像度 1440p では、RTX 4090 は平均 200 FPS、RTX 3090 は平均 143 FPS となり、約 1.4 倍のパフォーマンス向上となります。

メインの 2160p 解像度の下では、RTX 4090 は DLSS アクセラレーションに依存せずにプレーヤーのパフォーマンスを約 1.7 倍向上させることができることがわかります。パーセンテージで表すと、平均 66% のパフォーマンス アップグレードが得られます。

2160p AAA ゲームテスト、FPS が高いほど優れています。
1440p AAA ゲーム テスト、FPS が高いほど優れています。

NVIDIA GeForce RTX 4090 – 9 つのレイチェイス ゲームをテスト済み

9 つのレイチェイス DXR ゲーム 最も人気のある「Rider 2077」、「Control」、「Watch Dogs: Liberty Legion」、「Thriller: Exile」、「Marvel's Spider-Man Remastered Edition」、「Marvel」を使用してテストされましたインターステラー』、『ゴースト スレッド: トーキョー』、『極地ハウル 6』、『邪悪な城の村』などのテスト用ゲーム。2160P、1440p の解像度をテストします。特殊効果/ライト チェイスの最高設定に加えて、DLSS アクセラレーションも有効になります。詳細な設定については表を参照してください。

RTX 4090 は、「Dian Yu Ke 2077」の DLSS 2 の加速下で平均 110 FPS に達することができます。これは、RTX 3090 の平均 60 FPS よりもはるかに高いです。「Control」や「Ghost Line: Tokyo」などの光追跡ゲームでも、RTX 4090 による強力な光追跡ゲームのパフォーマンス アップグレードを実感できます。

RTX 4090 は、2160p および 9 回のライトチェイス ゲーム テストで平均 132.3 FPS に達します。RTX 3090 と比較すると、平均 82 FPS です。ライトチェイス ゲームのパフォーマンスは約 1.6 倍、アップグレードの平均 65% に向上します。

1440p に関しては、RTX 4090 は平均 169 FPS、RTX 3090 は平均 119.8 FPS と約 1.4 倍、41% のパフォーマンス向上を実現しました。

2160p ライトチェイスゲームテスト、FPS が高いほど優れています。
1440p ライト チェイス ゲーム テスト、FPS が高いほど優れています。NVIDIA

GeForce RTX 4090 – DLSS 3 パフォーマンス テスト

テスト期間中、NVIDIA は、主にメディアが DLSS 3 によるパフォーマンスの向上を垣間見ることができるように、プレリリース テスト バージョンを提供しました。テストされたゲームには、Microsoft Flight Simulator、A Plague Tale が含まれます。 Requiem、Unreal Engine 5: Lyra、F1® 22、Unity Enemies、Traitor 2077、Justice Online」では、2160p の解像度とライト トラッキングの最高設定が使用されています。

DLSS 3 ゲーム設定には、「超解像度」と「フレーム生成」の明確なオプションがあります。DLSS 3 のテクノロジーを使用するには両方の機能を同時に有効にする必要がありますが、RTX 30 / 20 シリーズのプレーヤーのみ有効にすることができます。超解像度機能、フレーム生成は有効になりません。

Microsoft Flight Simulator DLSS 3 の設定。
『Electric Rider 2077』の DLSS 3 設定。

RTX 4090 は DLSS 3 によって高速化され、「Dian Yu Ren Ke 2077」のパフォーマンスは平均 140 FPS の約 3.5 倍のパフォーマンス向上を達成できます。Unity エンジンによってリリースされた敵のムービー アニメーションも、DLSS 3 を使用してリアルタイム レイ トレーシング レンダリングで実現できます。103 FPS、約 3.68 倍のパフォーマンス アップグレード。

DLSS 3 パフォーマンス設定では、RTX 4090 は約 1.9 倍~4.7 倍のパフォーマンス向上を達成でき、平均は約 2.95 倍であり、これは、RTX 4090 のパフォーマンスとも一致しています。 NVIDIA が公開した場合は 2 ~ 4 倍。

ただし、RTX 40 シリーズのプレイヤーに利益をもたらすためには、ゲームが DLSS 3 テクノロジーをサポートするまで待つ必要もありますが、RTX 4090 は最初に DLSS 3 のサポートを開発し、いつになったら将来的には中級レベルのエントリー レベルの RTX 4060 が登場し、プレイヤーはゲーム アクセラレーション パフォーマンスのアップグレードを実現できるようになります。

DLSS 3 ゲーム パフォーマンス テスト、高いほど優れています。

NVIDIA GeForce RTX 4090の消費電力と温度測定

Time Spy ストレス テストと「Electric Rider 2077」を使用したグラフィックス カードの消費電力と温度テスト。消費電力は、NVIDIA が提供する PACT ツールを使用して測定されます。このツールは、PCIe スロットと電源 12V によって提供されるワット数を監視できます。

グラフィックス カードの温度に関しては、RTX 4090 初期バージョンはストレス テストで最高温度 67.8°C を維持し、2077 年のゲーム中の温度は 65°C わずかに低下しましたが、比較対象の RTX 3090 初期バージョンではサーマル パッドが変更されているため、温度パフォーマンスは同等です。

RTX 4090 Founders Edition の GPU 温度。

グラフィックス カードの TBP 消費電力テスト、Time Spy ストレス テストでは、RTX 4090 は平均消費電力 390 W、瞬間最大消費電力 462 W を達成しましたが、2077 ゲームの平均消費電力は消費電力は 358W、瞬間消費電力は 398W。

RTX 4090 は、Furmark Xtreme バーンインを使用して、平均消費電力 458 W に達することができます。これは、NVIDIA が事前に設定した消費電力の上限でもあります。ブランド製カセットがオーバークロックされている場合、2 つの 12VHPWR 電源が使用されていない限り、出力も約 500 W になるはずです。

RTX 4090 Founding Edition GPU の消費電力。
Furmark Xtreme のバーンインは平均 458 W、瞬間的に 482 W になります。

要約

NVIDIA GeForce RTX 4090 は、その強みで前世代を再び上回り、DaVinci Resolve 18 はデュアル NVENC のアクセラレーションの下でより高速なビデオ出力パフォーマンスを実現し、新世代の AV1 エンコーディングをサポートできるようになりました。 RTX 40 シリーズの標準となる機能と 3D クリエーション性能 Blender と V-Ray は 2 倍近く性能が向上しており、間違いなく最強のクリエイティブ武器です。

ゲームのパフォーマンスに関しては、2160p および 4K AAA およびライトチェイス ゲームのパフォーマンスを再び支配しています。AAA ゲームは平均 1.7 倍、ライトチェイス ゲームは平均 1.6 倍アップグレードされます。DLSS 3 が AI フレーム補完を普及させれば、平均 2.95 倍の高速化がもたらされる可能性があります。4K100fps 100 フレームというプレイヤーの夢をかなえる、プラグイン レベルのゲーム魔法の武器であることは間違いありません。

DLSS 3 は現在、最大 35 個のゲーム (プログラムを含む) をサポートしていますが、各ゲームのリリースと更新時期が異なるため、新しいテクノロジーが普及するまでにはしばらく時間がかかります。

35 のゲームとアプリを超える NVIDIA DLSS 3 の勢い

この世代では 2 倍近く性能が向上しており、RTX 4080 の性能は今後も明るいことが期待できますが、相対的に 2 倍の性能向上により、RTX の価格は大幅に上昇します。 4090 は RTX 3090 よりもコスト効率が高くなりますが、それに応じて RTX 4080 の価格も上昇します。このような状況下で、プレイヤーはこの究極のパフォーマンスを追求するために、どれだけの予算を必要とするのでしょうか?特に、将来の主流の RTX 4060 がプレーヤーの期待と価格の甘さに応えられるかどうかは、NVIDIA の計算方法にかかっています。

RTX 4090 は明日 10/12 午後 9 時に発売されます。台湾での希望価格はNT$56,990から。台湾が創業バージョンを販売するかどうかについては、NVIDIA 台湾自身の発表に委ねられます。RTX 4080に関しては11月まで待ちます。来年には RTX 40 ラップトップ GPU が登場すると予想されますが、最初のフラッグシップの価格はかなり高くなるはずです。ゲーム用ノートパソコンに興味のあるプレイヤーは、来年の CES のニュースに注目してください。

私は NVIDIA GeForce RTX 4090 なので、4K 100fps も夢ではありません。

この記事が役に立った場合は、この記事をソーシャル メディアでお友達と共有してください。ありがとう!!

この記事はレビューの個性に基づいています。コンテンツが事実ではない、または正確でない場合は、事実確認を行う責任があります。

タイトル: 私の 4K 100 フレーム! NVIDIA GeForce RTX 4090 グラフィックス カード テスト レポート

jaJapanese