My 4K 100 frames! NVIDIA GeForce RTX 4090 Graphics Card Test Report

創造的な武道とゲームの魔法、私は NVIDIA GeForce RTX 4090 です。NVIDIA の新世代の Ada Lovelace GPU アーキテクチャは、最初のフラッグシップカードの後に正式に発売され、プロセスのアップグレードとクロックの急上昇だけでなく、また、Tensor コアと RT コアのアップグレード、新世代の DLSS 3、AI フレームフィリングテクノロジにより、GPU アクセラレーションの時代が開かれます。同時に、AV1 デュアルエンコーディングエンジンを搭載しています。ゲーマーの夢である 4K 100 フレームを実現するだけでなく、3D レンダリング、作成、シミュレーション、コンピューティングの専門家でもあります。この新世代のカードをアーキテクチャ、仕様、パフォーマンスの観点から見てみましょう。エクスペリエンスをアップグレードします。

新世代のフラッグシップカード Ada Lovelace、NVIDIA GeForce RTX 4090 に出会った後

NVIDIA の新世代 Ada Lovelace マイクロアーキテクチャ、RTX 40 シリーズ、最初のフラッグシップ GeForce RTX 4090 は、明日 10 月 12 日に正式に販売され、価格は 1599 ドルです。その後、GeForce RTX 4080 16GB と 12GB の 2 つの新しいカードも 11 月に発売され、価格は 1199 ドルと 899 ドルになります。

この世代の NVIDIA は、TSMC 4N カスタムプロセスと Ada Lovelace マイクロアーキテクチャに切り替わり、GPU がより多くの SM ユニットを搭載できるようになり、CUDA、Tensor コア、RT コアなどの数がさらに増加しました。 TMU や ROP などのユニットの数が増加し、2.5 GHz ブーストの超高クロックと相まって、RTX 4090 は RTX 3090 Ti を上回る 2 ～ 4 倍の高速パフォーマンスを実現します。

GeForce RTX 4090 には、16,384 個の CUDA コア、512 個の第 4 世代 Tensor コア、128 個の第 3 世代 RT コア、2.52 GHz のブーストクロック、24 GB の GDDR6X メモリが搭載されています。プロの制作、レンダリング、そして主力ゲーマーのニーズを同時に満たす超クレイジーな仕様を備えたこの超クレイジーなグラフィックスカードの価格は NT$ 56,990 です。

GeForce RTX 4080 には 2 つの仕様があり、RTX 4080 16GB は CUDA 9728、Tensor Core 304、RT Core 76、2.51GHz Boost クロックを備え、NT$ 42,990 から始まります。RTX 4080 12GB は CUDA 7680、240 Tensor コア、60 RT コア、2.61 GHz ブーストクロックで、NT$31,990 から始まります。

**RTX 4090 は RTX 3090 / Ti 製品を置き換え、RTX 4080 は RTX 3080 12GB / Ti 製品を置き換えます。**

米ドル価格の観点から見ると、この世代の RTX 4080 の方が高価であるのは事実ですが、NVIDIA が提供する現在のパフォーマンス基準によれば、RTX 4090 は RTX 3090 Ti より 2 ～ 4 倍高速です、一方、RTX 4080 は RTX 3080 Ti の時間より 2 ～ 4 倍高速です。したがって、パフォーマンスと価格の点で、RTX 4090 の価格/パフォーマンス比は RTX 3090 Ti よりも明らかに優れています。たとえ RTX 4080 12GB のパフォーマンスが RTX 3090 Ti と競合できるとしても、この世代の RTX 4080 の価格はそれに応じて上昇します。

最後に、なぜ NVIDIA は各世代のパフォーマンスをこれほどまでに 2 ～ 4 倍向上させることができるのでしょうか? プロセスの改善とクロックの高速化に加えて、より重要なのは、Ada Lovelace Engine の新アーキテクチャによってもたらされる新技術 SER、Displaced Micro-Mesh Engine、Opacity Micro Map、さらにはオプティカルフローアクセラレータと DLSS 3 の AI です。補足フレーム、これは NVIDIA の最も優れた技術力です。

Ada Lovelace: プロセスクロックのアップグレード、高度なレイトレーシング、デュアル AV1 エンコードを備えた完全なコア AD102 GPU

Ada Lovelace のマイクロアーキテクチャ。トランジスタ数は 763 億に達し、合計 12 セットの GPC、72 セットの TPC、および 144 セットの SM ユニットを備えています。つまり、合計 18432 個の CUDA、576 個の CUDA があることを意味します。 Tensor コアと 144 の RT コア。この世代の現在の主力製品である RTX 4090 は、SM ユニット数が 128 未満にすぎません。これは、RTX 4090 Ti が将来的に現在の主力製品を超える可能性がまだあることを意味します。

SM ユニットの改良に加え、Ada には GDDR6X 高速メモリ、AI 推論パフォーマンスを向上させる第 4 世代 Tensor コア、レイトレーシングの品質を向上させる第 3 世代 RT コアも搭載されています。 AV1 ハードウェアエンコーディングをサポートする第 8 世代のオーディオおよびビデオエンコーダー。DLSS 3 から 2 ～ 4 倍のパフォーマンスアップグレードが行われます。

ADA Gen 4 Tensor コア

Tensor Core は、ディープラーニングのトレーニングと推論に必要な行列計算の画期的なパフォーマンス向上をもたらす高性能コンピューティングコアです。コアは「行列の乗算」と「累積算術演算」を目的としています。AI と HPC の適用において、デザインは非常に重要な役割を果たします。

Ada は、Ampere アーキテクチャと比較して、FP16、BF16、TF32、INT8、INT4 の 2 倍の Tensor TFLOPS パフォーマンス向上をもたらします。同時に、Hopper アーキテクチャの FP8 Transformer Engine を追加すると、1.3 ペタ FLOPS の Tensor コアパフォーマンスを提供できます。

ADA 第 3 世代 RT コアと新しい光学トラッキングテクノロジーを備えた第 3 世代 RT コア

Ada アーキテクチャにより、Ray-Triangle Intersection の出力パフォーマンスが 2 倍高速になります (以前の Ampere と比較して)。新しく追加された「 不透明マイクロマップエンジン " を使用すると、オブジェクトにマイクロトライアングルの仮想メッシュを持たせることができます。これを使用して、オブジェクトの不透明な状態 (不透明、透明、不明の 3 つの状態) を記録することができます。

**ADA の不透明度マイクロマップエンジンにより、オブジェクトが仮想メッシュの不透明度状態を記録できるようになります。**

レイが不透明な表現までトレースされた場合、「ヒット」が記録されて返され、それが透明な領域の場合、レイトレーシングは直接無視され、未知の領域が引き渡されます。 SM は、様式化されたシェーダーを通じて光線の交差を処理します。Opacity Micro マップエンジンは、不透明マスク、つまり重心座標を使用して「光線/三角形」の交差を報告する正三角形マスクを評価するために使用されます。

Opacity Micro マップエンジンを通じて、ジオメトリのアルファテストを直接実行できるため、シェーダーのアルファ計算の負担が軽減されます。この機能により、開発者はより複雑な形状、シダ、フェンスなどの半透明のオブジェクトを描画できるようになります。およびその他のオブジェクト、および Ada RT コアを介して効率的なレイトレーシングを実現します。

**ゲーム画面の煙のように、Opacity Micro Map Engine テクノロジーを使用すると、レイトレーシングの複雑さを軽減できます。**

上の図の左側が元のレイトレーシング量です。色が暗いほど、より多くの光が計算されますが、煙のエフェクトがかなり半透明であることは明らかですが、全体的なパフォーマンスは低下します。写真の右側は不透明度マイクロマップ適用後に必須エンジン。レイトレーシングの計算量が増加するため、複雑なオブジェクトや透明効果を扱う際のレイトレーシングのパフォーマンスが向上します。

さらに、Ada RT Core は ” 置き換えられたマイクロメッシュエンジン " は、ますます複雑になる幾何学的シーン、レイトレーシングの計算負荷、BVH データに必要なメモリ/ストレージ容量の削減を解決します。変位マイクロメッシュは、幾何学的空間の相関関係を使用して、参照三角形点と変位方向を含む複雑なジオメトリを表現します。

このようにして、レイトレーシング中に多数の BVH 構造の生成を回避でき、BVH トラバーサルのパフォーマンスをより効果的にすることができ、既存のマイクロメッシュ LOD をレンダリングに使用できます。ラスター化中の元のジオメトリ。つまり、ディスプレイスドマイクロメッシュエンジンは、単純な BVH、データム三角形点、ディスプレイスメント方向マップを使用して、非常に詳細な幾何学的レイトレーシングを作成できます。

レイトレーシングを使用してカニの甲羅を詳細にレンダリングするには、カニを 1024 個の三角形に分割し、BVH アルゴリズムを使用して各位置の光の変化を計算する必要があります。非常に大量の BVH データとパフォーマンスの損失。

Ada の変位マイクロメッシュエンジンは、単純な BVH 計算のみが必要となるように、変位方向マップに 1 つの三角形を含む複雑な表面を追加し、変位方向マップを使用して光の変化を計算します。それぞれの場所で。

この世代のエイダには新しい ” シェーダー実行の並べ替え " (SER) 関数。シェーダーを動的に配置して光を処理し、実行上の利点を実現します。

簡単に言うと、シーンでレイトレーシングを計算する場合、メインレイから開始して遭遇するオブジェクトを計算し、その後、メインレイによって生成された反射と周囲拡散によって 2 番目のレイトレーシングが実行されます。、しかし、2番目のレイトレーシングは厄介です。この状況の順序は、2 番目のレイトレーシングのシェーダーのパフォーマンスの低下にもつながります。

**つまり、SER はレイトレーシングのシェーダーを最適化し、動作をより効率的にすることができます。**

したがって、シェーダー実行の並べ替えがレイトレーシングパイプラインに追加された後、2 番目のレイトレーシングでヒットした同じシェーダーを並べ替えてグループ化できるため、レイトレーシングシェーダーの効率が向上します。SER により RT シェーダーのパフォーマンスが 2 倍向上し、サイバーパンク 2077 がオーバードライブモードで実行されている場合、SER の結果ではパフォーマンスが 44% 向上しました。

この図は SER 機能をよりよく説明しています。
最初の光線追跡の計算は逐次的な状態ですが、2 番目の光線追跡には反射、屈折、拡散が含まれます。したがって、シェーダーは計算の乱れにより最高のパフォーマンスを発揮できません。SER によって最適化できます。パフォーマンスが大幅に向上しました。

大加速時代の DLSS 3 とオプティカルフローアクセラレータ

ゲームには豊富なオブジェクト、より複雑なジオメトリ、美しい世界、物理的にリアルなレイトレーシングなどのテクノロジーのスタックが含まれているため、従来の GPU レンダリングパフォーマンスでは現代のゲームのニーズに追いつくことができないため、NVIDIA はAI ディープラーニングアクセラレーションのための DLSS テクノロジーの開発により、さまざまな GPU メーカーが独自のアクセラレーションテクノロジーを発表できるようになり、GPU アクセラレーションの時代が正式に到来しました。

2018 年に「Battlefield V」がリリースされたとき、インポートされたレイトレーシングは 1 ピクセルあたり 39 個のレイトレーシングしかありませんでしたが、4 年後の「Electric Rider 2077」では 1 ピクセルあたり 635 個のレイトレーシングに達することができます。非常に効率的です。しかし、大きな変化がありました。

RTX 40 の独自の「DLSS 3」は、DLSS 2 の技術をベースに、オプティカルフローアクセラレータの機能である「AI 補完フレーム」の概念を追加したものです。オプティカルフローは、連続画像内の各ピクセルの動きの方向と量を計算するためにコンピュータービジョンで使用されるオプティカルフロー手法です。

DLSS 3 テクノロジーでは、ゲームエンジンが以下を提供する必要があります。低解像度のレンダリング画像とモーションベクトル、DLSS の深層学習ネットワークを介した高解像度画像の推論、および画像をオプティカルフローアクセラレータに提供して、各ピクセルの移動方向と移動量を決定し、最後に光学マルチフレーム生成を経てAI補助フレーム画像を生成します。

DLSS 3 は、オプティカルフローアクセラレータを使用して、オプティカルフローの移動方向と画像ピクセルのベクトルを計算し、オプティカルマルチフレーム生成の AI を使用して、AI である Frame2 の画像を推定します。現地語による補足フレーム。

AI 補完フレームにオプティカルフローアクセラレータが必要な理由は何ですか?
主な理由は、上の画像のオブジェクトはゲームエンジンのモーションベクトルを通じて動きの方向を知ることができますが、地面の影がオブジェクトではない場合、その動きベクトルは影が失われ、フレームを補完するときに問題が発生します。

**エンジンのモーションベクトルとオプティカルフローのピクセルベクトルを組み合わせることで、より安定した AI 補完フレームを生成できます。**

ゲームが DLSS 3、フレーム生成をオンにし、Reflex による遅延を軽減すると、ゲーム画面の Frame1 のピクセルの 1/4 がゲームによってレンダリングされ、残りの 3/4は DLSS 超解像度によって推定されたピクセルになり、次の A ピクチャ Frame2 に進みます。これは DLSS Frame Generation によって生成されるため、Frame1 Frame2 の合計 7/8 のピクチャが AI によって生成されます。 DLSS 3 の。

フレーム 1 は低解像度画像 (1/4) をレンダリングするためにエンジンによってレンダリングされ、残りの 3/4 の画像は DLSS によって生成され、その後、フレーム 2 は DLSS フレーム生成によって完全に描画されます。 2 つのフレームの合計 7/8 が DLSS によって生成されます。DLSS の AI 推論が誕生しました。

DLSS 3 は、ネイティブレンダリングと同様の画質を維持しながら、AI フレームの補完を通じてゲームパフォーマンスを 2 ～ 4 倍向上させることができますが、ゲーム全体の遅延も増加するため、NVIDIA は DLSS 3 にReflex テクノロジーを使用すると、レンダーキューをキャンセルすることで、CPU の処理が完了した後、GPU がすぐにレンダリングを引き継ぎ、システムレイテンシーの短縮を実現できます。

したがって、DLSS 3 は、第 4 世代 Tensor コア、オプティカルフローアクセラレーター、および AI のトレーニングに NVIDIA が使用するスーパーコンピューターを利用して、AI 超解像度、フレーム生成、ReFlex などのテクノロジーを組み合わせ、次世代ゲーマー向けの 4K100fps の究極のパフォーマンス。

DLSS 3 では、フレーム生成で望ましいパフォーマンスの向上を実現するには、Ada のオプティカルフローアクセラレータハードウェアが必要です。そのため、DLSS 3 は現在 RTX 40 シリーズの独占的な機能であり、将来のゲームでも DLSS 3 をサポートする予定です。 DLSS 2 と互換性があること。DLSS Super Resolution と NVIDIA Reflex は GTX 900 以降でサポートされています。

DLSS 3 = 超解像度フレーム生成リフレックス。
元の DLSS 2 には超解像度のみが必要です。

デュアル AV1 オーディオおよびビデオエンコーディング、Portal RTX が 11 月に発売

上記のアップグレードに加えて、Ada Lovelace にはデュアル第 8 世代 NVENC エンコーディングエンジンも搭載されており、主に AV1 のオーディオおよびビデオエンコーディング機能が追加されています。デコードに関しては、第5世代NVDECはAmpereと同じです。結局のところ、NVDEC はすでにあらゆる種類のオーディオとビデオをデコードする機能を完全にサポートしています。

RTX 40 シリーズには、主に AV1 オーディオおよびビデオエンコーディングの機能を含む、デュアル第 8 世代 NVENC エンコーディングエンジンが搭載されています。これは将来の主流のオーディオおよびビデオストリーミングエンコーディングでもあり、H.264 よりも優れた信号対雑音比を持っています。ビットレートで比較すると、AV1 のイメージ画像は H.264 エンコードよりも優れています。

AV1 オーディオおよびビデオエンコーディングは、より良い画質とパフォーマンスの向上を実現できます。これは、将来のストリーミングの主要なオーディオおよびビデオエンコーディングでもあります。

**左の AV1 と右の H.264 の同じ 8Mbps ビットレートでも、床の細部はかなり異なります (4K SBS 比較)。**

**同じ 8Mbps ビットレートの左 AV1、右 H.264、道路の質感の違いがはっきりとわかります (4K SBS 比較)。**

デュアル第 8 世代 NVENC エンコードエンジンでは、ビデオ出力パフォーマンスを 2 倍向上させるために、DaVinci Resolve、Voukoder、Jianying などのビデオ編集ソフトウェアのサポートが必要です。RTX 40 デュアルエンコードエンジンはサポートされます。初めて。Adobe Premiere Pro は将来のアップデートを待つ必要があります。

たとえば、8K60 画像を記録する場合、パフォーマンスを向上させるために、それぞれが 7680 x 2160 の解像度を担当するデュアルエンコーダーを使用できます。

AV1 エンコードとデュアルエンコードエンジンに加えて、NVIDIA Omniverse は新しい DLSS 3 テクノロジーと、RTX Remix の神レベルのゲーム Mod 制作ツールもサポートしています。

ただし、プレイヤーの場合は、クラシックゲーム Portal With RTX が 11 月に無料 DLC をリリースし、Vulkan RT 互換 GPU をサポートします。もちろん、最高のエクスペリエンスは RTX 40 と DLSS 3 を使用することです。

**Portal With RTX は 11 月に無料 DLC をリリースします。RTX リミックスは間もなくリリースされます。**

NVIDIA GeForce RTX 4090 Founders Edition グラフィックスカードは箱から出してすぐに使用可能/背面は前面のクラシックが再強化されたもの

Ada Lovelace カードの後、NVIDIA GeForce RTX 4090 創設バージョンは、Ampere 世代によって開拓された新しいグラフィックスカードの美的デザイン「裏が表」と「劣っているが優れている」GeForce を維持しています。ファウンダーズエディションは、X フレーム用の頑丈で耐久性のあるアルミニウム合金フレームを特徴とし、プレミアム仕上げのための陽極酸化仕上げと金色のメタリック仕上げが施されています。

**メディアエディション NVIDIA RTX 4090 ファウンディングエディション。**

フレーム内部は放熱フィンで満たされており、その内部は蒸気室となってGPUやVRAMの熱を放散し、廃熱は熱を介して放熱フィンに導かれますパイプ。この世代の RTX 4090 初期バージョンは、より大型の 116 mm、FDB、7 ブレードデュアルファンを使用し、グラフィックスカードの厚さが 3 スロットに増加し、グラフィックスカードの長さが 30.48cm (12 インチ) に短縮されています。

この世代のベーパーチャンバーも最適化されており、ベーパーチャンバーが GPU とより均等に接触できるようにメモリ専用のカットアウトがあり、メモリのサーマルパッドが 1.5 に削減されています。熱伝導効果を高めるには mm。この世代のラジエーターは、最大 650W Qmax の冷却能力をサポートできます。

**背面は従来の前面、RTX 4090、およびグラフィックスカード前面の貫通冷却エアフローです。**

**オリジナルの前面にも冷却フィンと背面ファンを備えた金属フレームが埋め込まれており、独特の美的デザインをもたらしています。**

RTX 4090 は、PCIe 12 4 ピン (12VHPWR) 電源インターフェイスに完全に置き換えられ、1 つのラインで最大 600 W の電力消費を伝送でき、また、ライン全体がより美しくなります。新しいカードが取り付けられています。もちろん、初期バージョンでは 12VHPWR から 4 本の PCIe 6 2pin ケーブルも提供されます。

通常、変換には少なくとも 3 つの PCIe 6 2 ピンを接続することをお勧めします。新しい電源を購入する場合は、ATX12 V3.0 および EPS12V V2.92 仕様に準拠した新しい電源を選択することをお勧めします。このようにして、12VHPWR ケーブルがグラフィックスカードに必要な電力を供給できる限り、醜い大砲を片付けることができます。

**RTX 4090 は電源に PCIe 12 4 ピン (12VHPWR) を使用します。**

**12VHPWR は 4 本の PCIe 6 2pin ケーブル (タワー) のアクセサリに含まれています。**

**プロフェッショナル向けの新しい電源は、ケーブル 1 本で RTX 4090 の電源ニーズを満たすことができます。**

RTX 4090 ディスプレイ出力は、VRR、4K120Hz / 8K60Hz HDR をサポートする 1 つの HDMI 2.1a、および 12 ビット 4K240Hz HDR / 12 ビット 8K60Hz HDR およびその他の出力機能をサポートする 3 つの DisplayPort 1.4a DSC を提供します。同時に最大 4 つの画面出力を接続できます。

NVIDIA GeForce RTX 4090 クリエイティブビデオ出力、GPU レンダリングパフォーマンステスト

このテストには、Adobe Premiere Pro 2020、DaVinci Resolve 18、Blender などのクリエイティブテストが含まれており、ゲームは 2160p、1440p 解像度、フルエフェクト、e スポーツ、AAA ゲーム、ライティングでテストされます。パフォーマンスを追求してくださいゲームの概要を説明し、DLSS 3 の事前テストを追加して、プレーヤーが RTX 4090 が強力である (非常に高価である) 理由を完全に理解できるようにします。

最も強力なグラフィックスカードは、NVIDIA GeForce RTX 3090 Founders Edition です。

テストプラットフォーム
プロセッサー: Intel Core i9-12900K
マザーボード: ASRock Z690 PG Velocita
メモリ: CORSAIR DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz
グラフィックスカード: NVIDIA GeForce RTX 4090 Founding Edition、NVIDIA GeForce RTX 3090 Founding Edition
システムディスク: Solidigm P41 Plus 1TB PCIe 4.0 SSD
クーラー: ASUS ROG STRIX LC II 280mm
電源：Seasonic PRIME PX-1000
オペレーティングシステム: Windows 11 Pro 21H2 64 ビット、サイズ変更可能な BAR オン
ドライバーバージョン: NVIDIA 521.90

GPU-Z NVIDIA GeForce RTX 4090 情報、4nm プロセスの AD102 GPU、16384 レンダリング CUDA コア、24576 MB GDDR6X (Micron) メモリを表示できます。GPU はクロックが 2235 MHz にプリセットされ、ブーストが 2520 MHz です。 MHz。

**DXVA チェックデコーダテスト。現在、すべてのビデオコーデックはさまざまな解像度のデコードをサポートしています。**

DaVinci Resolve 18 は、強力な色補正と特殊効果機能を備えた純粋に GPU アクセラレーションのビデオ編集プログラムであり、CUDA コアコンピューティングを直接使用しているため、ビデオクリップの再生と出力は非常に優れたパフォーマンスを発揮します。ベータ版には、NVIDIA AV1 エンコーディングのサポートが含まれています。

このテストは 2 つの部分に分かれています。最初のテストプロジェクトは 4K Blackmagic RAW 画像を使用し、それぞれに Wedding_Heavy_Styles タイムラインがあります。このビデオは、OFX などの Resolve エフェクトを多用しており、光線 / グロー / スケッチなど、かなりハイスタイルな映画ジャンルを出力しています。

Bride_FaceRefine_Selective_Color は顔追跡に Face Refinement を使用し、メインの花嫁を色でハイライトします。50% リタイムとオプティカルフロー – Enhanced Better はどちらもオプティカルフローテクノロジーを使用して、画像の速度を 50% 削減します。

SuperScale2x 4K ソースは、4K ProRES ソースビデオを使用して、被写体を 2 倍ズームインした 4K ビデオ出力を生成します。SuperScale4x HD_Source は HD H.264 ソースビデオを使用し、Resolve Super Scale を使用して 4K ビデオを出力します。

RTX 4090 のこの部分のパフォーマンスは、特にオプティカルフローテストにおいて非常に優れていると言えます。出力時間が 2 倍近く節約され、クリエイターはより高速な出力パフォーマンスを得ることができます。

2 番目のテストは、デュアル NVENC エンコーディングを使用した AV1 および HEVC エンコーディングテストです。テストプロジェクトは、Blender Open Movie プロジェクト「Tears of Steel」の 44 秒の短編フィルムで、8K Prores442HQ 30FPS および 4K Prores422HQ 30FPS ビデオがあり、HEVC、AV1 エンコーディングの出力パフォーマンスをテストするために利用できます。

出力設定は主に NVIDIA エンコーダを使用、品質: 80000 Kb/s に制限、エンコーディングプロファイル: Main
レート制御: 固定ビットレート、プリセット: 高速、チューニング: 高品質、2 パス: 無効およびその他の出力設定。

パフォーマンスの点では、4K30 出力時の RTX 4090 のパフォーマンスは RTX 3090 のパフォーマンスとあまり変わりませんが、8K 出力を処理する場合、RTX 4090 のデュアルエンコードエンジンにより HEVC 出力時間が 2 倍高速化されます、AV1 エンコードの速度も非常に速いため、ビデオ編集ソフトウェアが RTX 40 デュアルエンコードエンジンをサポートしている限り、優れたエンコードパフォーマンスの向上を実現できることがわかります。

**DaVinci Resolve 18 デュアル NVENC エンコードテスト、短いほど良い。**

Adobe Premiere Pro 2022 自社開発の Mercury Playback Engine GPU アクセラレーションを使用するビデオ編集ソフトウェアは、GPU のエンコードエンジンを使用して画像出力速度を高速化できます。テストプロジェクト 1 は、同社の 1080p60fps のすぐに使えるビデオです。BigMix4K プロジェクトは、FinalAdjusted_MPE 1920×1080 画像の 3 セグメントを使用して、H.264 および HEVC 形式出力用の 4K タイムラインを形成します。

(テスト済みの Premiere Pro 2022 はまだ RTX 4090 デュアルエンコーディング機能をサポートしていません。)

RTX 4090 はパフォーマンスの点で RTX 3090 よりも速い出力速度を持っていますが、サポートされている DaVinci Resolve とは異なり、出力時間を大幅に短縮できます。したがって、このテストは主に参考のために提供されています。

**Adobe Premiere Pro 2022 の出力、短いほど優れています。**

ブレンダー は、モデリング、リギング、アニメーション、シミュレーション、レンダリング、合成、モーショントラッキングなど、さまざまな 3D タスクをサポートするクロスプラットフォームのオープンソース 3D オーサリングツールです。テストには、Blender Benchmark 3.3.0 を使用して、デモプロジェクトのレンダリング作業をテストします。

Blender Benchmark 3.3.0 テストでは、3 つのシーンで RTX 4090 の 1 分あたりのサンプル数 (効率) が RTX 3090 の約 2 倍となっており、3D の作成が容易であることがわかります。エイダ・ラブレスの強さ。

V-Ray ベンチマーク Chaos Group によって開発されました。V-Ray は物理法則に基づいて設計されたレイレンダリングソフトウェアで、CPU と GPU それぞれのレイトレーシングのレンダリング画像に対して計算テストを行うことができます。

V-Ray GPU RTX であれ CUDA 計算であれ、RTX 4090 は Vpath 数の 1.9 倍で RTX 3090 を上回りました。

SPECviewperf 2020 プロのアプリケーションによって開発された標準的な描画パフォーマンステストツールに基づいており、3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks などのさまざまなプロのコンピュータグラフィックソフトウェアやその他の描画テストをテストします。およびエンジニアリングシミュレーション。

テストは解像度 1920 x 1080 で、結果は FPS です。このパフォーマンスは、使用されるツールに関連しています。プログラムやテストの状況にもよりますが、RTX 4090 のパフォーマンスは約 1 ～ 2.9 倍向上します。

NVIDIA GeForce RTX 4090 – 3DMark ベンチマークパフォーマンステスト

3DMark Fire Strike パフォーマンステストは、主流の DirectX 11 API テストシナリオであり、それぞれ 1080p、Extreme 1440p、Ultra 2160p のパフォーマンスをテストします。

RTX 4090 の Fire Strike スコアは 54174 で、Ultra Graphics スコアは RTX 3090 より 2 倍、Extreme は 1.8 倍、FHD は 1.6 倍でした。

3DMark Time Spy は、DirectX 12 API で設計されたテストシナリオです。これも AAA ゲームレベルにロックされており、それぞれ 1440p と Extreme 2160p のパフォーマンスをテストします。

RTX 4090 は Time Spy で 32638 ポイントの合計スコアを達成しました。これは、RTX 3090 のそれぞれ 1.8 倍と 1.9 倍です。

レイトレーシングテスト用 3DMark ポートロイヤルAAA ゲームのシーンにレイトレーシングを追加すると、新世代の GPU がハードウェアレイトレーシングを高速化する能力がテストされます。同時に、XDR テストは DirectX Raytracing API を使用した機能テストでもあります。

DLSS がなくても、RTX 4090 は非常に驚くべきレイトレーシングパフォーマンスを発揮します。Port Royal は 119 FPS と XDR 138 FPS を達成します。RTX 3090 と比較すると、1.95 倍と 2.44 倍のパフォーマンス向上ももたらします。

3DMark DLSS 機能テスト DLSS 3 および DLSS 2 のパフォーマンステストを実行できます。3840 x 2160 およびパフォーマンスアクセラレーションに設定すると、RTX 4090 は DLSS 2 で 138 FPS / 2.3 倍のパフォーマンス向上を実現できます。DLSS 3 が AI を使用した後、画像を生成すると、最大 193 FPS / 3.3 倍のパフォーマンス向上が可能です。

将来的には、このゲームを使用して DLSS 3 のパフォーマンスを測定します。

NVIDIA GeForce RTX 4090 – 4 つの e スポーツゲームのパフォーマンステスト

4 つの e スポーツゲーム: 「Rainbow Six: Siege」、「League of Legends」、「APEX Heroes」、「CS:GO」などはいずれも高度なスキル、チームワーク戦術的な対戦シューティング、DOTA タイプのゲームです, したがって、ゲームの画質と詳細が低い条件では、ゲームの FPS も平均 100 フレームを超えます。2160p、1440p、および特殊効果の最高設定でテスト済み。

e スポーツゲームの場合、RTX 4090 によるパフォーマンスの向上は明らかではありません。結局のところ、RTX 3090 は 2160p の e スポーツゲームでも非常に強力なパフォーマンスを提供できます。テストでは、明らかにパフォーマンスが向上したのは「Rainbow Six: Siege」のみでした。、他の 3 つは比較的近いです。

**2160p e スポーツゲームのテスト、FPS が高いほど優れています。**

NVIDIA GeForce RTX 4090 – 11 ゲームのパフォーマンステスト

AAA 試合 11 試合の平均パフォーマンス 、フルエフェクトをオンにして 2160p、1440p でもテストしました。このテストでは F1 にライトチェイスのみを使用し、残りのゲームにはライトチェイスや DLSS アクセラレーションはありません。GPU の実際の従来のレンダリングをテストします。ゲームのパフォーマンス。

ゲームテストリストには、エントリーレベルの「F1 2021」、「Forza Horizon 5」レースゲーム、「Tomb Raider: Shadow」、映画ゲーム「Death Stranding」、「Gears of War 5」が含まれます」、「ディビジョン 2」、「ホライゾン: エクスペクティングドーン」のほか、「ボーダーランズ 3」、「アサシンクリード: バイキングエイジ」、「レッドデッド 2」、「ゴッドオブウォー」などのパフォーマンス重視のテストも含まれます。

RTX 4090 は、2160p および AAA ゲームでかなり優れたパフォーマンス向上を実現し、11 ゲームで平均 148 FPS を達成しました。これは、RTX 3090 の平均と比較して約 1.7 倍の平均パフォーマンスアップグレードを達成できます。 89 FPS。

ただし、解像度 1440p では、RTX 4090 は平均 200 FPS、RTX 3090 は平均 143 FPS となり、約 1.4 倍のパフォーマンス向上となります。

メインの 2160p 解像度の下では、RTX 4090 は DLSS アクセラレーションに依存せずにプレーヤーのパフォーマンスを約 1.7 倍向上させることができることがわかります。パーセンテージで表すと、平均 66% のパフォーマンスアップグレードが得られます。

NVIDIA GeForce RTX 4090 – 9 つのレイチェイスゲームをテスト済み

9 つのレイチェイス DXR ゲーム 最も人気のある「Rider 2077」、「Control」、「Watch Dogs: Liberty Legion」、「Thriller: Exile」、「Marvel's Spider-Man Remastered Edition」、「Marvel」を使用してテストされましたインターステラー』、『ゴーストスレッド: トーキョー』、『極地ハウル 6』、『邪悪な城の村』などのテスト用ゲーム。2160P、1440p の解像度をテストします。特殊効果/ライトチェイスの最高設定に加えて、DLSS アクセラレーションも有効になります。詳細な設定については表を参照してください。

RTX 4090 は、「Dian Yu Ke 2077」の DLSS 2 の加速下で平均 110 FPS に達することができます。これは、RTX 3090 の平均 60 FPS よりもはるかに高いです。「Control」や「Ghost Line: Tokyo」などの光追跡ゲームでも、RTX 4090 による強力な光追跡ゲームのパフォーマンスアップグレードを実感できます。

RTX 4090 は、2160p および 9 回のライトチェイスゲームテストで平均 132.3 FPS に達します。RTX 3090 と比較すると、平均 82 FPS です。ライトチェイスゲームのパフォーマンスは約 1.6 倍、アップグレードの平均 65% に向上します。

1440p に関しては、RTX 4090 は平均 169 FPS、RTX 3090 は平均 119.8 FPS と約 1.4 倍、41% のパフォーマンス向上を実現しました。

**2160p ライトチェイスゲームテスト、FPS が高いほど優れています。**

**1440p ライトチェイスゲームテスト、FPS が高いほど優れています。NVIDIA**

GeForce RTX 4090 – DLSS 3 パフォーマンステスト

テスト期間中、NVIDIA は、主にメディアが DLSS 3 によるパフォーマンスの向上を垣間見ることができるように、プレリリーステストバージョンを提供しました。テストされたゲームには、Microsoft Flight Simulator、A Plague Tale が含まれます。 Requiem、Unreal Engine 5: Lyra、F1® 22、Unity Enemies、Traitor 2077、Justice Online」では、2160p の解像度とライトトラッキングの最高設定が使用されています。

DLSS 3 ゲーム設定には、「超解像度」と「フレーム生成」の明確なオプションがあります。DLSS 3 のテクノロジーを使用するには両方の機能を同時に有効にする必要がありますが、RTX 30 / 20 シリーズのプレーヤーのみ有効にすることができます。超解像度機能、フレーム生成は有効になりません。

**Microsoft Flight Simulator DLSS 3 の設定。**

RTX 4090 は DLSS 3 によって高速化され、「Dian Yu Ren Ke 2077」のパフォーマンスは平均 140 FPS の約 3.5 倍のパフォーマンス向上を達成できます。Unity エンジンによってリリースされた敵のムービーアニメーションも、DLSS 3 を使用してリアルタイムレイトレーシングレンダリングで実現できます。103 FPS、約 3.68 倍のパフォーマンスアップグレード。

DLSS 3 パフォーマンス設定では、RTX 4090 は約 1.9 倍～4.7 倍のパフォーマンス向上を達成でき、平均は約 2.95 倍であり、これは、RTX 4090 のパフォーマンスとも一致しています。 NVIDIA が公開した場合は 2 ～ 4 倍。

ただし、RTX 40 シリーズのプレイヤーに利益をもたらすためには、ゲームが DLSS 3 テクノロジーをサポートするまで待つ必要もありますが、RTX 4090 は最初に DLSS 3 のサポートを開発し、いつになったら将来的には中級レベルのエントリーレベルの RTX 4060 が登場し、プレイヤーはゲームアクセラレーションパフォーマンスのアップグレードを実現できるようになります。

NVIDIA GeForce RTX 4090の消費電力と温度測定

Time Spy ストレステストと「Electric Rider 2077」を使用したグラフィックスカードの消費電力と温度テスト。消費電力は、NVIDIA が提供する PACT ツールを使用して測定されます。このツールは、PCIe スロットと電源 12V によって提供されるワット数を監視できます。

グラフィックスカードの温度に関しては、RTX 4090 初期バージョンはストレステストで最高温度 67.8°C を維持し、2077 年のゲーム中の温度は 65°C わずかに低下しましたが、比較対象の RTX 3090 初期バージョンではサーマルパッドが変更されているため、温度パフォーマンスは同等です。

グラフィックスカードの TBP 消費電力テスト、Time Spy ストレステストでは、RTX 4090 は平均消費電力 390 W、瞬間最大消費電力 462 W を達成しましたが、2077 ゲームの平均消費電力は消費電力は 358W、瞬間消費電力は 398W。

RTX 4090 は、Furmark Xtreme バーンインを使用して、平均消費電力 458 W に達することができます。これは、NVIDIA が事前に設定した消費電力の上限でもあります。ブランド製カセットがオーバークロックされている場合、2 つの 12VHPWR 電源が使用されていない限り、出力も約 500 W になるはずです。

**RTX 4090 Founding Edition GPU の消費電力。**

**Furmark Xtreme のバーンインは平均 458 W、瞬間的に 482 W になります。**

要約

NVIDIA GeForce RTX 4090 は、その強みで前世代を再び上回り、DaVinci Resolve 18 はデュアル NVENC のアクセラレーションの下でより高速なビデオ出力パフォーマンスを実現し、新世代の AV1 エンコーディングをサポートできるようになりました。 RTX 40 シリーズの標準となる機能と 3D クリエーション性能 Blender と V-Ray は 2 倍近く性能が向上しており、間違いなく最強のクリエイティブ武器です。

ゲームのパフォーマンスに関しては、2160p および 4K AAA およびライトチェイスゲームのパフォーマンスを再び支配しています。AAA ゲームは平均 1.7 倍、ライトチェイスゲームは平均 1.6 倍アップグレードされます。DLSS 3 が AI フレーム補完を普及させれば、平均 2.95 倍の高速化がもたらされる可能性があります。4K100fps 100 フレームというプレイヤーの夢をかなえる、プラグインレベルのゲーム魔法の武器であることは間違いありません。

DLSS 3 は現在、最大 35 個のゲーム (プログラムを含む) をサポートしていますが、各ゲームのリリースと更新時期が異なるため、新しいテクノロジーが普及するまでにはしばらく時間がかかります。

この世代では 2 倍近く性能が向上しており、RTX 4080 の性能は今後も明るいことが期待できますが、相対的に 2 倍の性能向上により、RTX の価格は大幅に上昇します。 4090 は RTX 3090 よりもコスト効率が高くなりますが、それに応じて RTX 4080 の価格も上昇します。このような状況下で、プレイヤーはこの究極のパフォーマンスを追求するために、どれだけの予算を必要とするのでしょうか？特に、将来の主流の RTX 4060 がプレーヤーの期待と価格の甘さに応えられるかどうかは、NVIDIA の計算方法にかかっています。

RTX 4090 は明日 10/12 午後 9 時に発売されます。台湾での希望価格はNT$56,990から。台湾が創業バージョンを販売するかどうかについては、NVIDIA 台湾自身の発表に委ねられます。RTX 4080に関しては11月まで待ちます。来年には RTX 40 ラップトップ GPU が登場すると予想されますが、最初のフラッグシップの価格はかなり高くなるはずです。ゲーム用ノートパソコンに興味のあるプレイヤーは、来年の CES のニュースに注目してください。

私は NVIDIA GeForce RTX 4090 なので、4K 100fps も夢ではありません。

この記事が役に立った場合は、この記事をソーシャルメディアでお友達と共有してください。ありがとう！！

この記事はレビューの個性に基づいています。コンテンツが事実ではない、または正確でない場合は、事実確認を行う責任があります。

タイトル: 私の 4K 100 フレーム! NVIDIA GeForce RTX 4090 グラフィックスカードテストレポート

新世代のフラッグシップ カード Ada Lovelace、NVIDIA GeForce RTX 4090 に出会った後

Ada Lovelace: プロセス クロックのアップグレード、高度なレイ トレーシング、デュアル AV1 エンコードを備えた完全なコア AD102 GPU

ADA 第 3 世代 RT コアと新しい光学トラッキング テクノロジーを備えた第 3 世代 RT コア

大加速時代の DLSS 3 とオプティカル フロー アクセラレータ

デュアル AV1 オーディオおよびビデオ エンコーディング、Portal RTX が 11 月に発売

NVIDIA GeForce RTX 4090 Founders Edition グラフィックス カードは箱から出してすぐに使用可能/背面は前面のクラシックが再強化されたもの

NVIDIA GeForce RTX 4090 クリエイティブ ビデオ出力、GPU レンダリング パフォーマンス テスト

NVIDIA GeForce RTX 4090 – 3DMark ベンチマーク パフォーマンス テスト

NVIDIA GeForce RTX 4090 – 4 つの e スポーツ ゲームのパフォーマンス テスト

NVIDIA GeForce RTX 4090 – 11 ゲームのパフォーマンス テスト

NVIDIA GeForce RTX 4090 – 9 つのレイチェイス ゲームをテスト済み

GeForce RTX 4090 – DLSS 3 パフォーマンス テスト