我的4K 100幀!NVIDIA GeForce RTX 4090 顯示卡測試報告

NVIDIA GeForce RTX 4090

創意武功,還有遊戲魔法,我是NVIDIA GeForce RTX 4090。NVIDIA新一代Ada Lovelace GPU架構,繼首款旗艦卡之後正式推出,不僅工藝升級,時鐘飆升,還有Tensor Core和RT Core的升級,以及新一代DLSS 3的AI補幀技術開啟GPU加速時代,同時擁有AV1雙編碼引擎,不僅滿足遊戲玩家4K 100幀的夢想,同時也是3D渲染、創作、模擬和計算方面的專家。讓我們從架構、規格和性能的角度來審視新一代的卡片。升級體驗。

遇見新一代旗艦卡Ada Lovelace,NVIDIA GeForce RTX 4090

NVIDIA新一代Ada Lovelace微架構RTX 40系列首款旗艦GeForce RTX 4090將於明天10/12正式發售,售價1599美元。那麼GeForce RTX 4080 16GB和12GB兩款新卡也將於11月推出,售價分別為1199美元和899美元。

艾達·洛夫萊斯 – 量子飛躍。

這一代NVIDIA改用台積電4N客製化製程和Ada Lovelace微架構,讓GPU擁有更多SM單元,進一步增加CUDA、Tensor Core和RT Core等數量。TMU和ROP等單元數量的增加,再加上2.5GHz Boost的超高時鐘,讓RTX 4090以2-4倍的性能超越RTX 3090 Ti。

GeForce RTX 4090 擁有 16,384 個 CUDA 核心、512 個第四代 Tensor 核心和 128 個第三代 RT 核心、2.52 GHz Boost 時脈和 24GB GDDR6X 顯存。這款超瘋狂的規格,同時滿足專業創作、渲染與旗艦遊戲玩家的需求,這款超瘋狂的顯示卡售價為新台幣56,990元。

GeForce RTX 4080有兩種規格,RTX 4080 16GB有CUDA 9728、Tensor Core 304、RT Core 76、2.51GHz Boost時鐘,NT$ 42,990起;RTX 4080 12GB 為 CUDA 7680、240 個 Tensor Core、60 個 RT Core、2.61GHz Boost 時鐘,新台幣 31,990 元起。

RTX 4090、RTX 4080 規格表。
RTX 4090將取代RTX 3090 / Ti產品,而RTX 4080將取代RTX 3080 12GB / Ti產品。

以美元定價來看,這一代RTX 4080確實更貴,但根據NVIDIA目前給出的性能基礎,RTX 4090比RTX 3090 Ti快2-4倍,而RTX 4080 比RTX 3080 Ti 快2-4 倍。因此,從性能和價格上來說,RTX 4090的性價比肯定要優於RTX 3090 Ti。即使RTX 4080 12GB性能可以與RTX 3090 Ti競爭,這一代RTX 4080的價格也會相應提高。

最後,為什麼NVIDIA每一代的效能都能如此瘋狂的提升2-4倍?除了製程改進和時鐘飆升之外,更重要的是新架構Ada Lovelace Engine帶來的新技術SER、Displaced Micro-Mesh Engine、Opacity Micro map,以及光流加速器和DLSS 3的AI補幀,這就是NVIDIA最狂野的技術實力。

Ada Lovelace 關鍵技術.

Ada Lovelace:完整的核心 AD102 GPU,具有進程時鐘升級、高級光線追蹤和雙 AV1 編碼

Ada Lovelace微架構,達到763億個晶體管,總共有12組GPC,72組TPC和144組SM單元,這意味著總共有18432個CUDA,576個Tensor 核心和144 個RT 核心。目前這一代的旗艦RTX 4090僅在128個SM單元以下,這意味著RTX 4090 Ti未來仍有可能超越當前的旗艦產品。

除了改進SM單元之外,Ada還有GDDR6X高速顯存、提高AI推理性能的第4代Tensor Core、提高光線追踪質量的第3代RT Core,以及第8代音視頻編碼器,支援AV1硬體編碼。性能較 DLSS 3 提升 2-4 倍。

AD102全身GPU框圖.

ADA 第 4 代張量核心

Tensor Core是高效能運算核心,為深度學習訓練和推理所需的矩陣運算帶來突破性的效能提升。核心針對「矩陣乘法」和「累加數學運算」。設計在AI和HPC的應用中扮演著非常重要的角色。

與Ampere架構相比,Ada可以帶來FP16、BF16、TF32、INT8和INT4 2倍的Tensor TFLOPS效能提升。同時,加入Hopper架構的FP8 Transformer Engine可以提供1.3 PetaFLOPS的Tensor Core效能。

艾達·洛夫萊斯.

ADA第三代RT核心與新光學追蹤技術第三代RT核心

Ada架構可以帶來2倍更快的Ray-Triangle Intersection輸出效能(與之前的Ampere相比)。新加入的“ 不透明度微圖引擎 ”允許物體擁有微三角形的虛擬網格,可以用來記錄物體的不透明狀態,有不透明、透明或未知三種狀態。

ADA 的不透明度微貼圖引擎使物件具有虛擬網格記錄不透明度狀態。

如果光線追踪到不透明表示,則記錄並返回“命中”,如果是透明區域,則直接忽略光線追踪,將未知區域交給SM通過程式化的Shader來處理光線的交叉。不透明度微貼圖引擎用於評估不透明蒙版,即使用重心座標報告「射線/三角形」交集的等邊三角形蒙版。

透過Opacity Micro map Engine,可以直接進行幾何體alpha測試,減輕Shader的alpha計算負擔,並且該功能可以讓開發者繪製更複雜的形狀、半透明物體,例如蕨類植物、柵欄和其他對象,並透過 Ada RT Core 實現高效的光線追蹤。

像遊戲畫面的煙霧一樣,使用Opacity Micro map Engine技術可以降低光線追蹤的複雜度。
上圖左邊是原始光線追蹤量。顏色越深,計算出的光越多,但明顯煙霧效果相當半透明,但整體性能下降;圖片右邊是 應用不透明微圖後需要 發動機. 增加了光線追蹤計算量,從而提高了處理複雜物體和透明效果時光線追蹤的性能。

另外,Ada RT Core 增加了一個” 置換的微網格引擎 ”解決日益複雜的幾何場景、光線追蹤的運算負擔以及減少BVH資料所需的記憶體/儲存容量。Displaced Micro-Mesh利用幾何空間的相關性,以參考三角形點加上位移方向來表示複雜的幾何形狀。

這樣可以避免光線追蹤時產生大量BVH結構,BVH遍歷的性能可以更加有效,並且可以利用現有的Micro-Mesh LOD進行渲染光柵化期間的原始幾何圖形。也就是說,位移微網格引擎可以使用簡單的 BVH、基準三角形點和位移方向圖來創建高度詳細的幾何光線追蹤。

要使用光線追蹤詳細渲染螃蟹殼,需要將螃蟹細分為1024個三角形,然後使用BVH演算法計算每個位置的光線變化,從而產生一個非常大量的BVH 數據和性能損失。
Ada的Displaced Micro-Mesh Engine就是在1個Triangle的位移方向圖上添加一個複雜的曲面,這樣就只需要簡單的BVH計算,用位移方向圖來計算光線變化在每個位置。

這一代Ada新增了「 著色器執行重新排序 ”(SER)函數,可以動態安排Shader處理光線,以達到更好的執行效益。

簡單來說,場景計算光線追蹤時,是從主光線開始計算遇到的物體,然後主光線產生的反射和環境擴散會進行第二次光線追踪,但是第二個光線追蹤很混亂。這種情況的順序也導致了第二次光線追蹤的Shader性能不佳。

總之,SER可以優化光線追蹤的Shader,使得運算更有效率。

因此,在光線追蹤管線中加入Shader Execution Reordering後,可以對第二次光線追蹤命中的相同Shader進行重新排序和分組,使得光線追蹤Shader具有更好的效率。SER 可以提供 2 倍 RT Shader 效能提升,當《Cyber​​punk 2077》在 Overdrive 模式下運作時,SER 結果有 44% 的效能提升。

這張圖更好地解釋了SER功能。 
第一條光線追跡的計算是順序狀態,但第二條光線追跡包括反射、折射、擴散。因此,由於計算的無序性,Shader無法發揮最佳的效能。可以透過SER進行優化。大大提高了性能。

DLSS 3與大加速時代的光流加速器

由於遊戲擁有豐富的物體、更複雜的幾何體、美麗的世界以及物理逼真的光線追蹤等技術堆疊,傳統的GPU渲染性能無法跟上當代遊戲的需求,因此NVIDIA是首先AI深度學習加速的DLSS技術的發展,也讓各GPU廠商推出了自己的加速技術,正式迎來了GPU加速時代。

2018年《戰地V》推出時導入光線追踪,每像素只有39條光線追踪,但4年後,《電動騎士2077》可以達到每像素635條光線追踪,這是非常高效。但這是一個巨大的變化。

RTX 40獨有的「DLSS 3」是在DLSS 2的技術基礎上,加入了「AI補幀」的概念,也就是光流加速器的功能。Optical Flow是電腦視覺中使用的一種光流方法,用於計算連續影像中每個像素的移動方向和移動量。

DLSS 3技術需要遊戲引擎提供:較低解析度的渲染影像和運動向量,透過DLSS的深度學習網路推斷高解析度影像,並將影像提供給光流加速器計算每個像素的運動方向和運動量,最後透過Optical Multi Frame Generation產生AI補幀圖片。

DLSS 3使用光流加速器計算圖片像素的光流運動方向和向量並使用Optical Multi Frame Generation的AI推演Frame2的圖像,這就是AI白話補充框架。
為什麼AI補幀需要光流加速器? 
主要原因是上圖中的物體可以透過遊戲引擎的Motion Vectors知道運動方向,但是如果地面上的影子不是物體,則物體的運動向量陰影會丟失,補框的時候會出現問題。
引擎的運動向量和光流的像素向量結合可以產生更穩定的AI補幀。

當遊戲開啟DLSS 3、Frame Generation並透過Reflex降低延遲時,遊戲畫面Frame1的1/4像素將被遊戲渲染,剩餘的3/4會是DLSS超解析度推導出來的像素,然後轉到下一張A圖Frame2,這張是DLSS Frame Generation產生的,所以Frame1 Frame2總共7/8的圖片是AI產生的DLSS 3.

Frame1是由引擎渲染​​低解析度影像(1/4)而剩下的3/4影像是由DLSS產生的,然後Frame2完全是由DLSS Frame Generation繪製的,所以2 幀中總共7/8 是由DLSS 產生的。DLSS的AI推理就此誕生。

DLSS 3 可以透過 AI 補幀提供 2-4 倍的遊戲性能提升,同時保持與原生渲染類似的圖像質量,但也會增加整體遊戲延遲,因此 NVIDIA 強制 DLSS 3包含Reflex技術,透過取消Render Queue讓GPU在CPU處理完成後立即接管渲染,實現更低的系統延遲。

因此,DLSS 3結合了AI超分辨率、幀生成和ReFlex等技術,依托第4代Tensor Core、光流加速器以及NVIDIA用來訓練AI的超級計算機,滿足為下一代遊戲玩家提供4K100fps 的終極效能。

DLSS 3 全端。

DLSS 3 需要 Ada 的光流加速器硬體來啟用 Frame Generation 才能達到理想的效能提升,因此 DLSS 3 目前是 RTX 40 系列的獨家功能,未來支援 DLSS 3 的遊戲也將與DLSS 2 相容,即GTX 900 及更高版本支援DLSS 超解析度和NVIDIA Reflex。

DLSS 3 = 超解析度 影格產生 反射。 
原版DLSS 2只需超解。

雙AV1音視訊編碼,Portal RTX 11月上線

除了上述升級之外,Ada Lovelace還搭載了雙第8代NVENC編碼引擎,主要增加了AV1的音視頻編碼功能。至於解碼,第5代NVDEC與Ampere相同。畢竟NVDEC已經完全支援各種音視頻解碼的能力了。

艾達·洛夫萊斯.

RTX 40系列搭載雙第8代NVENC編碼引擎,主要包含AV1音視訊編碼的功能。這也是未來主流的音視訊串流編碼,比H.264更好的信噪比。與碼率相比,AV1的影像畫面會比H.264編碼的效果更好。

AV1音視訊編碼可以有更好的畫質和性能提升,這也是未來串流媒體的主要音視頻編碼。
左AV1和右H.264相同8Mbps碼率下,地板細部差異較大(4K SBS對比)。
左AV1,右H.264在相同8Mbps碼率下,道路紋理差異清晰可見(4K SBS對比)。

雙第8代NVENC編碼引擎,為了獲得2倍的視頻輸出性能提升,需要DaVinci Resolve、Voukoder等視頻編輯軟體支持,劍影將支持RTX 40雙編碼引擎在第一時間。Adobe Premiere Pro 將不得不等待未來的更新。

例如錄製8K60影像時,可以使用雙編碼器,每個編碼器負責7680 x 2160的分辨率,以獲得更好的性能提升。

雙編碼引擎.

除了AV1編碼和雙編碼引擎外,NVIDIA Omniverse還支援全新的DLSS 3技術,以及RTX Remix的神級遊戲Mod製作工具。

不過對玩家來說,經典遊戲Portal With RTX將在11月推出免費DLC,支援Vulkan RT相容GPU,當然最好的體驗是使用RTX 40和DLSS 3。

艾達的創作重點。
Portal With RTX將於11月發表免費DLC;RTX Remix 即將發布。

NVIDIA GeForce RTX 4090 Founders Edition顯示卡開箱/背面是正面經典再增強

繼Ada Lovelace卡之後,NVIDIA GeForce RTX 4090創始版,保持了Ampere一代首創的“後為前”和“少而精”的全新顯卡美學設計。Founders Edition 的 X 框架採用堅固耐用的鋁合金框架,並採用陽極氧化表面處理以實現優質表面處理和金色金屬表面處理。

媒體版NVIDIA RTX 4090創始版。
盒子內部特殊設計

邊框內部佈滿散熱片,內部為均熱板為GPU和VRAM散熱,然後透過熱量將廢熱引導至散熱片管道。這一代RTX 4090創始版採用了更大的116mm、FDB、7葉雙風扇,並將顯卡厚度增加至3-Slot,並將顯示卡長度縮短至30.48cm(12英寸)。

這一代均熱板也進行了優化,有顯存專用的切口,讓均熱板與GPU接觸更均勻,顯存的導熱墊減小到1.5 mm,導熱效果更好;這一代散熱器可支援高達 650W Qmax 冷卻能力。

背面是經典正面,RTX 4090和顯示卡前面的穿透式冷卻氣流。
原來的正面也填充了帶有散熱片和後風扇的金屬框架,帶來了獨特的美學設計。

RTX 4090全面更換為PCIe 12 4 Pin(12VHPWR)供電接口,一條線可傳輸高達600W的功耗,同時也讓整條線在使用時更加美觀新卡已安裝。當然,創始版本也提供了12VHPWR轉4根PCIe 6 2pin線。

一般建議至少連接3個PCIe 6 2pin進行轉換。若購買新電源,建議選擇符合ATX12 V3.0和EPS12V V2.92規格的新電源。這樣你就可以收起醜陋的大砲了,只要一根12VHPWR線就能提供顯示卡所需的電源。

RTX 4090 使用 PCIe 12 4 Pin (12VHPWR) 供電。
配件中的12VHPWR連接4條PCIe 6 2針電纜(塔式)。
專業新電源供應器只需一條線即可滿足RTX 4090的供電需求

RTX 4090顯示輸出提供1個支援VRR、4K120Hz / 8K60Hz HDR的HDMI 2.1a,以及3個支援12位元4K240Hz HDR / 12位元8K60Hz HDR等輸出能力的Dis7Port 1.最多可同時連接4 個螢幕輸出。

RTX 4090顯示輸出。

NVIDIA GeForce RTX 4090創意影片輸出、GPU渲染效能測試

本次測試包括Adobe Premiere Pro 2020、DaVinci Resolve 18和Blender等創意測試,遊戲分別以2160p、1440p解析度、全特效、電競、AAA遊戲和燈光追逐性能並添加額外的DLSS 3 預測試,讓玩家充分了解RTX 4090 為什麼強大(這麼貴)。

最強顯示卡是NVIDIA GeForce RTX 3090 Founders Edition。

測試平台
處理器:Intel Core i9-12900K
主機板:華擎Z690 PG Velocita
記憶體:CORSAIR DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz
顯示卡:NVIDIA GeForce RTX 4090 創始版、NVIDIA GeForce RTX 3090 創始版
系統磁碟:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散熱器:華碩 ROG STRIX LC II 280mm
電源:海韻 PRIME PX-1000
作業系統:Windows 11 Pro 21H2 64位,可調整BAR大小
驅動版本:NVIDIA 521.90

GPU-Z 可查看NVIDIA GeForce RTX 4090信息,AD102 GPU採用4nm工藝,16384個渲染CUDA核心,以及24576 MB GDDR6X(Micron)顯存,GPU預設時脈為2235 MHz,Boost為2520赫赫。

GPU-Z.
DXVA檢查解碼器測試,目前所有視訊編解碼器均支援各種解析度的解碼。

達文西解決方案18 是一款純GPU加速的影片編輯程序,包括強大的色彩校正和特效功能,並且直接使用CUDA核心計算,使影片剪輯的播放和輸出具有非常好的性能。Beta 版本包括對 NVIDIA AV1 編碼的支援。

達文西解決方案18.

本測試分為兩部分。第一個測試項目使用 4K Blackmagic RAW 影像,每個影像都有一個 Wedding_Heavy_Styles 時間軸。影片使用了大量的Resolve效果,例如OFX:光線/發光/素描等,輸出了相當高風格的電影類型。

Bride_FaceRefine_Selective_Color 使用 Face Refinement 進行臉部追踪,並以顏色突出主要新娘;50% Retime 和 Optical Flow – Enhanced Better 皆使用 Optical Flow 技術將影像速度降低 50%。

SuperScale2x 4K Source 使用 4K ProRES 來源視訊產生 2x Zoom In 主體的 4K 視訊輸出;SuperScale4x HD_Source 使用高清 H.264 來源視訊並使用 Resolve Super Scale 輸出 4K 視訊。

RTX 4090這部分的表現可以說非常出色,尤其是在光流測試中,節省了近2倍的輸出時間,讓創作者擁有更快的輸出表現。

DaVinci Resolve 18,時間越少越好

第二個測試是雙NVENC編碼的AV1和HEVC編碼測試。測試項目是Blender開放電影項目《鋼鐵之淚》的44秒短片,並有8k Prores442HQ 30FPS和4K Prores422HQ 30FPS視頻,可用於測試HEVC、AV1編碼的輸出性能。

輸出設定主要使用NVIDIA編碼器,品質:限制為80000 Kb/s,編碼設定檔:主要
速率控制:恆定位元速率,預設:更快,調諧:高質量,兩次通過:停用和其他輸出設定。

在性能方面,RTX 4090在輸出4K30時的性能與RTX 3090相差不大,但在處理8K輸出時,RTX 4090的雙編碼引擎將HEVC輸出時間加速2倍並且AV1編碼的速度也相當快,可見視訊編輯軟體只要支援RTX 40雙編碼引擎,就可以實現出色的編碼性能增長。

DaVinci Resolve 18雙NVENC編碼測試,越短越好

Adobe Premiere Pro 2022 影片編輯軟體,採用自主研發的Mercury Playback Engine GPU加速,可利用GPU的編碼引擎加速影像輸出速度。測試項目1是公司的1080p60fps開箱影片;BigMix4K 專案使用 3 段 FinalAdjusted_MPE 1920×1080 影像來形成 H.264 和 HEVC 格式輸出的 4K 時間軸。

(測試的Premiere Pro 2022尚不支援RTX 4090雙編碼功能。)

從性能上來說,RTX 4090 仍然比 RTX 3090 擁有更快的輸出速度,但與支援的 DaVinci Resolve 不同,後者可以有驚人的輸出時間縮短。因此,本次測試主要提供給大家參考。

Adobe Premiere Pro 2022.
Adobe Premiere Pro 2022 輸出,越短越好。

攪拌機 是一款跨平台、開源的 3D 創作工具,支援各種 3D 任務:建模、綁定、動畫、模擬、渲染、合成和運動追蹤。測試時使用Blender Benchmark 3.3.0測試Demo專案的渲染工作。

Blender Benchmark 3.3.0測試,可以看出RTX 4090在3個場景下每分鐘的採樣數(效率)大約是RTX 3090的兩倍,可見3D創作艾達·洛夫萊斯的力量。

Blender,效能越高越好

V-Ray 基準 由 Chaos Group 開發。V-Ray是基於物理定律設計的光線渲染軟體,該工具可以分別對CPU和GPU的光線追蹤渲染影像進行計算測試。

V-Ray 無論是 GPU RTX 或 CUDA 計算,RTX 4090 以 1.9 倍的 Vpath 數量擊敗 RTX 3090。

V-Ray Benchmark,效能越高越好。

SPECviewperf 2020 是基於專業應用開發的標準繪圖性能測試工具,測試各種專業電腦圖形軟體如3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks等繪圖測試和工程模擬。

測試解析度為1920 x 1080,結果為FPS。這種表現與所使用的工具有關。RTX 4090的效能提升約1~2.9倍,取決於測試的程式和情況。

SPECviewperf 2020,FPS越高越好。

NVIDIA GeForce RTX 4090 – 3DMark 基準效能測試

3DMark Fire Strike 效能測試為主流DirectX 11 API測試場景,分別測試1080p、Extreme 1440p和Ultra 2160p的效能。

RTX 4090 Fire Strike 得分為 54174,而 Ultra Graphics 得分比 RTX 3090 快 2 倍,Extreme 為 1.8 倍,FHD 為 1.6 倍。

3DMark Fire Strike,分數越高越好

3DMark 時間間諜 是使用DirectX 12 API設計的測試場景,同樣鎖定AAA遊戲級別,分別測試1440p和Extreme 2160p的效能。

RTX 4090 在 Time Spy 中獲得了 32638 分的總成績,分別比 RTX 3090 高出 1.8 倍和 1.9 倍。

3DMark Time Spy,分數越高越好

用於光線追蹤測試, 3DMark 皇家港口在AAA遊戲場景中加入光線追踪,考驗了新一代GPU加速硬體光線追蹤的能力。同時,XDR測試是使用DirectX Raytracing API進行的功能測試。

即使沒有DLSS,RTX 4090也能擁有相當驚人的光線追蹤效能。Port Royal 達到 119 FPS 和 XDR 138 FPS。與RTX 3090相比,也帶來了1.95倍和2.44倍的效能提升。

3DMark Port Royal,越高越好。

3DMark DLSS 功能測試 可以對DLSS 3和DLSS 2進行性能測試。當設定為3840 x 2160和性能加速時,RTX 4090可以在DLSS 2中獲得138 FPS / 2.3x的性能提升。DLSS 3使用DLSS 2中獲得138 FPS / 2.3x的性能提升。DLSS 3使用DLSS 2中獲得138 FPS / 2.3x的性能提升。DLSS 3使用AI後產生影像,最高可達 193 FPS / 3.3 倍效能提升。

以後我們會用遊戲來衡量DLSS 3的效能。

3DMark DLSS 功能測試,越高越好。

NVIDIA GeForce RTX 4090 – 4款電競遊戲效能測試

4款電競遊戲:《虹彩六號:圍攻行動》、《英雄聯盟》、《APEX英雄》和《CS:GO》等,都是重技巧、團隊合作的戰術競技射擊和DOTA類型的遊戲,所以在遊戲畫質、細節不高的情況下,遊戲FPS也是平均100幀以上。在 2160p、1440p 和特效的最高設定下進行測試。

對於電競遊戲來說,RTX 4090帶來的效能提升並不明顯。畢竟RTX 3090也能為2160p的電競遊戲提供非常強勁的效能。測試中,只有《虹彩六號:圍攻行動》有明顯的性能提升。,其他三個都比較接近。

2160p電競遊戲測試,FPS越高越好
1440p遊戲測試,FPS越高越好

NVIDIA GeForce RTX 4090 – 11款遊戲效能測試

11款AAA遊戲的平均表現 ,同樣在2160p、1440p下測試,全特效開啟,本次測試僅F1使用光追,其餘遊戲無光追,無DLSS加速,測試GPU實際傳統渲染遊戲性能。

遊戲測試清單包括入門級《F1 2021》、《極限競速:地平線5》賽車遊戲、《古墓奇兵:暗影》、電影遊戲《死亡擱淺》、《戰爭機器5 》 」、《全境封鎖2》、《地平線:期待黎明》,以及《無主之地3》、《刺客教條:維京時代》、《荒野大鏢客2》和《戰神》等注重性能的測試。

RTX 4090在2160p和AAA遊戲中都有相當不錯的性能提升,11款遊戲平均幀率達到148 FPS,相比RTX 3090的平均可實現平均約1.7倍的性能提升89 FPS。

但在1440p解析度下,RTX 4090平均200 FPS,RTX 3090平均143 FPS,約1.4倍效能提升。

可見,在主打2160p解析度下,RTX 4090在不依賴DLSS加速的情況下,可以為玩家帶來1.7倍左右的效能提升。如果用百分比表示的話,平均效能提升66%。

2160p AAA遊戲測試,FPS越高越好。
1440p AAA遊戲測試,FPS越高越好。

NVIDIA GeForce RTX 4090 – 測試了 9 款光線追蹤遊戲

9款光線追蹤DXR遊戲 進行了測試,使用了最受歡迎的《騎士2077》、《控制》、《看門狗:自由軍團》、《驚悚片:流亡》、《漫威蜘蛛人重製版》 、《漫威《星際效應》、《幽靈線:東京》、《極地嚎叫6》和《邪城村》等遊戲進行測試。測試2160P、1440p分辨率,除了特效/光追最高設定外,還會開啟DLSS加速,詳細設定請參考圖表。

RTX 4090在《電禦客2077》的DLSS 2加速下可以達到平均110 FPS,遠高於RTX 3090的平均60 FPS;同樣在《控制》、《幽靈線:東京》等光追遊戲中,也能感受到RTX 4090帶來的強大光追遊戲性能升級。

RTX 4090在2160p和9個光追遊戲測試下平均可以達到132.3 FPS。與RTX 3090相比,其平均幀率為82 FPS。光追遊戲效能提升約1.6倍,平均提升65%。

對於1440p,RTX 4090平均169 FPS,RTX 3090平均119.8 FPS,約1.4倍,效能提升41%。

2160p光追遊戲測試,FPS越高越好
1440p光追遊戲測試,FPS越高越好。英偉達

GeForce RTX 4090 – DLSS 3 效能測試

測試期間,NVIDIA提供了預發布測試版本,主要是為了讓媒體一睹DLSS 3帶來的性能提升。測試的遊戲包括《微軟模擬飛行》、《瘟疫傳說》: 《安魂曲》、虛幻引擎5:Lyra、F1® 22、Unity Enemies、Traitor 2077 和Justice Online”,它們使用2160p 解析度和最高的光追蹤設定。

在DLSS 3遊戲設定中,會有明確的「超解析度」和「幀生成」選項。必須同時啟用這兩個功能才能使用DLSS 3技術,而RTX 30 / 20系列的播放器只能啟用。超解析度功能,幀生成將不會啟用。

微軟模擬飛行 DLSS 3 設定。
《電動騎士2077》的DLSS 3設定。

RTX 4090透過DLSS 3加速,《電宇客2077》效能可達到平均140FPS約3.5倍的效能提升;而Unity引擎發布的《敵人》電影動畫也可以在即時光線追蹤渲染下使用DLSS 3來實現。103 FPS 約 3.68 倍效能提升。

在DLSS 3 Performance設定下,RTX 4090可以實現約1.9x~4.7x倍的效能提升,平均約為2.95x倍,這也符合NVIDIA 發佈時的2-4 倍。

不過還需要等待遊戲支援DLSS 3技術才能讓RTX 40系列的玩家受益,不過RTX 4090初步開發了DLSS 3的支持,什麼時候未來中端、入門級RTX 4060問世,玩家將能夠獲得更好的遊戲加速性能提升。

DLSS 3遊戲效能測試,越高越好

NVIDIA GeForce RTX 4090功耗及溫度測量

顯示卡的功耗和溫度測試,使用Time Spy Stress測試和《電動騎士2077》進行測試。功耗是使用NVIDIA提供的PACT工具測量的,該工具可以監控PCIe插槽和電源12V提供的瓦數。

顯示卡溫度方面,RTX 4090創始版在壓力測試中最高溫度保持在67.8℃,2077遊戲時溫度小幅降低了65℃,而對比RTX 3090創始版改變了導熱墊,所以溫度表現相當。

RTX 4090 Founders Edition GPU溫度。

在顯示卡TBP功耗測試中,在Time Spy Stress測試中,RTX 4090取得了平均功耗390W、瞬時最大462W的成績,而2077年遊戲平均功耗為功耗358W,瞬時功耗398W。

RTX 4090可以使用Furmark Xtreme燒機達到平均功耗458W,這也是NVIDIA預設的功耗上限。品牌卡帶超頻的話也應該在500W左右,除非使用兩個12VHPWR電源。

RTX 4090創始版GPU功耗。
Furmark Xtreme 燒機平均功率 458W,瞬時功率 482W

總結

NVIDIA GeForce RTX 4090再次以實力超越前輩,讓DaVinci Resolve 18在雙NVENC加速下擁有更快的視頻輸出性能,以及支持新一代AV1編碼功能,這將成為RTX 40系列的標配,而3D創作性能Blender和V-Ray都有近2倍的性能升級,這無疑是最強的創作武器。

遊戲性能方面,再次稱霸2160​​p和4K AAA以及光追遊戲的性能。AAA級遊戲平均升級1.7倍,輕追遊戲平均升級1.6倍。如果DLSS 3普及AI補幀,可以帶來平均2.95倍的加速。,滿足玩家4K100fps 100幀的夢想,無疑是外掛級遊戲法寶。

DLSS 3目前最多支援35款遊戲(包括程式),但每款遊戲的發布和更新時間都不同,因此新技術的普及還需要一段時間。

NVIDIA DLSS 3 超過 35 款遊戲和應用程式的勢頭。

這一代有近2倍的性能提升,可以預見未來RTX 4080的性能依然光明,但隨著相對2倍的性能提升,RTX的價格也隨之下降4090比RTX 3090性價比更高,但RTX 4080的價格也會隨之上漲。在這種情況下,玩家需要多少預算才能追求這種極致的效能?尤其是未來主流的RTX 4060能否滿足玩家的期待以及價格的甜頭,就看NVIDIA如何算計了。

RTX 4090將於10/12明天晚上9點開賣。台灣建議售價新台幣56,990元起。至於台灣是否會發售創始版,則交由NVIDIA台灣自行公佈;至於RTX 4080則要等到11月了。預計明年應該會有RTX 40筆電GPU,但先發旗艦的售價應該會相當高。對遊戲筆記型電腦有興趣的玩家可以關註明年CES的消息。

4K 100fps不是夢,因為我是NVIDIA GeForce RTX 4090。

如果這篇文章對您有幫助,請在社交媒體上分享這篇文章給您的朋友。謝謝你!!

這篇文章是基於評論的個性。如果內容不真實或不準確,您有責任進行事實查核。

標題: 我的4K 100幀!NVIDIA GeForce RTX 4090 顯示卡測試報告

zh_TWChinese (Taiwan)