我的4K 100帧!NVIDIA GeForce RTX 4090 显卡测试报告

NVIDIA GeForce RTX 4090

创意武功,还有游戏魔法,我是NVIDIA GeForce RTX 4090。NVIDIA新一代Ada Lovelace GPU架构,继首款旗舰卡之后正式推出,不仅工艺升级,主频飙升,还有Tensor Core和RT Core的升级,以及新一代DLSS 3的AI补帧技术开启GPU加速时代,同时拥有AV1双编码引擎,不仅满足游戏玩家4K 100帧的梦想,同时也是3D渲染、创作、模拟和计算方面的专家。让我们从架构、规格和性能的角度来审视一下新一代的卡。升级体验。

遇见新一代旗舰卡Ada Lovelace,NVIDIA GeForce RTX 4090

NVIDIA新一代Ada Lovelace微架构RTX 40系列首款旗舰GeForce RTX 4090将于明天10/12正式发售,售价1599美元。那么GeForce RTX 4080 16GB和12GB两款新卡也将于11月推出,售价分别为1199美元和899美元。

艾达·洛夫莱斯 – 量子飞跃。

这一代NVIDIA改用台积电4N定制工艺和Ada Lovelace微架构,让GPU拥有更多SM单元,进一步增加CUDA、Tensor Core和RT Core等数量。 TMU和ROP等单元数量的增加,再加上2.5GHz Boost的超高时钟,让RTX 4090以2-4倍的性能超越RTX 3090 Ti。

GeForce RTX 4090 拥有 16,384 个 CUDA 核心、512 个第四代 Tensor 核心和 128 个第三代 RT 核心、2.52 GHz Boost 时钟和 24GB GDDR6X 显存。拥有超疯狂的规格,同时满足专业创作、渲染与旗舰游戏玩家的需求,这款超疯狂的显卡售价为新台币56,990元。

GeForce RTX 4080 有两种规格,RTX 4080 16GB 有 CUDA 9728、Tensor Core 304、RT Core 76、2.51GHz Boost 时钟,NT$ 42,990 起;RTX 4080 12GB 为 CUDA 7680、240 个 Tensor Core、60 个 RT Core、2.61GHz Boost 时钟,新台币 31,990 元起。

RTX 4090、RTX 4080 规格表
RTX 4090将取代RTX 3090 / Ti产品,而RTX 4080将取代RTX 3080 12GB / Ti产品。

以美元定价来看,这一代RTX 4080确实更贵,但根据NVIDIA目前给出的性能基础,RTX 4090比RTX 3090 Ti快2-4倍,而 RTX 4080 比 RTX 3080 Ti 快 2-4 倍。因此,从性能和价格上来说,RTX 4090的性价比肯定要优于RTX 3090 Ti。即使RTX 4080 12GB性能可以与RTX 3090 Ti竞争,这一代RTX 4080的价格也会相应提高。

最后,为什么NVIDIA每一代都能如此疯狂的提升2-4倍的性能?除了工艺改进和时钟飙升之外,更重要的是新架构Ada Lovelace Engine带来的新技术SER、Displaced Micro-Mesh Engine、Opacity Micro map,以及光流加速器和DLSS 3的AI补帧,这就是NVIDIA最狂野的技术实力。

Ada Lovelace 关键技术.

Ada Lovelace:具有进程时钟升级、高级光线追踪和双 AV1 编码的完整核心 AD102 GPU

Ada Lovelace微架构,达到763亿个晶体管,总共有12组GPC,72组TPC和144组SM单元,这意味着总共有18432个CUDA,576个Tensor 核心和 144 个 RT 核心。目前这一代的旗舰RTX 4090仅在128个SM单元以下,这意味着RTX 4090 Ti未来仍有可能超越当前的旗舰产品。

除了改进SM单元之外,Ada还有GDDR6X高速显存、提高AI推理性能的第4代Tensor Core、提高光线追踪质量的第3代RT Core,以及第8代音视频编码器,支持AV1硬件编码。性能较 DLSS 3 提升 2-4 倍。

AD102全身GPU框图.

ADA 第 4 代张量核心

Tensor Core是高性能计算核心,为深度学习训练和推理所需的矩阵计算带来突破性的性能提升。核心针对“矩阵乘法”和“累加数学运算”。设计在AI和HPC的应用中起着非常重要的作用。

与Ampere架构相比,Ada可以带来FP16、BF16、TF32、INT8和INT4 2倍的Tensor TFLOPS性能提升。同时,加入Hopper架构的FP8 Transformer Engine可以提供1.3 PetaFLOPS的Tensor Core性能。

艾达·洛夫莱斯.

ADA第三代RT核心和新光学跟踪技术第三代RT核心

Ada架构可以带来2倍更快的Ray-Triangle Intersection输出性能(与之前的Ampere相比)。新添加的“ 不透明度微图引擎 ”允许物体拥有微三角形的虚拟网格,可以用来记录物体的不透明状态,有不透明、透明或未知三种状态。

ADA 的不透明度微贴图引擎使对象能够具有虚拟网格记录不透明度状态。

如果光线追踪到不透明表示,则记录并返回“命中”,如果是透明区域,则直接忽略光线追踪,将未知区域交给SM通过程式化的Shader来处理光线的交叉。不透明度微贴图引擎用于评估不透明蒙版,即使用重心坐标报告“射线/三角形”交集的等边三角形蒙版。

通过Opacity Micro map Engine,可以直接进行几何体alpha测试,减轻Shader的alpha计算负担,并且该功能可以让开发者绘制更复杂的形状、半透明物体,例如蕨类植物、栅栏和其他对象,并通过 Ada RT Core 实现高效的光线追踪。

像游戏画面的烟雾一样,使用Opacity Micro map Engine技术可以降低光线追踪的复杂度。
上图左边是原始光线追踪量。颜色越深,计算出的光越多,但明显烟雾效果相当半透明,但整体性能下降;图片右边是 应用不透明微图后需要 发动机. 增加了光线追踪计算量,从而提高了处理复杂物体和透明效果时光线追踪的性能。

另外,Ada RT Core 增加了一个” 置换的微网格引擎 ”解决日益复杂的几何场景、光线追踪的计算负担以及减少BVH数据所需的内存/存储容量。Displaced Micro-Mesh利用几何空间的相关性,用参考三角形点加上位移方向来表示复杂的几何形状。

这样可以避免光线追踪时产生大量BVH结构,BVH遍历的性能可以更加有效,并且可以利用现有的Micro-Mesh LOD进行渲染光栅化期间的原始几何图形。也就是说,位移微网格引擎可以使用简单的 BVH、基准三角形点和位移方向图创建高度详细的几何光线追踪。

要使用光线追踪详细渲染螃蟹壳,需要将螃蟹细分为1024个三角形,然后使用BVH算法计算每个位置的光线变化,从而生成一个非常大量的 BVH 数据和性能损失。
Ada的Displaced Micro-Mesh Engine就是在1个Triangle的位移方向图上添加一个复杂的曲面,这样就只需要简单的BVH计算,用位移方向图来计算光线变化在每个位置。

这一代Ada新增了一个“ 着色器执行重新排序 ”(SER)函数,可以动态安排Shader处理光线,以达到更好的执行效益。

简单来说,场景计算光线追踪时,是从主光线开始计算遇到的物体,然后主光线产生的反射和环境扩散会进行第二次光线追踪,但是第二个光线追踪很混乱。这种情况的顺序也导致了第二次光线追踪的Shader性能不佳。

总之,SER可以优化光线追踪的Shader,使得运算更加高效。

因此,在光线追踪管线中添加Shader Execution Reordering后,可以对第二次光线追踪命中的相同Shader进行重新排序和分组,使得光线追踪Shader有更好的效率。SER 可以提供 2 倍 RT Shader 性能提升,当《赛博朋克 2077》在 Overdrive 模式下运行时,SER 结果有 44% 的性能提升。

这张图更好地解释了SER功能。 
第一条光线追迹的计算是顺序状态,但第二条光线追迹包括反射、折射、扩散。因此,由于计算的无序性,Shader无法发挥出最佳的性能。可以通过SER进行优化。大大提高了性能。

DLSS 3与大加速时代的光流加速器

由于游戏拥有丰富的物体、更加复杂的几何体、美丽的世界以及物理逼真的光线追踪等技术堆栈,传统的GPU渲染性能无法跟上当代游戏的需求,因此NVIDIA是首先AI深度学习加速的DLSS技术的发展,也让各个GPU厂商推出了自己的加速技术,正式迎来了GPU加速时代。

2018年《战地V》推出时导入光线追踪,每像素只有39条光线追踪,但4年后,《电动骑士2077》可以达到每像素635条光线追踪,这是非常高效。但这是一个巨大的变化。

RTX 40独有的“DLSS 3”是在DLSS 2的技术基础上,加入了“AI补帧”的概念,也就是光流加速器的功能。Optical Flow是计算机视觉中使用的一种光流方法,用于计算连续图像中每个像素的移动方向和移动量。

DLSS 3技术需要游戏引擎提供:较低分辨率的渲染图像和运动矢量,通过DLSS的深度学习网络推断高分辨率图像,并将图像提供给光流加速器计算每个像素的运动方向和运动量,最后通过Optical Multi Frame Generation生成AI补帧图片。

DLSS 3使用光流加速器计算图片像素的光流运动方向和矢量并使用Optical Multi Frame Generation的AI推演Frame2的图像,这就是AI​​白话补充框架。
AI补帧为什么需要光流加速器? 
主要原因是上图中的物体可以通过游戏引擎的Motion Vectors知道运动方向,但是如果地面上的影子不是物体,则物体的运动矢量阴影会丢失,补框的时候会出现问题。
引擎的运动向量和光流的像素向量结合可以产生更稳定的AI补帧。

当游戏开启DLSS 3、Frame Generation并通过Reflex降低延迟时,游戏画面Frame1的1/4像素将被游戏渲染,剩余的3/4会是DLSS超分辨率推导出来的像素,然后转到下一张A图Frame2,这一张是DLSS Frame Generation生成的,所以Frame1 Frame2总共7/8的图片是AI生成的​​DLSS 3.

Frame1是由引擎渲染​​低分辨率图像(1/4)而剩下的3/4图像是由DLSS生成的,然后Frame2完全是由DLSS Frame Generation绘制的,所以2 帧中总共 7/8 是由 DLSS 生成的。DLSS的AI推理就此诞生。

DLSS 3 可以通过 AI 补帧提供 2-4 倍的游戏性能提升,同时保持与原生渲染类似的图像质量,但也会增加整体游戏延迟,因此 NVIDIA 强制 DLSS 3包含Reflex技术,通过取消Render Queue让GPU在CPU处理完成后立即接管渲染,实现更低的系统延迟。

因此,DLSS 3结合了AI超分辨率、帧生成和ReFlex等技术,依托第4代Tensor Core、光流加速器以及NVIDIA用来训练AI的超级计算机,满足为下一代游戏玩家提供 4K100fps 的终极性能。

DLSS 3 全栈。

DLSS 3需要Ada的光流加速器硬件来启用Frame Generation以达到期望的性能提升,因此DLSS 3目前是RTX 40系列的独家功能,未来支持DLSS 3的游戏也将与 DLSS 2 兼容,即 GTX 900 及更高版本支持 DLSS 超分辨率和 NVIDIA Reflex。

DLSS 3 = 超分辨率 帧生成 反射。 
原版DLSS 2只需超解。

双AV1音视频编码,11月Portal RTX上线

除了上述升级之外,Ada Lovelace还搭载了双第8代NVENC编码引擎,主要增加了AV1的音视频编码功能。至于解码,第5代NVDEC与Ampere相同。毕竟NVDEC已经完全支持各种音视频解码的能力了。

艾达·洛夫莱斯.

RTX 40系列搭载双第8代NVENC编码引擎,主要包含AV1音视频编码的功能。这也是未来主流的音视频流编码,具有比H.264更好的信噪比。与码率相比,AV1的图像画面会比H.264编码的效果更好。

AV1音视频编码可以有更好的画质和性能提升,这也是未来流媒体的主要音视频编码。
左AV1和右H.264相同8Mbps码率下,地板细节差异较大(4K SBS对比)。
左AV1,右H.264在相同8Mbps码率下,道路纹理差异清晰可见(4K SBS对比)。

双第8代NVENC编码引擎,为了获得2倍的视频输出性能提升,需要DaVinci Resolve、Voukoder等视频编辑软件支持,剑影将支持RTX 40双编码引擎在第一时间。Adobe Premiere Pro 将不得不等待未来的更新。

例如录制8K60图像时,可以使用双编码器,每个编码器负责7680 x 2160的分辨率,以获得更好的性能提升。

双编码引擎.

除了AV1编码和双编码引擎外,NVIDIA Omniverse还支持全新的DLSS 3技术,以及RTX Remix的神级游戏Mod制作工具。

不过对于玩家来说,经典游戏Portal With RTX将在11月推出免费DLC,支持Vulkan RT兼容GPU,当然最好的体验是使用RTX 40和DLSS 3。

艾达的创作重点。
Portal With RTX将于11月发布免费DLC;RTX Remix 即将发布。

NVIDIA GeForce RTX 4090 Founders Edition显卡开箱/背面是正面经典再增强

继Ada Lovelace卡之后,NVIDIA GeForce RTX 4090创始版,保持了Ampere一代开创的“后为前”和“更少但更好”的全新显卡美学设计。Founders Edition 的 X 框架采用坚固耐用的铝合金框架,并采用阳极氧化表面处理以实现优质表面处理和金色金属表面处理。

媒体版NVIDIA RTX 4090创始版。
盒子内部特殊设计

边框内部布满散热片,内部为均热板为GPU和VRAM散热,然后通过热量将废热引导至散热片管道。这一代RTX 4090创始版采用了更大的116mm、FDB、7叶双风扇,并将显卡厚度增加至3-Slot,并将显卡长度缩短至30.48cm(12英寸)。

这一代均热板还进行了优化,有显存专用的切口,让均热板与GPU接触更均匀,显存的导热垫减小到1.5 mm,导热效果更好;这一代散热器可支持高达 650W Qmax 冷却能力。

背面是经典正面,RTX 4090和显卡前面的穿透式冷却气流。
原来的正面还填充了带有散热片和后风扇的金属框架,带来了独特的美学设计。

RTX 4090全面更换为PCIe 12 4 Pin(12VHPWR)供电接口,一根线可传输高达600W的功耗,同时也让整条线在使用时更加美观新卡已安装。当然,创始版本还提供了12VHPWR转4根PCIe 6 2pin线。

一般建议至少连接3个PCIe 6 2pin进行转换。如果购买新电源,建议选择符合ATX12 V3.0和EPS12V V2.92规格的新电源。这样你就可以收起丑陋的大炮了,只要一根12VHPWR线就能提供显卡所需的电源。

RTX 4090使用PCIe 12 4 Pin (12VHPWR)供电。
配件中的12VHPWR连接4根PCIe 6 2针电缆(塔式)。
专业新款电源仅需一根线即可满足RTX 4090的供电需求

RTX 4090显示输出提供1个支持VRR、4K120Hz / 8K60Hz HDR的HDMI 2.1a,以及3个支持12位4K240Hz HDR / 12位8K60Hz HDR等输出能力的DisplayPort 1.4a DSC,以及最多可同时连接 4 个屏幕输出。

RTX 4090显示输出。

NVIDIA GeForce RTX 4090创意视频输出、GPU渲染性能测试

本次测试包括Adobe Premiere Pro 2020、DaVinci Resolve 18和Blender等创意测试,游戏分别以2160p、1440p分辨率、全特效、电竞、AAA游戏和灯光追逐性能并添加额外的 DLSS 3 预测试,让玩家充分了解 RTX 4090 为什么强大(这么贵)。

最强显卡是NVIDIA GeForce RTX 3090 Founders Edition。

测试平台
处理器:Intel Core i9-12900K
主板:华擎Z690 PG Velocita
内存:CORSAIR DOMINATOR PLATINUM RGB DDR5 32GBx2 5200MHz
显卡:NVIDIA GeForce RTX 4090 创始版、NVIDIA GeForce RTX 3090 创始版
系统盘:Solidigm P41 Plus 1TB PCIe 4.0 SSD
散热器:华硕 ROG STRIX LC II 280mm
电源:海韵 PRIME PX-1000
操作系统:Windows 11 Pro 21H2 64位,可调整BAR大小
驱动版本:NVIDIA 521.90

GPU-Z 可以查看NVIDIA GeForce RTX 4090信息,4nm工艺的AD102 GPU,16384个渲染CUDA核心,24576 MB GDDR6X(美光)显存,GPU预设时钟为2235 MHz,Boost为2520兆赫。

GPU-Z.
DXVA检查解码器测试,目前所有视频编解码器均支持各种分辨率的解码。

达芬奇解决方案18 是一款纯GPU加速的视频编辑程序,包括强大的色彩校正和特效功能,并且直接使用CUDA核心计算,使视频剪辑的播放和输出有非常好的性能。Beta 版本包括对 NVIDIA AV1 编码的支持。

达芬奇解决方案18.

本次测试分为两部分。第一个测试项目使用 4K Blackmagic RAW 图像,每个图像都有一个 Wedding_Heavy_Styles 时间线。该视频使用了大量的Resolve效果,例如OFX:光线/发光/素描等,输出了相当高风格的电影类型。

Bride_FaceRefine_Selective_Color 使用 Face Refinement 进行脸部追踪,并用颜色突出主要新娘;50% Retime 和 Optical Flow – Enhanced Better 均使用 Optical Flow 技术将图像速度降低 50%。

SuperScale2x 4K Source 使用 4K ProRES 源视频产生 2x Zoom In 主体的 4K 视频输出;SuperScale4x HD_Source 使用高清 H.264 源视频并使用 Resolve Super Scale 输出 4K 视频。

RTX 4090这部分的表现可以说非常出色,尤其是在光流测试中,节省了近2倍的输出时间,让创作者拥有更快的输出表现。

DaVinci Resolve 18,时间越少越好

第二个测试是双NVENC编码的AV1和HEVC编码测试。测试项目是Blender开放电影项目《钢铁之泪》的44秒短片,并有8k Prores442HQ 30FPS和4K Prores422HQ 30FPS视频,可用于测试HEVC、AV1编码的输出性能。

输出设置主要使用NVIDIA编码器,质量:限制为80000 Kb/s,编码配置文件:主要
速率控制:恒定比特率,预设:更快,调谐:高质量,两次通过:禁用和其他输出设置。

在性能方面,RTX 4090在输出4K30时的性能与RTX 3090相差不大,但在处理8K输出时,RTX 4090的双编码引擎将HEVC输出时间加速2倍并且AV1编码的速度也相当快,可见视频编辑软件只要支持RTX 40双编码引擎,就可以实现出色的编码性能增长。

DaVinci Resolve 18双NVENC编码测试,越短越好

Adobe Premiere Pro 2022 视频编辑软件,采用自主研发的Mercury Playback Engine GPU加速,可以利用GPU的编码引擎加速图像输出速度。测试项目1是公司的1080p60fps开箱视频;BigMix4K 项目使用 3 段 FinalAdjusted_MPE 1920×1080 图像来形成 H.264 和 HEVC 格式输出的 4K 时间线。

(测试的Premiere Pro 2022尚不支持RTX 4090双编码功能。)

在性能方面,RTX 4090 仍然比 RTX 3090 拥有更快的输出速度,但与支持的 DaVinci Resolve 不同,后者可以有惊人的输出时间缩短。因此,本次测试主要提供给大家参考。

Adobe Premiere Pro 2022.
Adobe Premiere Pro 2022 输出,越短越好。

搅拌机 是一款跨平台、开源的 3D 创作工具,支持各种 3D 任务:建模、绑定、动画、模拟、渲染、合成和运动跟踪。测试时使用Blender Benchmark 3.3.0测试Demo项目的渲染工作。

Blender Benchmark 3.3.0测试,可以看出RTX 4090在3个场景下每分钟的采样数(效率)大约是RTX 3090的两倍,可见3D创作艾达·洛夫莱斯的力量。

Blender,性能越高越好

V-Ray 基准 由Chaos Group开发。V-Ray是一款基于物理定律设计的光线渲染软件,该工具可以分别对CPU和GPU的光线追踪渲染图像进行计算测试。

V-Ray 无论是 GPU RTX 还是 CUDA 计算,RTX 4090 以 1.9 倍的 Vpath 数量击败 RTX 3090。

V-Ray Benchmark,性能越高越好。

SPECviewperf 2020 是基于专业应用开发的标准绘图性能测试工具,测试各种专业计算机图形软件如3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks等绘图测试和工程模拟。

测试分辨率为1920 x 1080,结果为FPS。这种表现与所使用的工具有关。RTX 4090的性能提升约1~2.9倍,具体取决于测试的程序和情况。

SPECviewperf 2020,FPS越高越好。

NVIDIA GeForce RTX 4090 – 3DMark 基准性能测试

3DMark Fire Strike 性能测试为主流DirectX 11 API测试场景,分别测试1080p、Extreme 1440p和Ultra 2160p的性能。

RTX 4090 Fire Strike 得分为 54174,而 Ultra Graphics 得分比 RTX 3090 快 2 倍,Extreme 为 1.8 倍,FHD 为 1.6 倍。

3DMark Fire Strike,分数越高越好。

3DMark 时间间谍 是使用DirectX 12 API设计的测试场景,同样锁定AAA游戏级别,分别测试1440p和Extreme 2160p的性能。

Time Spy 中 RTX 4090 总分达到 32638 分,分别比 RTX 3090 高 1.8 倍和 1.9 倍。

3DMark Time Spy,分数越高越好。

用于光线追踪测试, 3DMark 皇家港口在AAA游戏场景中加入光线追踪,考验了新一代GPU加速硬件光线追踪的能力。同时,XDR测试是使用DirectX Raytracing API进行的功能测试。

即使没有DLSS,RTX 4090也能拥有相当惊人的光线追踪性能。Port Royal 达到 119 FPS 和 XDR 138 FPS。与RTX 3090相比,还带来了1.95倍和2.44倍的性能提升。

3DMark Port Royal,越高越好。

3DMark DLSS 功能测试 可以对DLSS 3和DLSS 2进行性能测试。当设置为3840 x 2160和性能加速时,RTX 4090可以在DLSS 2中获得138 FPS / 2.3x的性能提升。DLSS 3使用AI后生成图像,最高可达 193 FPS / 3.3 倍性能提升。

以后我们会用游戏来衡量DLSS 3的性能。

3DMark DLSS 功能测试,越高越好。

NVIDIA GeForce RTX 4090 – 4款电竞游戏性能测试

4款电竞游戏:《彩虹六号:围攻》、《英雄联盟》、《APEX英雄》和《CS:GO》等,都是重技巧、团队合作的战术竞技射击和DOTA类型的游戏,所以在游戏画质和细节不高的情况下,游戏FPS也是平均100帧以上。在 2160p、1440p 和特效的最高设置下进行测试。

对于电竞游戏来说,RTX 4090带来的性能提升并不明显。毕竟RTX 3090也能为2160p的电竞游戏提供非常强劲的性能。测试中,只有《彩虹六号:围攻》有明显的性能提升。,其他三个都比较接近。

2160p电竞游戏测试,FPS越高越好
1440p游戏测试,FPS越高越好

NVIDIA GeForce RTX 4090 – 11款游戏性能测试

11款AAA游戏的平均表现 ,同样在2160p、1440p下测试,全特效开启,本次测试仅F1使用光追,其余游戏无光追,无DLSS加速,测试GPU实际传统渲染游戏性能。

游戏测试清单包括入门级《F1 2021》、《极限竞速:地平线5》赛车游戏、《古墓丽影:暗影》、电影游戏《死亡搁浅》、《战争机器5》 ”、《全境封锁 2》、《地平线:期待黎明》,以及《无主之地 3》、《刺客信条:维京时代》、《荒野大镖客 2》和《战神》等注重性能的测试。

RTX 4090在2160p和AAA游戏中都有相当不错的性能提升,11款游戏平均帧率达到148 FPS,相比RTX 3090的平均可实现平均约1.7倍的性能提升89 FPS。

但在1440p分辨率下,RTX 4090平均200 FPS,RTX 3090平均143 FPS,约1.4倍性能提升。

可见,在主打2160p分辨率下,RTX 4090在不依赖DLSS加速的情况下,可以为玩家带来1.7倍左右的性能提升。如果用百分比表示的话,平均性能提升66%。

2160p AAA游戏测试,FPS越高越好。
1440p AAA游戏测试,FPS越高越好。

NVIDIA GeForce RTX 4090 – 测试了 9 款光线追踪游戏

9款光线追踪DXR游戏 进行了测试,使用了最流行的《骑士2077》、《控制》、《看门狗:自由军团》、《惊悚片:流放》、《漫威蜘蛛侠重制版》、《漫威《星际穿越》、《幽灵线:东京》、《极地嚎叫6》和《邪城村》等游戏进行测试。测试2160P、1440p分辨率,除了特效/光追最高设置外,还会开启DLSS加速,详细设置请参考图表。

RTX 4090在《电御客2077》的DLSS 2加速下可以达到平均110 FPS,远高于RTX 3090的平均60 FPS;同样在《控制》、《幽灵线:东京》等光追游戏中,也能感受到RTX 4090带来的强大光追游戏性能升级。

RTX 4090在2160p和9个光追游戏测试下平均可以达到132.3 FPS。与RTX 3090相比,其平均帧率为82 FPS。光追游戏性能提升约1.6倍,平均提升65%。

对于1440p,RTX 4090平均169 FPS,RTX 3090平均119.8 FPS,约1.4倍,性能提升41%。

2160p光追游戏测试,FPS越高越好
1440p光追游戏测试,FPS越高越好。英伟达

GeForce RTX 4090 – DLSS 3 性能测试

测试期间,NVIDIA提供了预发布测试版本,主要是为了让媒体一睹DLSS 3带来的性能提升。测试的游戏包括《微软模拟飞行》、《瘟疫传说》: 《安魂曲》、虚幻引擎 5:Lyra、F1® 22、Unity Enemies、Traitor 2077 和 Justice Online”,它们使用 2160p 分辨率和最高的光跟踪设置。

在DLSS 3游戏设置中,会有明确的“超分辨率”和“帧生成”选项。必须同时启用这两个功能才能使用DLSS 3技术,而RTX 30 / 20系列的播放器只能启用。超分辨率功能,帧生成将不会启用。

微软模拟飞行DLSS 3设置。
《电动骑士2077》的DLSS 3设置.

RTX 4090通过DLSS 3加速,《电宇人客2077》的性能可实现平均140 FPS约3.5倍的性能提升;而Unity引擎发布的《敌人》电影动画也可以在实时光线追踪渲染下使用DLSS 3来实现。103 FPS 约 3.68 倍性能提升。

在DLSS 3 Performance设置下,RTX 4090可以实现约1.9x~4.7x倍的性能提升,平均约为2.95x倍,这也符合NVIDIA 发布时的 2-4 倍。

不过还需要等待游戏支持DLSS 3技术才能让RTX 40系列的玩家受益,不过RTX 4090初步开发了DLSS 3的支持,什么时候未来中端、入门级RTX 4060问世,玩家将能够获得更好的游戏加速性能提升。

DLSS 3游戏性能测试,越高越好

NVIDIA GeForce RTX 4090功耗及温度测量

显卡的功耗和温度测试,使用Time Spy Stress测试和《电动骑士2077》进行测试。功耗是使用NVIDIA提供的PACT工具测量的,该工具可以监控PCIe插槽和电源12V提供的瓦数。

显卡温度方面,RTX 4090创始版在压力测试中最高温度保持在67.8℃,2077游戏时温度小幅降低了65℃,而对比RTX 3090创始版改变了导热垫,所以温度表现相当。

RTX 4090 Founders Edition GPU温度。

在显卡TBP功耗测试中,在Time Spy Stress测试中,RTX 4090取得了平均功耗390W、瞬时最大462W的成绩,而2077游戏平均功耗为功耗358W,瞬时功耗398W。

RTX 4090可以使用Furmark Xtreme烧机达到平均功耗458W,这也是NVIDIA预设的功耗上限。品牌卡带超频的话也应该在500W左右,除非使用两个12VHPWR电源。

RTX 4090创始版GPU功耗。
Furmark Xtreme 烧机平均功率 458W,瞬时功率 482W

总结

NVIDIA GeForce RTX 4090再次以实力超越前辈,让DaVinci Resolve 18在双NVENC加速下拥有更快的视频输出性能,以及支持新一代AV1编码功能,这将成为RTX 40系列的标配,而3D创作性能Blender和V-Ray都有近2倍的性能升级,这无疑是最强的创作武器。

游戏性能方面,再次称霸2160​​p和4K AAA以及光追游戏的性能。AAA级游戏平均升级1.7倍,轻追游戏平均升级1.6倍。如果DLSS 3普及AI补帧,可以带来平均2.95倍的加速。,满足玩家4K100fps 100帧的梦想,无疑是外挂级游戏法宝。

DLSS 3目前最多支持35款游戏(包括程序),但每款游戏的发布和更新时间都不同,因此新技术的普及还需要一段时间。

NVIDIA DLSS 3 超过 35 款游戏和应用程序的势头。

这一代有近2倍的性能提升,可以预见未来RTX 4080的性能依然光明,但随着相对2倍的性能提升,RTX的价格也随之下降4090比RTX 3090性价比更高,但RTX 4080的价格也会相应上涨。在这种情况下,玩家需要多少预算才能追求这种极致的性能呢?尤其是未来主流的RTX 4060能否满足玩家的期待以及价格的甜头,就看NVIDIA如何算计了。

RTX 4090将于10/12明天晚上9点开售。台湾建议售价新台币56,990元起。至于台湾是否会发售创始版,则交由NVIDIA台湾自行公布;至于RTX 4080则要等到11月份了。预计明年应该会有RTX 40笔记本GPU,不过首发旗舰的售价应该会相当高。对游戏笔记本电脑感兴趣的玩家可以关注明年CES的消息。

4K 100fps不是梦,因为我是NVIDIA GeForce RTX 4090。

如果本文对您有帮助,请在社交媒体上与您的朋友分享本文。谢谢你!!

这篇文章是基于评论的个性。如果内容不真实或不准确,您有责任进行事实核查。

标题: 我的4K 100帧!NVIDIA GeForce RTX 4090 显卡测试报告

zh_CNChinese (China)