我的 4K 100 FPS!只需要300W的功率,NVIDIA GeForce RTX 4080开箱测试报告/翻盖RTX 3080 Ti

NVIDIA GeForce RTX 4080

NVIDIA第二款可达到4K和100 FPS的游戏显卡,NVIDIA GeForce RTX 4080采用新一代Ada Lovelace GPU架构,带来Tensor Core和RT Core升级,以及DLSS 3的AI补充帧技术和AV1双编码引擎,满足创作者和游戏玩家所需的强大性能,与上一代相比每瓦性能有出色的提升,但价格从1199美元起,新台币42,990元起,也是这一代出色表现的必备。必要之恶。

第二张4K、100FPS游戏显卡NVIDIA GeForce RTX 4080

第二代NVIDIA Ada Lovelace GPU一代显卡,可满足4K、100 FPS游戏显卡NVIDIA GeForce RTX 4080,还拥有76组SM、9728个CUDA核心、304个Tensor Core和76个RT Core拥有高于2.5GHz的Boost时钟频率,以及16GB GDDR6X高速显存,并且只需要320W TGP功耗。

RTX 4080使用AD103 GPU但没有使用完整的核心。RTX 4080只有76组SM单元,这意味着未来的RTX 4080 Ti可能会使用完整的AD103 GPU拥有80组SM单元。

RTX 4090和RTX 4080规格对比。
AD103完整核心架构图.

与上一代RTX 3080 Ti相比,RTX 4080相比上一代RTX 3080 Ti可提供1.28-1.59倍的性能升级,并且具有更低的功耗和更好的GPU散热性能; 与RTX 4090性能差距约为-20%,因此RTX 4090和RTX 4080具有相同的性价比,让旗舰玩家在高单价显卡上有更多选择。

Ada Lovelace:进程时钟升级、高级光线追踪和双 AV1 编码

除了改进SM单元外,这一代Ada架构还拥有GDDR6X高速显存、提高AI推理性能的第4代Tensor Core、提高推理质量的第3代RT Core光线追踪,以及支持AV1硬件编码特性的第8代视频编码器,以及DLSS 3带来的2-4倍性能升级。

首先,Ada第4代Tensor Core可以带来FP16、BF16、TF32、INT8和INT4 2倍的Tensor TFLOPS性能提升。同时,采用Hopper架构的FP8 Transformer Engine可以提供1.3 PetaFLOPS的Tensor Core性能。

艾达·洛夫莱斯.

第三代RT Core可带来2倍更快的光线-三角交集输出性能(相比上一代Ampere),同时添加新技术如新的Opacity Micro map Engine,置换了微网格引擎和着色器执行重新排序,这可以再次提高光线追踪的性能。

Opacity Micromap Engine,允许对象具有透明、半透明和不透明属性,以加快光线追踪处理的性能。
Displaced Micro-Mesh Engine,用更简单的BVH来表示物体,并根据矢量图快速计算出物体的光线追踪效果
Shader Execution Reordering,可以优化SM处理光线追踪的调度性能。

创作方面,Ada Lovelace拥有第8代双NVENC编码引擎,主要增加了AV1的视音频编码功能,这一代音视频输出可以实现2倍的性能提升,需要达芬奇Resolve、Voukoder、剑影等视频编辑软件的支持。首次支持RTX 40的双编码引擎,主流的Adobe Premiere Pro以后还得等更新。

第8代双NVENC编码引擎。

DLSS 3和光流加速器

RTX 40独特的“DLSS 3”是在DLSS 2技术的基础上,加入了“AI补帧”的概念,也就是光流加速器的功能。Optical Flow是计算机视觉中使用的光流方法,用于计算连续图像中每个像素的移动方向和移动量。

DLSS 3技术需要游戏引擎提供:较低分辨率的渲染图像和运动矢量,通过DLSS的深度学习网络推导出高分辨率图像,并将图像提供给光流加速器计算每个像素的移动方向和移动量,最后通过光学多帧生成生成AI补帧图片。

DLSS 3 可以通过 AI 补帧提供 2-4 倍的游戏性能提升,同时保持与原生渲染类似的图像质量,但也会增加游戏的整体延迟,因此 NVIDIA 强制使用 DLSS 3.加入Reflex技术,通过取消Render Queue让CPU立即处理GPU接管渲染,实现更低的系统延迟。

因此,DLSS 3结合了AI超分辨率、帧生成和ReFlex等技术,依托第4代Tensor Core、光流加速器以及用于训练AI的NVIDIA超级计算机,满足极致性能为下一代游戏玩家提供 4K 和 100 FPS。

DLSS 3.

NVIDIA GeForce RTX 4080 创始人版显卡开箱/背面是前面经典再增强

NVIDIA GeForce RTX 4080 创始人版延续了与 RTX 4090 创始人版相同的设计,“背面就是正面”,“少而精”。而且新的外包装也比较特别,采用了2个三角形的纸板外盒,简洁地印有RTX 4080和经典X框架的线条。

打开后,RTX 4080创始版被放置在一个带有放射线的斜坡上,看起来像一个茎背景的设计。与其说是买显卡,不如说是买电脑精品店。

方正版特色包装盒
带有放射状背景的RTX 4080。
里面的小抽屉里有配件和电源线。

RTX 4080 Founders Edition 采用坚固耐用的铝合金打造 X-Frame 框架,表面经过阳极氧化处理,呈现高端质感和金色金属饰面。

边框内部布满散热片,内部为均热板为GPU和VRAM散热,然后热管将废热引导至散热片。RTX 4080创始版采用更大的116mm、FDB、7叶双风扇,将显卡厚度增加至3-Slot,并将显卡长度缩短至30.48cm(12英寸)。

这一代均热板还进行了优化,有显存专用的切口,使均热板能够更均匀地与GPU接触,显存的导热垫减少到1.5mm,导热效果更好;此第一代散热器最高可支持650W Qmax散热能力。

RTX 4080正面外观比上一代更加精致细致
RTX 4080散热器,可以看到X框内嵌有散热片。
显卡上方有一个Logo灯,上面有GEFORCE RTX字样和一个PCIe 12 4 Pin(12VHPWR)供电接口。
显卡正面的磁铁吸附隐藏的固定锁孔。
显卡下侧。

RTX 4080和RTX 4090使用相同的PCIe 12 4 Pin(12VHPWR)供电接口,可传输最大功耗600W。RTX 4080 配件提供 12VHPWR 至 3 PCIe 6 2 针电缆。

装机时建议至少连接3个PCIe 6 2pin进行转换。如果购买新电源,建议选择符合ATX12 V3.0和EPS12V V2.92规格的新电源。一根12VHPWR线即可提供显卡所需的电源。

RTX 4080 12VHPWR 转 3 PCIe 6 2pin 线。
连接电线时,确保整个插头插入插座
并且电线出口处不要弯曲太多。
或者使用原生12VHPWR电缆,一劳永逸。

RTX 4080 显示输出提供 1 个 HDMI 2.1a 支持 VRR、4K120Hz / 8K60Hz HDR、3 个 DisplayPort 1.4a DSC 支持 12 位 4K240Hz HDR / 12 位 8K60Hz HDR 等输出能力并可连接最多可同时输出 4 个屏幕。

RTX 4080显示输出。

NVIDIA GeForce RTX 4080创意音视频输出、GPU渲染性能测试

本次测试包括Adobe Premiere Pro 2020、DaVinci Resolve 18、Blender等创作测试,游戏分别测试2160p、1440p分辨率,特效全开,电竞、AAA游戏、灯光追逐游戏的表现,以及DLSS 3的相关测试,同时对比RTX 4090和RTX 3080 Ti,以便玩家有更多的数据参考。

测试平台
处理器:Intel Core i9-13900K
主板:华硕 ROG MAXIMUS Z790 HERO 0502
内存:芝奇 TRIDENT Z5 NEO DDR5-6000 16GBx2
显卡:NVIDIA GeForce RTX 4090 原版、NVIDIA GeForce RTX 4080 原版、NVIDIA GeForce RTX 3080 Ti 原版
系统盘:Solidigm P41 Plus 1TB PCIe 4.0 SSD
冷却器:Phanteks Glacier One 360​​MPH
电源:海韵 PRIME PX-1000
操作系统:Windows 11 Pro 21H2 64位,可调整BAR大小
驱动程序版本:NVIDIA 526.72

GPU-Z 尚未查看NVIDIA GeForce RTX 4080的信息,该显卡采用4nm工艺的AD103 GPU,拥有9728个渲染CUDA核心,以及16384 MB GDDR6X(美光)显存,同时GPU预设时钟频率为 2205 MHz,Boost 为 2505 MHz。

GPU-Z.

达芬奇解决方案18 是一款纯GPU加速的视频编辑程序,包括强大的色彩校正和特效功能,并且直接使用CUDA核心计算,使视频剪辑的播放和输出有非常好的性能。Beta 版本包括对 NVIDIA AV1 编码的支持。

达芬奇解决方案18.

首先,第一个测试项目使用4K Blackmagic RAW图像,并具有Wedding_Heavy_Styles时间轴。该视频使用了大量的Resolve特效,例如OFX: Light Rays / Glow / Sketch等,输出了非常高风格的视频类型。

Bride_FaceRefine_Selective_Color 使用 Face Refinement 进行脸部追踪,并用颜色突出主要新娘;50% Retime 和光流增强 更好地使用光流技术将图像速度降低 50%。

SuperScale2x 4K Source 使用 4K ProRES 源视频产生 2x Zoom In 主体的 4K 视频输出;SuperScale4x HD_Source 使用高清 H.264 源视频并使用 Resolve Super Scale 输出 4K 视频。

输出性能肯定比RTX 4090好,但RTX 4080的性能也不容小觑。就看你的项目是否会用到RTX 4090这么高的显存容量了。如果是常见的视频类型,RTX 4080还是可以给出不错的表现的。

DaVinci Resolve 18,越短越好

第二个测试是双NVENC编码的AV1和HEVC编码测试。测试项目为Blender开放电影项目《钢铁之泪》的44秒短片,有8k Prores442HQ 30FPS和4K Prores422HQ 30FPS视频,可用于测试HEVC、AV1编码的输出性能。

输出设置主要使用NVIDIA编码器,质量:限制为80000 Kb/s,编码配置文件:主要,速率控制:恒定比特率,预设:更快,调整:高质量,两次通过:禁用等输出设置。

在性能方面,RTX 4090和RTX 4080在4K30输出上没有太大区别,但与上一代RTX 3090 Ti相比,HEVC编码时间节省了2倍之多.

特别是在8K HEVC输出的情况下,RTX 4090和RTX 4080直接发布到上一代RTX 3080 Ti,这无疑展现了双编码引擎的优势,但需要相对的软件支持释放这种性能。

DaVinci Resolve 18,越短越好

Adobe Premiere Pro 2022 视频编辑软件通过自主研发的Mercury Playback Engine GPU加速,可以借助GPU编码引擎加快视频输出速度。测试使用的项目是该公司的1080p60fps开箱即用视频,BigMix4K项目使用三张FinalAdjusted_MPE 1920×1080图像组成4K时间线进行H.264和HEVC格式输出。

(测试的Premiere Pro 2022尚不支持RTX 4090双编码功能。)

由于Premiere Pro 2022尚不支持RTX 40双编码引擎,因此测试的性能与上一代RTX 3080 Ti没有明显差异。需要等待Adobe提供软件更新后才能展现新一代GPU的输出性能。

Adobe Premiere Pro 2022.
Adobe Premiere Pro 2022 输出,越短越好。

搅拌机 是一个跨平台、开源的3D创作工具,支持各种3D操作:建模、绑定、动画、模拟、渲染、合成和运动跟踪等。测试时,使用Blender Benchmark 3.3 .0来测试Demo项目的渲染工作。

根据Blender Benchmark 3.3.0测试,RTX 4080相比RTX 3080 Ti计算性能提升1.48倍,但相比RTX 4090计算性能下降-24% .

Blender,越多性能越好。

V-Ray 基准 由 Chaos Group 开发。V-Ray是一款基于物理定律设计的光线渲染软件,该工具可以分别对CPU和GPU的光线追踪渲染图像进行计算测试。

根据V-Ray测试,RTX 4080相比RTX 3080 Ti性能提升1.4倍,计算性能相比RTX 4090降低-30%。

V-Ray Benchmark,性能越高越好

SPECviewperf 2020 是基于专业应用开发的标准绘图性能测试工具,用于测试各种专业计算机图形软件如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks等绘图测试和工程模拟。

在 1920 x 1080 分辨率下测试并以 FPS 进行评分。性能取决于所使用的工具。RTX 4080和RTX 4090的性能差异约为-15%;但与RTX 3080 Ti相比,大约有1.3倍的性能提升。

SPECviewperf 2020.

NVIDIA GeForce RTX 4080 – 3DMark 基准性能测试

3DMark Fire Strike 性能测试是主流DirectX 11 API的测试场景,分别测试1080p、Extreme 1440p和Ultra 2160p的性能。

RTX 4080 在 Fire Strike 中获得了 46013 分,而 Ultra Graphics 比 RTX 3080 Ti 快 1.37 倍,比 RTX 4090 损失约 -31%;而 Extreme Graphics 的速度比 RTX 3080 Ti 快约 1.39 倍,输给 RTX 4090 约 -25%。

3DMark Fire Strike,分数越高越好。

3DMark 时间间谍 是使用DirectX 12 API设计的测试场景,同样锁定AAA游戏级别,分别测试1440p和Extreme 2160p的性能。

RTX 4080 在 Time Spy 中取得了 27569 分的总成绩,相比 RTX 3080 Ti 有 1.4 倍的性能提升,也比 RTX 4090 损失了约 -26%。

3DMark Time Spy,分数越高越好。

用于光线追踪测试,3DMark 皇家港口 在AAA游戏场景中添加光线追踪功能,测试新一代GPU加速硬件光线追踪的能力。同时,DXR测试是使用DirectX Raytracing API进行的功能测试。

即使没有DLSS,RTX 4080也能拥有惊人的光线追踪性能。Port Royal 达到 82.3 FPS,DXR 达到 84.2 FPS。与 RTX 3080 Ti 相比,光线追踪性能提升了 1.4 倍,但也输给了 RTX 4090 -35% 左右的光线追踪性能。

3DMark Port Royal,越高越好。

3DMark DLSS 功能测试 可以对DLSS 3和DLSS 2进行性能测试,设置为3840 x 2160,性能加速设置。

RTX 4080 在 DLSS 2 下可实现 102.14 FPS 约 2.6 倍性能提升,DLSS 3 通过使用 AI 补帧技术可实现 149.69 FPS 约 3.8 倍性能提升。

3DMark DLSS 功能测试,越高越好。

NVIDIA GeForce RTX 4080 – 4款电竞游戏性能测试

《彩虹六号:围攻》、《英雄联盟》、《APEX英雄》、《CS:GO》这4款电竞游戏都是以技巧为主、团队为主的战术竞技射击游戏,以及DOTA类游戏。在画质和细节不高的情况下,游戏FPS也是平均100帧以上的表现。测试在 2160p、1440p 和特效最大设置下进行。

对于电子竞技游戏来说,RTX 4080的性能还是相当强大的,但目前在《CS:GO》中的性能较低,NVIDIA正在解决。对于电竞游戏来说,4K、400FPS不是问题。

2160p电竞游戏测试,FPS越高越好
1440p电竞游戏测试,FPS越高越好

NVIDIA GeForce RTX 4080 – 11款游戏性能测试

11款AAA游戏的平均性能,还测试了2160p、1440p,特效全开进行测试,本次测试仅F1 2021使用了光线追踪功能,其余游戏均无光线追踪,无DLSS加速,测试GPU实际传统渲染游戏性能。

游戏测试清单包括入门级《F1 2021》、《极限竞速:地平线5》赛车游戏、《古墓丽影:暗影》、电影游戏《死亡搁浅》、《战争机器5》 、《全境封锁2》、《地平线:等待黎明》,以及《无主之地3》、《刺客信条:维京时代》、《血腥杀戮2》和《战神》等对性能要求较高的测试。

RTX 4080 在 2160p 和 AAA 游戏中平均达到 114.4 FPS。与RTX 3080 Ti的平均89.3 FPS相比,可以实现平均约1.2倍的性能提升。与RTX 4090相比,游戏性能有-24%的小损失。

那么在1440p分辨率下,RTX 4080平均186 FPS,比RTX 3080 Ti快1.2倍,比RTX 4090损失约15%。

2160p AAA游戏测试,FPS越高越好
1440p AAA游戏测试,FPS越高越好

NVIDIA GeForce RTX 4080 – 8 光线追逐游戏测试

8个光追DXR游戏测试,使用最流行的《电羽人客2077》、《控制》、《看门狗:自由军团》、《惊悚深渊:流放》、《漫威蜘蛛侠》 -Man Remake”、《漫威星际穿越》、《幽灵线:东京》、《孤岛惊魂6》等游戏进行了测试。测试2160P、1440p分辨率,特效/光线追踪最高设置,DLSS加速也会开启,详细设置请参考图表。

RTX 4080在《电鱼人客2077》的2160p和DLSS 3加速下可以达到平均113FPS,而8款光追游戏平均达到111.6FPS,是1.4倍相比RTX 3080 Ti,游戏性能有所提升。与 RTX 4090 相比,性能降低约-21%。

对于1440p分辨率,RTX 4080平均为163.4 FPS,相比RTX 3080 Ti有1.ˇx倍的游戏性能提升,相比RTX 3080 Ti性能下降-14%到 RTX 4090。

2160p光线追踪游戏测试,FPS越高越好
1440p光追游戏测试,FPS越高越好

NVIDIA GeForce RTX 4080 – DLSS 3 性能测量

RTX 40更新是《DLSS 3》的一大重点,测试的游戏包括《微软模拟飞行》、《瘟疫故事:安魂曲》、《漫威蜘蛛侠重制版》、《F1®》 22”,《统一敌人》和《电羽人客2077》,使用2160p分辨率和光线追踪的最高设置。

在DLSS 3游戏设置中,会有明确的“超分辨率”和“帧生成”选项。这两个功能必须同时启用才能使用DLSS 3的技术,而RTX 30 / 20系列播放器只能启用超分辨率功能,不会启用帧生成。

“电语人科2077”DLSS 3设置。

通过DLSS 3由RTX 4080加速,《电羽人客2077》平均性能提升可达109 FPS约4倍,Unity引擎发布的Enemies电影动画也能达到75 DLSS 3 实时光追渲染下 FPS 性能提升约 3.2 倍。

在DLSS 3 Performance的设置下,RTX 4080可以实现约1.9x~4x倍的性能提升,平均约2.48x倍。

DLSS 3游戏性能测试,越高越好

NVIDIA GeForce RTX 4080功耗及温度测量

显卡的功耗和温度测试,使用Time Spy Stress测试、Furmark和“电宇人客2077”进行测试。测量功耗时,使用NVIDIA提供的PACT工具来监控PCIe插槽和电源12V提供的瓦数。

显卡温度方面,RTX 4080方正版在压力测试中最高温度维持在66.1℃,2077游戏温度会小幅降低63℃。与上一代RTX 3080 Ti的73℃相比,这一代的温度表现还是可以保持的。据说还不错。

RTX 4080 方正版 GPU 温度。

显卡TBP功耗测试,在Time Spy Stress测试中,RTX 4080达到平均功耗293.3W,而Furmark 4K Xtreme烧机测试最高达到317.2W,但2077在游戏时仅消耗280W的功耗,相比RTX 3080 Ti的360W功耗,只能说RTX 4080升级得相当漂亮。

RTX 4080 方正版 GPU 功耗。

总结

NVIDIA再次交出第二张4K、100 FPS游戏显卡GeForce RTX 4080,11款AAA游戏平均114.4 FPS,8款光线追逐游戏取得111.6 FPS的辉煌成绩,其中DLSS 3也能带来性能提升 1.9 倍~ 4 倍,稳稳击败同类 RTX 3080 Ti 约 1.4 倍性能。

RTX 4080的性能比RTX 4090低约-25%,但两者的价格差异也约为24%。因此,两者的性价比何时具有可比性,取决于创作者和游戏玩家的性能需求。,显存的容量是确定的,但RTX 4080只需要300W的功耗就可以拥有4K、100 FPS的性能。

台湾第一波RTX 4080的售价也从建议价42,990新台币到最高49,990新台币不等。虽然以美元计算的价格与当时的 RTX 3080 Ti 相当,但 RTX 4080 在台湾的价格也在上涨。,对于追求4K游戏的玩家来说,无疑需要更多的买卡预算。

按照这个价格区间,未来的RTX 4070可能是3万起,RTX 4060则是2万起。这真的能满足普通玩家对游戏显卡的期待吗?RTX 40系列采用台积电4N工艺和全新Ada Lovelace架构,带来扎实的性能提升的同时也让显卡价格飙升,请问旗舰级游戏玩家预算够用吗

如果本文对您有帮助,请在社交媒体上与您的朋友分享本文。谢谢你!!

这篇文章是基于评论的个性。如果内容不真实或不准确,您有责任进行事实核查。

标题: 我的 4K 100 FPS!只需要300W的功率,NVIDIA GeForce RTX 4080开箱测试报告/翻盖RTX 3080 Ti

zh_CNChinese (China)