NVIDIA第二款可达到4K和100 FPS的游戏显卡,NVIDIA GeForce RTX 4080采用新一代Ada Lovelace GPU架构,带来Tensor Core和RT Core升级,以及DLSS 3的AI补充帧技术和AV1双编码引擎,满足创作者和游戏玩家所需的强大性能,与上一代相比每瓦性能有出色的提升,但价格从1199美元起,新台币42,990元起,也是这一代出色表现的必备。必要之恶。
第二张4K、100FPS游戏显卡NVIDIA GeForce RTX 4080
第二代NVIDIA Ada Lovelace GPU一代显卡,可满足4K、100 FPS游戏显卡NVIDIA GeForce RTX 4080,还拥有76组SM、9728个CUDA核心、304个Tensor Core和76个RT Core拥有高于2.5GHz的Boost时钟频率,以及16GB GDDR6X高速显存,并且只需要320W TGP功耗。
RTX 4080使用AD103 GPU但没有使用完整的核心。RTX 4080只有76组SM单元,这意味着未来的RTX 4080 Ti可能会使用完整的AD103 GPU拥有80组SM单元。
与上一代RTX 3080 Ti相比,RTX 4080相比上一代RTX 3080 Ti可提供1.28-1.59倍的性能升级,并且具有更低的功耗和更好的GPU散热性能; 与RTX 4090性能差距约为-20%,因此RTX 4090和RTX 4080具有相同的性价比,让旗舰玩家在高单价显卡上有更多选择。
Ada Lovelace:进程时钟升级、高级光线追踪和双 AV1 编码
除了改进SM单元外,这一代Ada架构还拥有GDDR6X高速显存、提高AI推理性能的第4代Tensor Core、提高推理质量的第3代RT Core光线追踪,以及支持AV1硬件编码特性的第8代视频编码器,以及DLSS 3带来的2-4倍性能升级。
首先,Ada第4代Tensor Core可以带来FP16、BF16、TF32、INT8和INT4 2倍的Tensor TFLOPS性能提升。同时,采用Hopper架构的FP8 Transformer Engine可以提供1.3 PetaFLOPS的Tensor Core性能。
第三代RT Core可带来2倍更快的光线-三角交集输出性能(相比上一代Ampere),同时添加新技术如新的Opacity Micro map Engine,置换了微网格引擎和着色器执行重新排序,这可以再次提高光线追踪的性能。
创作方面,Ada Lovelace拥有第8代双NVENC编码引擎,主要增加了AV1的视音频编码功能,这一代音视频输出可以实现2倍的性能提升,需要达芬奇Resolve、Voukoder、剑影等视频编辑软件的支持。首次支持RTX 40的双编码引擎,主流的Adobe Premiere Pro以后还得等更新。
DLSS 3和光流加速器
RTX 40独特的“DLSS 3”是在DLSS 2技术的基础上,加入了“AI补帧”的概念,也就是光流加速器的功能。Optical Flow是计算机视觉中使用的光流方法,用于计算连续图像中每个像素的移动方向和移动量。
DLSS 3技术需要游戏引擎提供:较低分辨率的渲染图像和运动矢量,通过DLSS的深度学习网络推导出高分辨率图像,并将图像提供给光流加速器计算每个像素的移动方向和移动量,最后通过光学多帧生成生成AI补帧图片。
DLSS 3 可以通过 AI 补帧提供 2-4 倍的游戏性能提升,同时保持与原生渲染类似的图像质量,但也会增加游戏的整体延迟,因此 NVIDIA 强制使用 DLSS 3.加入Reflex技术,通过取消Render Queue让CPU立即处理GPU接管渲染,实现更低的系统延迟。
因此,DLSS 3结合了AI超分辨率、帧生成和ReFlex等技术,依托第4代Tensor Core、光流加速器以及用于训练AI的NVIDIA超级计算机,满足极致性能为下一代游戏玩家提供 4K 和 100 FPS。
NVIDIA GeForce RTX 4080 创始人版显卡开箱/背面是前面经典再增强
NVIDIA GeForce RTX 4080 创始人版延续了与 RTX 4090 创始人版相同的设计,“背面就是正面”,“少而精”。而且新的外包装也比较特别,采用了2个三角形的纸板外盒,简洁地印有RTX 4080和经典X框架的线条。
打开后,RTX 4080创始版被放置在一个带有放射线的斜坡上,看起来像一个茎背景的设计。与其说是买显卡,不如说是买电脑精品店。
RTX 4080 Founders Edition 采用坚固耐用的铝合金打造 X-Frame 框架,表面经过阳极氧化处理,呈现高端质感和金色金属饰面。
边框内部布满散热片,内部为均热板为GPU和VRAM散热,然后热管将废热引导至散热片。RTX 4080创始版采用更大的116mm、FDB、7叶双风扇,将显卡厚度增加至3-Slot,并将显卡长度缩短至30.48cm(12英寸)。
这一代均热板还进行了优化,有显存专用的切口,使均热板能够更均匀地与GPU接触,显存的导热垫减少到1.5mm,导热效果更好;此第一代散热器最高可支持650W Qmax散热能力。
RTX 4080和RTX 4090使用相同的PCIe 12 4 Pin(12VHPWR)供电接口,可传输最大功耗600W。RTX 4080 配件提供 12VHPWR 至 3 PCIe 6 2 针电缆。
装机时建议至少连接3个PCIe 6 2pin进行转换。如果购买新电源,建议选择符合ATX12 V3.0和EPS12V V2.92规格的新电源。一根12VHPWR线即可提供显卡所需的电源。
RTX 4080 显示输出提供 1 个 HDMI 2.1a 支持 VRR、4K120Hz / 8K60Hz HDR、3 个 DisplayPort 1.4a DSC 支持 12 位 4K240Hz HDR / 12 位 8K60Hz HDR 等输出能力并可连接最多可同时输出 4 个屏幕。
NVIDIA GeForce RTX 4080创意音视频输出、GPU渲染性能测试
本次测试包括Adobe Premiere Pro 2020、DaVinci Resolve 18、Blender等创作测试,游戏分别测试2160p、1440p分辨率,特效全开,电竞、AAA游戏、灯光追逐游戏的表现,以及DLSS 3的相关测试,同时对比RTX 4090和RTX 3080 Ti,以便玩家有更多的数据参考。
测试平台
处理器:Intel Core i9-13900K
主板:华硕 ROG MAXIMUS Z790 HERO 0502
内存:芝奇 TRIDENT Z5 NEO DDR5-6000 16GBx2
显卡:NVIDIA GeForce RTX 4090 原版、NVIDIA GeForce RTX 4080 原版、NVIDIA GeForce RTX 3080 Ti 原版
系统盘:Solidigm P41 Plus 1TB PCIe 4.0 SSD
冷却器:Phanteks Glacier One 360MPH
电源:海韵 PRIME PX-1000
操作系统:Windows 11 Pro 21H2 64位,可调整BAR大小
驱动程序版本:NVIDIA 526.72
GPU-Z 尚未查看NVIDIA GeForce RTX 4080的信息,该显卡采用4nm工艺的AD103 GPU,拥有9728个渲染CUDA核心,以及16384 MB GDDR6X(美光)显存,同时GPU预设时钟频率为 2205 MHz,Boost 为 2505 MHz。
达芬奇解决方案18 是一款纯GPU加速的视频编辑程序,包括强大的色彩校正和特效功能,并且直接使用CUDA核心计算,使视频剪辑的播放和输出有非常好的性能。Beta 版本包括对 NVIDIA AV1 编码的支持。
首先,第一个测试项目使用4K Blackmagic RAW图像,并具有Wedding_Heavy_Styles时间轴。该视频使用了大量的Resolve特效,例如OFX: Light Rays / Glow / Sketch等,输出了非常高风格的视频类型。
Bride_FaceRefine_Selective_Color 使用 Face Refinement 进行脸部追踪,并用颜色突出主要新娘;50% Retime 和光流增强 更好地使用光流技术将图像速度降低 50%。
SuperScale2x 4K Source 使用 4K ProRES 源视频产生 2x Zoom In 主体的 4K 视频输出;SuperScale4x HD_Source 使用高清 H.264 源视频并使用 Resolve Super Scale 输出 4K 视频。
输出性能肯定比RTX 4090好,但RTX 4080的性能也不容小觑。就看你的项目是否会用到RTX 4090这么高的显存容量了。如果是常见的视频类型,RTX 4080还是可以给出不错的表现的。
第二个测试是双NVENC编码的AV1和HEVC编码测试。测试项目为Blender开放电影项目《钢铁之泪》的44秒短片,有8k Prores442HQ 30FPS和4K Prores422HQ 30FPS视频,可用于测试HEVC、AV1编码的输出性能。
输出设置主要使用NVIDIA编码器,质量:限制为80000 Kb/s,编码配置文件:主要,速率控制:恒定比特率,预设:更快,调整:高质量,两次通过:禁用等输出设置。
在性能方面,RTX 4090和RTX 4080在4K30输出上没有太大区别,但与上一代RTX 3090 Ti相比,HEVC编码时间节省了2倍之多.
特别是在8K HEVC输出的情况下,RTX 4090和RTX 4080直接发布到上一代RTX 3080 Ti,这无疑展现了双编码引擎的优势,但需要相对的软件支持释放这种性能。
Adobe Premiere Pro 2022 视频编辑软件通过自主研发的Mercury Playback Engine GPU加速,可以借助GPU编码引擎加快视频输出速度。测试使用的项目是该公司的1080p60fps开箱即用视频,BigMix4K项目使用三张FinalAdjusted_MPE 1920×1080图像组成4K时间线进行H.264和HEVC格式输出。
(测试的Premiere Pro 2022尚不支持RTX 4090双编码功能。)
由于Premiere Pro 2022尚不支持RTX 40双编码引擎,因此测试的性能与上一代RTX 3080 Ti没有明显差异。需要等待Adobe提供软件更新后才能展现新一代GPU的输出性能。
搅拌机 是一个跨平台、开源的3D创作工具,支持各种3D操作:建模、绑定、动画、模拟、渲染、合成和运动跟踪等。测试时,使用Blender Benchmark 3.3 .0来测试Demo项目的渲染工作。
根据Blender Benchmark 3.3.0测试,RTX 4080相比RTX 3080 Ti计算性能提升1.48倍,但相比RTX 4090计算性能下降-24% .
V-Ray 基准 由 Chaos Group 开发。V-Ray是一款基于物理定律设计的光线渲染软件,该工具可以分别对CPU和GPU的光线追踪渲染图像进行计算测试。
根据V-Ray测试,RTX 4080相比RTX 3080 Ti性能提升1.4倍,计算性能相比RTX 4090降低-30%。
SPECviewperf 2020 是基于专业应用开发的标准绘图性能测试工具,用于测试各种专业计算机图形软件如:3ds Max、Catia、Creo、Energy、Maya、Medical、SNX、SolidWorks等绘图测试和工程模拟。
在 1920 x 1080 分辨率下测试并以 FPS 进行评分。性能取决于所使用的工具。RTX 4080和RTX 4090的性能差异约为-15%;但与RTX 3080 Ti相比,大约有1.3倍的性能提升。
NVIDIA GeForce RTX 4080 – 3DMark 基准性能测试
3DMark Fire Strike 性能测试是主流DirectX 11 API的测试场景,分别测试1080p、Extreme 1440p和Ultra 2160p的性能。
RTX 4080 在 Fire Strike 中获得了 46013 分,而 Ultra Graphics 比 RTX 3080 Ti 快 1.37 倍,比 RTX 4090 损失约 -31%;而 Extreme Graphics 的速度比 RTX 3080 Ti 快约 1.39 倍,输给 RTX 4090 约 -25%。
3DMark 时间间谍 是使用DirectX 12 API设计的测试场景,同样锁定AAA游戏级别,分别测试1440p和Extreme 2160p的性能。
RTX 4080 在 Time Spy 中取得了 27569 分的总成绩,相比 RTX 3080 Ti 有 1.4 倍的性能提升,也比 RTX 4090 损失了约 -26%。
用于光线追踪测试,3DMark 皇家港口 在AAA游戏场景中添加光线追踪功能,测试新一代GPU加速硬件光线追踪的能力。同时,DXR测试是使用DirectX Raytracing API进行的功能测试。
即使没有DLSS,RTX 4080也能拥有惊人的光线追踪性能。Port Royal 达到 82.3 FPS,DXR 达到 84.2 FPS。与 RTX 3080 Ti 相比,光线追踪性能提升了 1.4 倍,但也输给了 RTX 4090 -35% 左右的光线追踪性能。
3DMark DLSS 功能测试 可以对DLSS 3和DLSS 2进行性能测试,设置为3840 x 2160,性能加速设置。
RTX 4080 在 DLSS 2 下可实现 102.14 FPS 约 2.6 倍性能提升,DLSS 3 通过使用 AI 补帧技术可实现 149.69 FPS 约 3.8 倍性能提升。
NVIDIA GeForce RTX 4080 – 4款电竞游戏性能测试
《彩虹六号:围攻》、《英雄联盟》、《APEX英雄》、《CS:GO》这4款电竞游戏都是以技巧为主、团队为主的战术竞技射击游戏,以及DOTA类游戏。在画质和细节不高的情况下,游戏FPS也是平均100帧以上的表现。测试在 2160p、1440p 和特效最大设置下进行。
对于电子竞技游戏来说,RTX 4080的性能还是相当强大的,但目前在《CS:GO》中的性能较低,NVIDIA正在解决。对于电竞游戏来说,4K、400FPS不是问题。
NVIDIA GeForce RTX 4080 – 11款游戏性能测试
11款AAA游戏的平均性能,还测试了2160p、1440p,特效全开进行测试,本次测试仅F1 2021使用了光线追踪功能,其余游戏均无光线追踪,无DLSS加速,测试GPU实际传统渲染游戏性能。
游戏测试清单包括入门级《F1 2021》、《极限竞速:地平线5》赛车游戏、《古墓丽影:暗影》、电影游戏《死亡搁浅》、《战争机器5》 、《全境封锁2》、《地平线:等待黎明》,以及《无主之地3》、《刺客信条:维京时代》、《血腥杀戮2》和《战神》等对性能要求较高的测试。
RTX 4080 在 2160p 和 AAA 游戏中平均达到 114.4 FPS。与RTX 3080 Ti的平均89.3 FPS相比,可以实现平均约1.2倍的性能提升。与RTX 4090相比,游戏性能有-24%的小损失。
那么在1440p分辨率下,RTX 4080平均186 FPS,比RTX 3080 Ti快1.2倍,比RTX 4090损失约15%。
NVIDIA GeForce RTX 4080 – 8 光线追逐游戏测试
8个光追DXR游戏测试,使用最流行的《电羽人客2077》、《控制》、《看门狗:自由军团》、《惊悚深渊:流放》、《漫威蜘蛛侠》 -Man Remake”、《漫威星际穿越》、《幽灵线:东京》、《孤岛惊魂6》等游戏进行了测试。测试2160P、1440p分辨率,特效/光线追踪最高设置,DLSS加速也会开启,详细设置请参考图表。
RTX 4080在《电鱼人客2077》的2160p和DLSS 3加速下可以达到平均113FPS,而8款光追游戏平均达到111.6FPS,是1.4倍相比RTX 3080 Ti,游戏性能有所提升。与 RTX 4090 相比,性能降低约-21%。
对于1440p分辨率,RTX 4080平均为163.4 FPS,相比RTX 3080 Ti有1.ˇx倍的游戏性能提升,相比RTX 3080 Ti性能下降-14%到 RTX 4090。
NVIDIA GeForce RTX 4080 – DLSS 3 性能测量
RTX 40更新是《DLSS 3》的一大重点,测试的游戏包括《微软模拟飞行》、《瘟疫故事:安魂曲》、《漫威蜘蛛侠重制版》、《F1®》 22”,《统一敌人》和《电羽人客2077》,使用2160p分辨率和光线追踪的最高设置。
在DLSS 3游戏设置中,会有明确的“超分辨率”和“帧生成”选项。这两个功能必须同时启用才能使用DLSS 3的技术,而RTX 30 / 20系列播放器只能启用超分辨率功能,不会启用帧生成。
通过DLSS 3由RTX 4080加速,《电羽人客2077》平均性能提升可达109 FPS约4倍,Unity引擎发布的Enemies电影动画也能达到75 DLSS 3 实时光追渲染下 FPS 性能提升约 3.2 倍。
在DLSS 3 Performance的设置下,RTX 4080可以实现约1.9x~4x倍的性能提升,平均约2.48x倍。
NVIDIA GeForce RTX 4080功耗及温度测量
显卡的功耗和温度测试,使用Time Spy Stress测试、Furmark和“电宇人客2077”进行测试。测量功耗时,使用NVIDIA提供的PACT工具来监控PCIe插槽和电源12V提供的瓦数。
显卡温度方面,RTX 4080方正版在压力测试中最高温度维持在66.1℃,2077游戏温度会小幅降低63℃。与上一代RTX 3080 Ti的73℃相比,这一代的温度表现还是可以保持的。据说还不错。
显卡TBP功耗测试,在Time Spy Stress测试中,RTX 4080达到平均功耗293.3W,而Furmark 4K Xtreme烧机测试最高达到317.2W,但2077在游戏时仅消耗280W的功耗,相比RTX 3080 Ti的360W功耗,只能说RTX 4080升级得相当漂亮。
总结
NVIDIA再次交出第二张4K、100 FPS游戏显卡GeForce RTX 4080,11款AAA游戏平均114.4 FPS,8款光线追逐游戏取得111.6 FPS的辉煌成绩,其中DLSS 3也能带来性能提升 1.9 倍~ 4 倍,稳稳击败同类 RTX 3080 Ti 约 1.4 倍性能。
RTX 4080的性能比RTX 4090低约-25%,但两者的价格差异也约为24%。因此,两者的性价比何时具有可比性,取决于创作者和游戏玩家的性能需求。,显存的容量是确定的,但RTX 4080只需要300W的功耗就可以拥有4K、100 FPS的性能。
台湾第一波RTX 4080的售价也从建议价42,990新台币到最高49,990新台币不等。虽然以美元计算的价格与当时的 RTX 3080 Ti 相当,但 RTX 4080 在台湾的价格也在上涨。,对于追求4K游戏的玩家来说,无疑需要更多的买卡预算。
按照这个价格区间,未来的RTX 4070可能是3万起,RTX 4060则是2万起。这真的能满足普通玩家对游戏显卡的期待吗?RTX 40系列采用台积电4N工艺和全新Ada Lovelace架构,带来扎实的性能提升的同时也让显卡价格飙升,请问旗舰级游戏玩家预算够用吗
如果本文对您有帮助,请在社交媒体上与您的朋友分享本文。谢谢你!!
这篇文章是基于评论的个性。如果内容不真实或不准确,您有责任进行事实核查。
标题: 我的 4K 100 FPS!只需要300W的功率,NVIDIA GeForce RTX 4080开箱测试报告/翻盖RTX 3080 Ti