RTX 40系列显卡发布 “再一次重新发明GPU”

声明:本文内容及配图由作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人, 不代表平台立场。文章及其配图仅供工程师学习 之用,如有内容图片侵权或者其他问题的,请联 系我们及时删除。(联系我们,邮箱:app@ chrent.com )

北京时间 9 月 20 日 23 点,英伟达 GTC 2022 主题演讲如期而至。NVIDIA CEO 黄仁勋为全球用户带来了 RTX 40 系列显卡。本次发布的 NVIDIA GeForce RTX 40 系列显卡包括三款,分别为 RTX 4090、RTX 4080 16GB 以及 RTX 4080 12GB。在全新 Ada Lovelace GPU 架构加持下,RTX 40 系列显卡在性能、效率上都实现了特别巨大的代际飞跃,在 AI 神经网络渲染、实时光线追踪以及 DLSS 等特性方面均有大幅提升,让行业提前步入次世代。" 我们再一次重新发明了 GPU"。

Ada Lovelace GPU 架构基于台积电 4N 4nm 打造,能效比提升幅度为 2 倍,流式多处理器着色器现在能够做到每秒 83 万亿次运算,这也将是前代产品的 3 倍。第三代 RT Cores 光追核心有效光追算力达到 191TFlops ( 每秒 191 万亿次运算 ) ,达上一代产品的 2.8 倍,光线与三角形求交性能是上代的 2 倍。
在演讲中,NVIDIA 还以《赛博朋克 2077》为例,表示 RTX 40 系列可对每个像素执行超过 600 次的光追计算来确定光照,比 2018 年的首批光追游戏提升多达 16 倍。

NVIDIA 还带来了两个全新设计的引擎:Opacity Micromap 引擎可将光追的 Alpha-Test 几何性能提升 2 倍 ;Micro-Mesh 引擎,可动态生成微网格、产生额外的几何图形,提升几何图形丰富度的同时不会像传统复杂几何图形处理那样牺牲性能、存储成本。
这也就是说能够早保证图形质量的前提下实现更强的光追效果。
全新的第四代 Tensor Cores 张量核心 FP8 张量处理性能高达 1.32PFlops ( 每秒 1320 万亿次运算 ) ,达到上一代使用 FP8 加速性能的 6 倍。

着色器执行重排序 ( SER:Shader Execution Reordering ) 技术新鲜出炉。NVIDIA 对这次的创新非常满意,官方表示该技术的创新力度 " 堪比 CPU 处理器的乱序执行 "。简单来说,SER 是通过实时重新安排着色器负载,提高执行效率,更好地利用 GPU 资源,能够为光追带来最高 3 倍的性能提升,整体游戏性能提升也可达 25%。

Ada Lovelace 架构还集成了两个第八代 NVIDIA 编码器 ( NVENC ) ,能够让输出时间至多缩短一半,并支持 AV1 视频格式编解码,得到了 OBS、Blackmagic Design DaVinci Resolve、Discord 等公司的采纳——对于生产力用户来说,这将是一次史诗级升级,效率提升杠杠的。

DLSS 技术也迎来了 3.0 版本,官方表示,DLSS 3 才是这项技术最该呈现出来的样子。利用开创性的光学多帧生成,DLSS 3 可以直接生成全新的完整帧画面——而不仅仅是单个像素点,通过使用光流加速器分析两帧连续的游戏图像,计算帧到帧之间物体、元素的运动矢量数据。
Ada 架构还独有全新的集成光流加速器,借助光流加速器,DLSS 3 可以实时预测场景中的运动,并能用 AI 重建多达 7/8 的显示像素,保持图像质量的同时带来帧率的提升。

对比上一代 DLSS 最高可带来 2 倍的性能提升,对比 DLSS 关闭的状态游戏性能最高可提升 4 倍。
前面铺垫了这么多,我们已经隐隐能够感受到 RTX 40 系列将会是很夸张的一代 GPU 了,那么接下来让我们一起来看。
· 全球最快的游戏 GPU:NVIDIA GeForce RTX 4090
RTX 4090 拥有 760 亿个晶体管、16384 个 CUDA 核心和 24 GB 384-bit GDDR6X 显存,显存带宽 1008GB/s,加速频率 2520MHz,基础功耗 450W,最大功耗 660W。

性能方面,英伟达表示,在完整的光线追踪游戏中,与上一代采用 DLSS 2 的 RTX 3090 Ti 相比,采用 DLSS 3 的 RTX 4090 的性能提升可达 4 倍。在现代游戏中,RTX 4090 的性能提升高达 2 倍,同时保持了相同的 450W 功耗。目标是在所有 4K 分辨率的游戏中能够持续以超过 100 FPS 运行。
RTX 4090 上市日期 10 月 12 日,建议售价 12999 元起。前代 RTX 3090 首发价为 11999 元起,RTX 3090 Ti 首发则是 14999 元起。
· RTX 4080 16GB
RTX 4080 16GB 拥有 9728 个 CUDA 核心和 16 GB 256-bit GDDR6X 显存,显存速度 23Gbps,显存带宽 736GB/s,基础功耗 320W,最大功耗 516W,加速频率 2505MHz。

RTX 4080 16GB 综合游戏性能可达 RTX 3080 Ti 的 2 倍 ; 在较低功率下,并大幅超越 GeForce RTX 3090 Ti 更强大。
RTX 4080 16GB 将在 11 月上市,建议售价 9499 元起 ; 由于 RTX 4080 16GB 对标的应该是 RTX 3080 Ti,与之相比,RTX 3080 Ti 首发价为 8999 元。
· RTX 4080 12GB
RTX 4080 12GB 拥有 7680 个 CUDA 核心和 12GB 192-bit GDDR6X 显存,显存速度 21Gbps,显存带宽 504GB/s,基础功耗 285W,最大功耗 366W,加速频率 2610MHz。号称比上一代旗舰 RTX 3090 Ti 性能更强大。
RTX 4080 12GB 上市时间为 11 月,建议零售价 7199 元起。
但是也有粉丝指出,RTX 4080 12G 的本质上就是一张 "4060 Ti",作为对比,RTX 3060 Ti 能够达到 RTX 3090 约 55% 的性能,而 RTX 4080 12G 则仅能达到 RTX 4090 50% 的性能,整体提升幅度有待考量。" 半张 "RTX 4090 叫做 "RTX 4080"?老黄,真有你的。

此外,随着 GeForce RTX 40 系列再次刷新了 " 极速 " 的概念,电竞选手可以将装备升级到 27 英寸 1440p 360Hz 显示器,放心享受稳定的 360 FPS 画质,并在 NVIDIA Reflex 游戏中体验低至 10 毫秒的系统延迟。英伟达宣布 RTX 40 系列显卡和 NVIDIA Reflex 将开启 1440p 360 FPS 电竞时代。
综合来看,NVIDIA 此次发布的显卡都是定位与极致性能,价格也足够 " 极致 ",令人咋舌。RTX 40 系列目前三款显卡定位均为高端旗舰,与 RTX 30 系列定位可能产生冲突的型号均未更新。只能说任时代如何变化,老黄刀法仍不失本色。
——转自天极网

  • 发表于 2022-09-21 14:06
  • 阅读 ( 2 )
官方小E
官方小E

官方小助手

4 篇文章