三星移动硬盘驱动(100TB残酷写入测试!希捷雷霆5350H 7.68TB SSD评测:高端用户也玩得起的企业级SSD)
三星移动硬盘驱动文章列表:
- 1、100TB残酷写入测试!希捷雷霆5350H 7.68TB SSD评测:高端用户也玩得起的企业级SSD
- 2、满功耗释放背后的秘密是什么?我们对OMEN暗影精灵8 Pro拆了个机
- 3、UninstallPKG疑难解答如何通过删除打印机驱动程序来节省空间
- 4、三星实验室推出 MegaPortraits AI 工具,可让蒙娜丽莎动起来
- 5、耕升RTX 3090 Ti炫光·超OC评测 扛鼎之作
100TB残酷写入测试!希捷雷霆5350H 7.68TB SSD评测:高端用户也玩得起的企业级SSD
一、前言:低成本高性能的企业级SSD
此前我们测试过一款PBlaze6 6536 3.2TB SSD,感受到了企业级SSD的强大。现在我们收到了一款更强、容量更大的企业级SSD——希捷雷霆Nytro 5350H 7.68TB SSD。
这也是国内媒体第一次拿到这款产品!
今年8月份,希捷发布了两款雷霆系列新品,分别是Nytro 5550 SSD、Nytro 5350 SSD,专为提高数据中心性能、效率和存储密度而设计。
其中,希捷雷霆5550定位于旗舰,面向高端企业用户。
希捷雷霆5350更主流一些,除了企业用户之外,一样也适合高端PC玩家。
希捷雷霆5350H适用于读取密集型工作负载,目前有1.92TB/3.84TB/7.68TB三个容量型号,质保时间5年,支持每天1次全盘写入,写入寿命分别为3500TBW、7000TBW,14000TBW。
我们测试的这款7.68TB型号,拥有7100MB/s的顺序读取速度和6900MB/s的顺序写入速度,4K随机读取性能为1700K IOPS、4K随机写入性能为195K IOPS。
闪存使用的是来自于SK海力士的128层堆叠企业级eTLC NAND颗粒,主控则是7月份才发布的群联PS5020-E20 PCIe Gen4企业级SSD控制器,最高支持32TB容量,内置两个Cortex-R5核心以及多个协处理器核心,可加速SSD管理、提升随机读取速度。
在可靠性方面,希捷雷霆5350H在50℃使用环境下,MTBF达到250万小时(7x24小时不间断使用)。
在准确性方面,希捷雷霆5350H的不可修复的数据错误率<10-17,也达到了消费级SSD行业标准的10倍。
在企业级功能方面,为确保数据完整性并在意外断电时防止数据丢失,希捷雷霆5350H 7.68TB SSD还配备了一颗规格为1500uF 35V的高容量断电保护电容。
另外还支持端到端数据保护和低密度奇偶校验码,实现企业级可靠性和数据保护,防止未检测到的意外损坏。
此外,希捷雷霆5350H系列配备NVMe管理接口、SMBus边带管理和寿命管理功能,可在不增加操作系统负担的情况下实现硬盘无缝监控和管理。
希捷雷霆5350H 7.68TB SSD详细规格参数如下:
二、图赏:U.3接口15毫米 内置128层堆叠eTLC NAND
希捷雷霆5350H的整个铝合金外壳做了很多槽沟,用以增大散热面积,日常使用时,SSD主控和NAND温度都很低。
SSD背面。
SSD的厚度是15mm,做这么厚是为了增加散热性能。
U.3接口,当然也兼容以前U.2接口,在企业级市场上很常见,消费级主板支持的不多,但可以转接传统PCIe接口。
市面上也有M.2转U.3/U.2的设备,价格不是很贵。
安装到PCIe 4.0 x16转接卡上。
拆解下来的散热片(外壳),上面密密麻麻贴满了导热背胶,每颗DRAM、NAND以及主控都有顾及。
PCB的背面和正面各有8颗共16颗128层堆叠的3D企业级eTLC闪存。
还有4颗SK海力士DDR4 ECC DRAM缓存,单颗容量2GB,总容量是8GB。
上面还有巨大的断电保护电容,规格是1500uF 35V,用于意外断电情况下对尚未写完的数据的保护,避免映射表、用户数据出错。
群联PS5020-E20 PCIe Gen4企业级SSD控制器,这款主控内置两个Cortex-R5核心、多个协处理器核心,可加速SSD管理、提升随机读取速度(最高30%),走PCIe 4.0通道,支持NVMe 1.4协议,支持U.3接口,最大支持32TB容量。
三、性能测试:顺序读取7.1GB/s、写入6.3GB/s
测试平台如下:
从CrystalDiskinfo可以看到,这块SSD支持PCIe 4.0 x4、NVMe 1.4。
我们拿到的时候,SSD读取量为0,写入量为0,全新出炉。
1、CrystalDiskMark
在CrystalDiskMark测试中,希捷雷霆5350H 7.68TB SSD的顺序读取速度突破了7100MB/s,达到了7112MB/s,写入速度也有6322MB/s;4K随机读取894,126IOPS,4K随机写入825,634 IOPS。
2、AS SSD Benchmark
左边是1GB容量的测试,AS SSD Benchmark总分为8128,最高顺序读取、写入速度分别为5747MB/s、5728MB/s,4K随机读写速度为51MB/s、330MB/s。
右边是10GB容量的测试,总分为8075。最高顺序读取、写入速度分别为5838MB/s、5746MB/s,4K随机读写速度分别为51MB/s、335MB/s。
3、ATTO Disk Benchmark
从ATTO Disk Benchmarks结果来看,对于0.5KB的小文件读写,希捷雷霆5350H 7.68TB SSD也能达到16MB/s以上的写入和20MB/s的读取。
16K的时候,写入达到了3.27GB/s,读取速度为932MB/s。从256KB开始,写入速度稳定在6GB/s左右,读取速度则能达到6.4GB/s以上。
4、HD Tune掉速测试
测试长度为200GB,希捷雷霆5350H 7.68TB SSD的表现稳如一条直线,读取为6.4GB/s,写入从头到尾都是5.9GB/s,没有降速。
当然200GB的写入负载对于7.68TB容量的SSD来说根本不算什么,后面我们会进行更加严苛的写入测试。
四、AIDA64与PCMark 10一致性测试:100TB写入考验
1、AIDA64 Disk Benchmark Linear Write
AIDA64 Disk Benchmark Linear Write是一项非常严苛和残酷的测试,也是一面照妖镜,目前市面上的消费级SSD用这个软件都能暴露出真实的缓外速度。
AIDA64 Disk Benchmark Linear Write持续写入了58分钟的数据,写入速度基本上保持一条直线,最高写入速度5741MB/s,最低5612MB/s,平均写入速度5714MB/s。
做完此项测试之后,SSD的写入量直接到了8.4TB。
对自己SSD写入性能有兴趣的同学,可以尝试进行此项测试,当然普通的SSD建议不要轻易尝试。
2、PCMark 10磁盘一致性测试
PCMark 10盘性能一致性测试是Windows系统下的长期高负载测试。它主要考验SSD在初始阶段(空盘)、掉速阶段(开始写入数据),以及稳态阶段(随机写满有效和无效数据)、性能恢复阶段等不同阶段的性能变化。
测试开始前有两次全盘填充过程、结束后有一次全盘填充过程,全部测试环节会循环约20次。
经过了长达6小时的测试,总计写入了104TB的数据,总算完成了测试,这就意味着在这段时间内,SSD被全盘反复写入了15次。另外,现在很多SSD的写入寿命也就100~200TB。
雷霆5350H 7.68TB SSD总得分是2164,带宽623MB/s,存取时间94us。
如此漫长的测试只看总分未免有点可惜,下面我们导出详细测试数据进行分析。
大文件盘内拷贝测试, 希捷雷霆5350H 7.68TB SSD在非稳态、向稳态过渡、稳态等阶段,都能表现出较高的性能一致性。
进行纯写入测试时,基本上速度都能稳定在4000MB/s以上,仅有2个阶段会掉到3100MB/s。
进行混合读写测试时,波动有点明显,速度在1100~2600MB/s之间。
在进行零碎小文件盘内拷贝测试时,希捷雷霆5350H 7.68TB在各个阶段的表现同样也非常稳定。
进行纯写入测试时,基本上呈现一条直线,速度在350MB/s
进行混合读写测试时,速度保持在400~480MB/s之间。
Photoshop重负载测试时,雷霆5350H 7.68TB也表现出了高度的一致性,稳定在700MB/s,仅有轻微浮动。
五、全盘写入与温度测试:全程稳定2.7GB/s写入不掉速
1、6.96TB文件拷贝测试
其实AIDA64 Disk Benchmark Linear Write已经能够反映SSD的真实缓外写入速度,不过我们还是进行了一次全盘文件拷贝测试。
希捷雷霆5350H 7.68TB真实容量为6.98TB,我们一次性写入6.96TB的文件,写完后仅剩下20GB的空间,不到全部容量的0.3%。
读取盘为希捷酷玩530 2TB SSD,测试之前我们先保证2款SSD都工作在PCIe 4.0 x4模式下。
希捷雷霆5350H 7.68TB可用空间6.98TB,我们先写入6TB的文件,还剩下0.98TB。接着我们再从捷酷玩530 2TB SSD中选择983GB的文件写入到这剩余的0.98TB可用空间中。
在整个写入过程中,最高写入速度达到了3.03GB/s,最低也有2.2GB/s,正常情况都稳定在2.7GB/s上下。
在写入的最后阶段,此时SSD的可用空间不到30GB,但是写入速度依然高达2.66GB/s。
完全全部拷贝任务后,雷霆5350H 7.68TB SSD仅剩下20.6GB可用空间,不到全部容量的0.3%。
2、温度测试
在待机状态下,希捷雷霆5350H 7.68TB温度在36度左右。在高负载读写状态下,最高温度也只有50度。
不过,在我们进行PCMark盘性能一致性测试时,温度曾达到了62度。
因此,如果是日常负载,不太用担心它的温度,如果是要进行高压力写入工作,比如要一次性写入百TB的数据,需要做好散热工作。不过正常来说,7.68TB SSD很难出现一次性写入百TB数据的情况。
六、总结:同样也适用于高端PC玩家的企业级SSD
首先不要将消费级SSD与企业级SSD相提并论。消费级SSD的高性能全赖SLC缓存,雷霆5350H 7.68TB SSD采用的是企业级eTLC NAND,没有SLC缓存的说法。
比如测试AIDA64 Disk Benchmark Linear Write,消费级SSD是一定会出现缓外写入掉速的情况,而希捷雷霆5350H 7.68TB SSD持续写入1个小时,写入将近7TB的数据,写入速度始终稳定在5.7GB/s附近,仅有轻微波动。这是任何消费级SSD都办不到的事情,就算是昂贵的三星990 PRO也不例外。
同时,我们还手动进行了一项全盘写入测试,在希捷雷霆5350H总共6.98TB的容量中,一次性写入6.96TB的数据,写入完成后,SSD仅剩下20GB的可用空间。
在整个写入过程中大多数时候都保持着2.6~2.7GB/s的写入速度,从头到尾都没有出现掉速的现象。
在常规性能方面,希捷雷霆5350H 7.68TB SSD也达到了顶级PCIe 4.0 SSD的水准,实测其顺序读取速度7100MB/s,顺序写入速度6900MB/s。
在温度方面,正常高负载情况下,SSD最高温度约为50度,只是如果在短时间内持续写入超过100TB的数据,温度会升到62度以上。当然除非你拿SSD进行挖矿,否则基本上都不会出现几小时内写入100TB数据的情况。
在使用寿命方面,主流PCIe 4.0 SSD都是每天0.3次全盘写入,雷霆5350H 7.68TB SSD拥有14000TBW写入寿命,支持每天1次全盘写入,也就是5年时间内,你可以每天都写入7TB数据。
希捷雷霆5350H的出现,意味着数据中心能够以更低的成本提升计算能力,同时也能让高端消费者用户也能感受企业级SSD的魅力。
满功耗释放背后的秘密是什么?我们对OMEN暗影精灵8 Pro拆了个机
新一代OMEN暗影精灵8Pro游戏本的上市,带来的是更高的功耗释放水平、满血的战斗力表现以及更畅爽的游戏体验。但同时,满功耗也意味着会带来更高的热量,这将非常考验散热模组的水平,并且这一系列连锁反应将决定玩家最终体验的好坏。不久前,PConline评测室拿到了搭载英特尔酷睿i7-12700H处理器 英伟达RTX3060满功耗版显卡配置的OMEN暗影精灵8Pro,满功耗版显卡会带来怎样的性能表现?它的散热能力如何?今天我们带大家一起深入了解一下。
配置如下:
日常使用环境下,很难让处理器和显卡一直保持满负载状态,所以我们通过使用Furmark AIDA64FPU对OMEN暗影精灵8Pro进行35分钟双烤测试,模拟极端满负载运行环境,从而考察硬件最高的性能输出以及散热系统的抗压表现。
双烤测试环境:显卡驱动:GeForceGameReady516.94BIOS版本:F.08OGH版本:1101.2209.1.0室温:25℃
双烤不降频,散热真的稳
一般来讲,笔记本保持满负载运行30分钟以上,如果CPU和GPU都还能维持硬件标称功耗的话,就说明这款笔记本的散热设计是过关的,因为让硬件持续满负荷工作会大幅增加发热量,如果笔记本散热不佳,CPU/GPU硬件就会随之降频,功耗下降,最终性能也会明显下降。
在烤机测试35分钟后,OMEN暗影精灵8Pro搭载的RTX3060显卡功耗可以稳定保持在130W;而此时i7-12700H处理器的功耗为30W,达到了硬件实标水准,说明OMEN暗影精灵8Pro的散热确实非常不错。
烤机热成像如图:B面键盘位最高温度在48℃左右,高温区集中在键盘中部,对游戏操作影响不大,而游戏常用的WASD操作区域,可以看到W键测温仅为29.8℃;表面温度控制出色,高温区处于用户较少接触的位置,据此推断,在日常使用环境下,笔记本表面温度会非常友好,不会出现烫手的感觉。
在实际的游戏测试中,OMEN暗影精灵8Pro的发挥也非常不错,并且多款游戏全程玩下来,在画面和帧数表现方面很稳定,没有出现过跳帧和卡顿的情况。
在出色的性能发挥和良好的散热表现背后究竟藏着什么秘密,下面我们就拆个机看看。
OMEN暗影精灵8Pro外壳螺丝规格和内部绝大多数螺丝一致,因此使用一根十字改锥就能完成整套拆解流程,注意固定后壳的八颗外壳螺丝长短不一,分为两长六短,复原的时候不要拧错。
将螺丝卸下来以后就可以用撬棒将背板翘起了,OMEN暗影精灵8Pro的背板是由一整块复合材料制成,因此撬开背板的时候一定要慢,而且背板上的卡扣比较多,切忌大力出奇迹。背板拆下来以后就能看到机身内部构造了,布局也是比较规整:风扇、热管、电池、双内存双硬盘扩展位等一目了然。
机身硬盘上面覆盖有石墨烯散热片,起到SSD硬盘与机身D面之间导热的作用。
测试机的硬盘为512GB的SSD,型号是西数的SN810,也是现在市场上PCIe4.0硬盘中的高端产品。
之前我们对硬盘做过跑分测试,读取速度为6905.62MB/s,写入速度为4519.92MB/s,这个成绩在PCIe4.0的硬盘里也属于第一梯队了。
同时,机器的左边还有一个硬盘的扩展位,用户可以根据实际需求进行加装扩展。
OMEN暗影精灵8Pro机身内部有两个内存插槽,可以组建双通道内存,内存槽两侧有弹性卡扣,拆卸时可以直接用手将两侧卡口向外轻推,随后即可取出。
内存为2*8GB的三星DDR54800MHz,从AIDA64的测试来看,读取为57857MB/s,写入为58416MB/s。
看完硬盘和内存不放呢,接下来就到了我们今天的重头戏——散热系统,散热系统可以说是游戏本中最核心的部件,良好的散热既可以保证硬件处于最优性能状态,又可以大幅延长电子设备的使用寿命,一般建议玩游戏比较频繁的玩家,以半年为周期为笔记本更换一次优质的硅脂。
↑OMEN暗影精灵8Pro散热系统
继续拆散热模组,散热器没有与风扇集成在一起,是可以单独拆下来的,方便分开清灰。OMEN暗影精灵8Pro在散热系统方面进行了强势升级,风扇采用创新的Y形扇叶设计,可以让叶片密度提升30%以上,从而大幅提升空气导通性,搭配12V三相马达和液态轴承,能够做到高效低噪;这台机器配置有五根热管,其中两根8mm主热管,总热管长度较上一代增加22%,散热鳍片总数达到了206片,属于游戏本中的豪华配置。
OMEN暗影精灵8Pro的散热片除了CPU/GPU部分有硅脂导热,显存与供电模块对应的位置也涂有散热膏,从而保证了机身整体的散热效率。
出风口主要布局在机身背部和左右双侧,总计2进4出6风口设计,这一代机型将进风口开孔率提升到68%,出风口开孔率提升到90%,进一步提升了风道容积,带来更大通风量。
通过拆解,我们看到OMEN暗影精灵8Pro搭载的散热模块有着非常出色的设计布局和硬件配置,从风道设计到热管布局,再到风扇模组配置,每一处都带来了升级和强化,从而实现了更加高效的散热能力,为整机的高功耗稳定输出提供了强有力保证。
OMEN暗影精灵8Pro的高性能既有其出众硬件配置和高效散热系统的功劳,也有软件系统的助力。预装软件OMENGamingHub,不仅可以实现对装机游戏的一站式管理,还可以对风扇转速、键盘灯效、性能模式进行调整,通过软件计算出最佳的性能平衡点,无论在游戏还是日常使用中都可以实现最佳的性能表现。
通过拆解,我们可以看到,OMEN暗影精灵8Pro的内部布局规整,内存和硬盘都配备了双接口,为未来机器升级提供了灵活的拓展空间;散热系统的部件一体性强,拆解方便;对于普通用户来说,未来无论是机器升级还是清灰换硅脂都很容易上手操作。可以说OMEN暗影精灵8Pro从内部布局到外观设计,从硬件配置到软件支持,都做得非常到位,我们通过对机器的拆解,从内到外都感受到了这款机器的不俗实力。而且作为一线品牌,这款机器在做到配置拉满、性能满血的情况下,售价也非常亲民,可以说是市面同配置机型中“守门员”级别的存在。如果你是一位对游戏性能有着较高追求的玩家,OMEN暗影精灵8Pro这款机器非常值得你拥有,而且近期年货节临近,到OMEN暗影精灵京东自营旗舰店入手购买,可享不定时秒杀福利,优惠多多!
OMEN暗影精灵京东自营旗舰店
UninstallPKG疑难解答如何通过删除打印机驱动程序来节省空间
苹果电脑的流畅运行深受广大用户的喜爱!
但是,Mac电脑用时间长了,所占的电脑内存也是会越来越多的!
那么,如何通过删除打印机驱动程序来节省空间?
如果您在UninstallPKG软件包列表中看到打印机驱动程序,则可以继续进行卸载。
但是,驱动程序可能没有出现在列表中,因为默认情况下,UninstallPKG不允许删除系统软件包,因为这可能会导致系统损坏甚至无法启动。
要显示驱动程序,请按照以下步骤操作:
1.打开首选项,然后从“忽略安装程序包”列表中删除“ OS X安装程序”,“软件更新”,“ SoftwareUpdateConfigData”和“ softwareupdated”
2.单击在主d窗口中单击“刷新”按钮以刷新软件包列表
3.删除您希望消失的打印机驱动程序。例如,三星打印机驱动程序的名称为:com.apple.pkg。
4.确保不要删除打印机驱动程序之外的任何重要内容
5.卸载打印机驱动程序后,最好将首选项重置为默认值(例如,按“忽略首选项中“列表安装的软件包”。)
三星实验室推出 MegaPortraits AI 工具,可让蒙娜丽莎动起来
IT之家8 月 6 日消息,近日,三星实验室有一个名为 MegaPortraits 的新 AI 换脸工具在国外爆火,简单来说就是这款 AI 工具可以捕捉真人的脸部动作,让静态肖像可以模仿真人的表情、动作,让其“动”起来。
从 GIF 中我们可以看到,一段视频就可以让原本静态的图片动起来,甚至还能展示出侧脸的轮廓,这些都是 MegaPortraits AI 换脸工具自行“脑补”出来的画面,任何细微的表情都可以“魂穿”到图片的人物当中,仿佛它原本就是一段视频一样,看不出破绽。
这项技术的工作方式是将源图像与“驱动图像”的运动混合在一起,然后将“驱动图像”的运动嵌入到源图像中,每一帧生成运动的 AI 模型是从来自源图像和“驱动图像”的两个随机帧中训练出来的,这里的“驱动图像”就是指上面两组 GIF 中最左侧的真人。
“驱动图像”的外观及其运动在被投影到原始图像上之前由模型分别处理。在这项工作中,三星将神经头头像技术提升到百万像素分辨率,高分辨率头像的设计目的是无论真人看起来与图片中的形象相差大不大,都可以实现图片动态化,而不需要像其他 deepfake 软件需要的面部形状或肤色相似才能模仿。
所以即便当“驱动图像”的外观与源图像的外观有很大不同时,也可以利用中等分辨率的视频数据和高分辨率的图像数据来实现所需的渲染图像质量水平和运动的变化。
MegaPortraits 研究人员解释道:“我们的训练设置是相对标准的,我们每一步从我们的数据集中采样两个帧:源帧和驱动帧。我们的模型将驱动帧的运动 (即头部姿势和面部表情) 强加到源帧的外观上,以产生输出后的图像。”
他们还表示:“主要的学习信号是从源帧和驱动帧来自同一视频的训练集中获得的,因此我们的模型预测经过训练以匹配驱动帧。”
IT之家了解到,MegaPortraits 研究人员表示,目前 MegaPortraitsAI 换脸工具在肩膀以及服装区域表现不佳,他们将来也会着重改善这个问题。
耕升RTX 3090 Ti炫光·超OC评测 扛鼎之作
RTX 30系最后一张旗舰卡皇RTX 3090 Ti的发布,宣告本代显卡画上了完美句号。各家也都卖力的“站好最后一班岗”,此刻估计也都在为下一代产品做着准备。而今天评测的产品——耕升GeForce RTX 3090 Ti 炫光·超OC有些特殊。它是耕升在RTX 30系,最后一张卡上发布的X系列中的最高规格型号。
本次发布的RTX 3090 Ti的供电接口均采用了全新的单16pin设计,结合Intel刚刚发布的电源新标准,不难猜测后续NVIDIA推出的下一代显卡将继续增大功耗。
规格方面,RTX 3090 Ti采用了满血GA102核心,84组SM单元,比RTX 3090多了2组,同时频率和功耗也都有所增高。
耕升GeForce RTX 3090 Ti 炫光·超OC
这张RTX 3090 Ti拥有24GB大显存,依然定位于内容创作者。但单就性能提升的幅度来说,这张RTX 3090 Ti在游戏方面的表现同样有非常高的提升。
耕升GeForce RTX 3090 Ti 炫光·超OC这张显卡的售价为15999元,可使用满5999-600元优惠券,而随着RTX 3090 Ti的推出,大部分市售RTX 3090价格也有一定程度下调。
在评测开始前,笔者先还是先将这款显卡的特点列出方便大家阅读:
1.新16pin供电设计,采用新ATX3.0电源标准,通过附赠转接线可兼容旧型号电源;
2.24GB大显存,轻松应对8K HDR游戏及内容创作软件
3.支持ECC校验,增加专业软件领域稳定性
4.1905MHz高频率,高于官方1860MHz标准频率
5.全新炫光·超系列外观设计
本次耕升炫光·超的发布,是所有AIC中外观重新设计改动最大的,通电后华丽的灯效是这款显卡最大的亮点,而在关机后,纯黑色的导流罩也如同黑曜石般璀璨。
另外在RTX 40系即将发布之际,这款RTX 3090 Ti其实来的多少有些晚了,但从定位上来说,它并不会参与常规游戏卡的性能“厮杀”,依旧主要定位于内容创作领域,所以竞争对手同样是RTX 40系的内容创作卡,影响不大。
01 NVIDIA Ampere架构的 满血GA102核心
耕升GeForce RTX 3090 Ti 炫光·超OC显卡采用了NVIDIA Ampere架构,我们首先来看一下这次的GA102核心。
RTX 3090 Ti算力对比TITAN RTX
相较于上一代Turing RTX架构的,NVIDIA Ampere架构在算力上有着成倍的增长,GeForce RTX 3090 Ti的着色器性能达到40 TFLOPS单精度性能,而搭载NVIDIA Turing架构的TITAN为16.3 TFLOPS。
RT Core达到78 RT TFLOPS。而且第二代光线追踪最重要的不仅仅是性能提升,还增加了对游戏中运动模糊部分场景的光线追踪计算加速。
全新的Tensor Core可自动识别并消除不太重要的DNN权重,处理稀疏网络的速率是Turing的两倍,算力高达320 Tensor TFLOPS。
RTX 3090 Ti显存对比TITAN RTX
同时在显存方面,RTX 3090 Ti也采用了24GB GDDR6X显存,显存频率达到了21 Gpbs,带宽则是史无前例的1 TB/s,让这款显卡可以畅玩8K 60帧游戏。
RTX 3090 Ti所采用的GA102核心
GA102的完整核心图NVIDIA在RTX 3080发布时就已经公布,现在终于有显卡应用到了未阉割的GA102。完整的GA102 GPU包含7个GPC(图形处理集群)42个TPC(纹理处理集群)以及84个SM(流处理器),CUDA数量为10752个。下面我们再来看看几款显卡的核心参数对比。
GA102核心拥有280亿(28000 million)个晶体管,628m㎡的面积,基于三星的8nm NVIDIA定制工艺,来自Micron的GDDR6X显存。
02 耕升GeForce RTX 3090 Ti 炫光·超OC 概览
首先开箱,在配件方面,除了常见的金属显卡支架和灯光同步线,由于本次在非公版显卡中首次搭载了单16pin供电接口,所以还配备了一根单12pin转8pin*3的转接线(12pin兼容ATX电源3.0标准)。
包装内配件
目前Intel已经发布了ATX电源3.0的新标准,就是需要有新的单16pin的显卡供电,目前已经有部分旗舰电源应用到,但普及尚需要些时间。不过相信不久后即便是RTX 3090 Ti的450W功耗,只接一根外接供电就够了。
耕升GeForce RTX 3090 Ti 炫光·超OC
通电后默认效果
耕升GeForce RTX 3090 Ti 炫光·超OC的外观进行了重新设计,采用全新的“炫之黑曜石散热器”,进一步加强了灯效,其效果肉眼可见。并且搭配上波浪形的亮面钢琴外壳设计,即使在不点亮的情况下,也犹如黑曜石般璀璨。
并且由于这款显卡更是定位旗舰游戏,在散热方面也更加下功夫,主动散热部分由2个100mm和1个90mm风扇组成,其采用11叶锋刃造型设计,在相同转速下可进一步加强风流量,有效降低温度。
内部散热鳍片展示
内部的主动散热部分,耕升GeForce RTX 3090 Ti 炫光·超OC采用8根符合热管,24相供电,加密加大散热鳍片,提供更高的散热效率。
耕升GeForce RTX 3090 Ti 炫光·超OC背板展示
耕升GeForce RTX 3090 Ti 炫光·超OC的金属背板相较RTX 30系的其他几款产品有所不同,为了配合此次的“异形”PCB板,采用了大面积镂空的进气格栅,更有利于热空气排出。
单16pin供电接口
耕升GeForce RTX 3090 Ti 炫光·超OC是首次采用单16pin接口的非公型号,从视觉效果来看,更简洁更美观。
目前新的PCIe 5.0的电源规范为12 4pin的完整供电,其中最上面的4pin为讯号线,用于检测12V功耗是否可以满足显卡使用,新一代支持ATX 3.0标准的电源会自带16Pin的供电线。所以目前全部采用8*3pin转12pin的转换线。
DP1.4a*3 HDMI 2.1
视频输出接口依旧采用了DP1.4a*3 HDMI 2.1的四接口设计,另外由于新的HDMI 2.1协议,最高已可支持单线8K的视频输出。
03 3DMARK理论性能测试
首先介绍一下测试平台,为了保证此次评测能够发挥3DMARK理论性能测试显卡的最佳性能,主板和CPU采用了11代桌面旗舰级配置,并且将内存容量提升至32GB,具体如下:
在测试成绩上,基准测试采用3DMARK,游戏性能测试使用游戏自带Benchmark,同时为了减小误差,每项测试成绩均测试3遍取平均值。
GPU-Z参数
首先看一下GPU-Z的参数,耕升GeForce RTX 3090 Ti 炫光·超OC采用GA102核心,三星8nm工艺,芯片面积628平方毫米,拥有10752个CUDA,Boost频率达到1905MHz,相较公版的1860MHz有较大提升。采用24GB GDDR6X显存,位宽为384bit,显存带宽达到了1008.4 GB/s,光栅单元和纹理单元为112和336。
下面先进行的是用来衡量显卡DX11理论性能的3DMARK FS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能,取显卡分数实际测试结果如下:
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中,RTX 3090 Ti的性能提升显著。耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090综合提升11%,作为本代Ti后缀的型号,除了RTX 3060 Ti,RTX 3090 Ti是提升最大的,而且这还是在没有更换核心的情况下。
3D MARK TS套装测试
而在针对DX12环境下的Time Spy和Time Spy Extreme测试中,耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090提升约为10%。
3D MARK 光追测试
PortRoyal是3DMARK中专门针对光追性能的测试项,耕升GeForce RTX 3090 Ti 炫光·超OC相较RTX 3090提升约为12%。
综合来看,RTX 3090 Ti相较RTX 3090的提升几乎相当于更换了芯片,但其实两个型号的芯片只相差2组SM单元,更多的是暴力提升了功耗和核心频率,但结果也显而易见。
04 游戏性能测试
在游戏性能测试中,我们选择了《地平线5》、《刺客信条:英灵殿》、《无主之地3》,国产游戏《边境》、《光明记忆:无限》的benchmark跑分软件。
虽然这张RTX 3090 Ti显卡并不是为游戏玩家所准备,但此次大幅度的理论性能提升,也不禁让人好奇,在游戏中这张卡会有怎样的表现。
《地平线5》游戏测试
首先在《地平线5》中,耕升GeForce RTX 3090 Ti 炫光·超OC显卡的1080P成绩相较RTX 3090再提升4%;2K分辨率成绩提升3%;4K分辨率成绩提升5%。
《刺客信条:英灵殿》游戏测试
在《刺客信条:英灵殿》中,可能由于驱动版本的更新和游戏更新,所有跑分相较以前的成绩均有大幅度提升,我们以本次跑分成绩为准。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升5%;2K分辨率成绩提升12%;4K分辨率成绩提升9%。
《无主之地3》游戏测试
《无主之地3》是一款采用了卡通渲染风格的游戏,它对于性能要求的下限很低而上限又很高,耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升13%;2K分辨率成绩提升7%;4K分辨率成绩提升7%。
《光明记忆:无限》游戏测试
《光明记忆:无限》是由飞燕群岛工作室开发的《光明记忆》新系列,正式版已经在steam发售只要48元,属于小品级游戏中的大制作。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升11%;4K分辨率成绩提升13%。
不过即便强如RTX 3090 Ti,在4K分辨率下也没有达到60帧。《光明记忆:无限》的benchmark测试似乎将光线追踪用到了极致。
《边境》游戏测试
在另外一款国产游戏《边境》的跑分软件中,情况基本与《光明记忆:无限》相同,测试条件均在“RTX最高/DLSS质量”下进行。
耕升GeForce RTX 3090 Ti 炫光·超OC的1080P成绩相较RTX 3090提升6%;2K分辨率成绩提升8%;4K分辨率成绩提升10%。
在整体游戏方面,NVIDIA官方给出的游戏数据是在标频情况下提升约为4-8%,而我们测试的耕升GeForce RTX 3090 Ti 炫光·超OC在1905MHz频率下,综合提升约为10%,与理论成绩基本相符。
所以尽管RTX 3090 Ti的定位依然是内容创作显卡,但它的性能提升是实实在在的,如果不考虑性价比的话,入手一张绝对是本代最强游戏卡。
05 专业软件测试
除了光线追踪的强化,NVIDIA Ampere架构的Tensor Core也得到了极大地加强,在第三代Tensor Core中,NVIDIA引入了稀疏化加速,可自动识别并消除不太重要的DNN(深度神经网络)权重,同时依然能保持不错的精度。首先原始的密集矩阵会经过训练,删除掉稀疏矩阵,再经过训练稀疏矩阵,从而实现稀疏优化,进而提高Tensor Core的性能。
同时,显卡的一个重要指标是显存容量和位宽,显存位宽越大,表示单位时间显卡能处理的数据的越多,RTX 3090 Ti拥有384bit 位宽,带宽为 1008.4 GB/s,以及24GB大显存,这都为内容创作提供了更好地助力。
NVIDIA控制面板中新增ECC开启功能
另外此次RTX 3090 Ti也是NVIDIA在RTX 30系中首次为消费级显卡开启ECC显存校验,开启这一功能后,显卡性能会有所下降,但稳定性会增加,更有助于在专业软件中长时间稳定工作。
NVIDIA Omniverse
在此次GTC 2022大会中NVIDIA也正式向开发者推出NVIDIA Omniverse实时设计协作和模拟平台,它可轻松构建自定义工具,以简化、加速和改进其开发工作流。更多关于Omniverse的使用体验和链接方法,可以参考笔者之前的文章“NVIDIA Omniverse体验 老板监工神器”,这里就不过多讲解了。
上图为笔者使用SPECviewperf 13这款工业、专业软件跑分测试。对比显卡为本代的游戏旗舰RTX 3080 Ti和生产力工具旗舰RTX 3090 Ti。
从结果来看,两款显卡相差不大,但测试环境都是在不爆显存的情况下得来,毕竟RTX 3080 Ti同样使用的GA102芯片,也是本代最强的游戏旗舰卡。另外如果在更高分辨率下的渲染中,大显存的优势才会突显,当显存溢出时,通常不像游戏只是卡不卡的问题,而是能不能用的问题。
KeyShot 9测试
KeyShot 意为“The Key to Amazing Shots”,是一个互动性的光线追踪与全域光渲染程序,无需复杂的设定即可产生相片般真实的 3D 渲染影像。
KeyShot 9有预设模型,进入软件后直接点击渲染,为了更考验大显存所带来的帮助,我们直接将渲染分辨率改为预设的7680×7680方形8K尺寸。
同时在选项中,选择GPU渲染,可以看到目前正在采用RTX 3090 Ti进行渲染,而GPU使用量为100%
耕升GeForce RTX 3090 Ti 炫光·超OC 渲染时间为1分42秒
在预设模型的渲染中,可以看到整个过程的渲染时常为1分42秒,其中在渲染时的显存占用为17.1GB,已经远远超出了RTX 3080 Ti的12GB,也让笔者不由得期待超出显存后会是什么样。
RTX 3080 Ti渲染崩溃
在使用RTX 3080 Ti后,由于渲染8K分辨率图片的显存严重溢出,会导致软件无法渲染,直接崩溃。虽然在KeyShot 9中软件崩溃没有比较明显的提示,但通过这重叠的窗口用户也能大体看出端倪了。
DaVinci(达芬奇)测试
DaVinci(达芬奇)是世界上专业8K编辑的唯一解决方案,集成颜色校正,视觉效果,音频编辑在一个软件中。
首先在偏好选项中,取消勾选自动的GPU配置,指定使用耕升GeForce RTX 3090 Ti 炫光·超OC显卡。
导入一段高清的8K素材后,在运动特效中增加时域降噪、时域阈值以及运动模糊的参数,下面先来看RTX 3090 Ti的演示效果。
耕升GeForce RTX 3090 Ti 炫光·超OC可流畅预览
这一段8K素材的可调色空间非常大,笔者增加了一层电影滤镜,可以看到在使用RTX 3090 Ti时,可以在实时预览时达到非常流畅的程度。
RTX 3080 Ti预览崩溃
在分辨率越高的情况下,实时预览对显卡显存的要求也就越高,RTX 3080 Ti采用12GB显存会出现报错,这就是因为显存不够。
在显存不够报错的情况下,解决办法基本只有创建代理进行剪辑,不过这样无法展示素材的最真实效果,所以在超高分辨率下,拥有24GB大显存的RTX 3090 Ti拥有绝对优势。
Blender测试
Blender是一个免费开放源码的3D创作套件。它支持整个三维编辑-建模,索具,动画,模拟 渲染,合成,运动跟踪,视频编辑和2D动画编辑。
首先还是设置渲染设备,Blender默认使用CPU渲染,这里选择RTX 3090 Ti。
在软件内的渲染设置内,勾选两项降噪,并且为了增加渲染时常,我们将采样率提升至400,渲染分辨率提升为200%。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时长为1分21秒
RTX 3080 Ti渲染时常为1分29秒
在第一组测试中,耕升GeForce RTX 3090 Ti 炫光·超OC的渲染时常为1分21秒,RTX 3080 Ti的渲染时常为1分29秒,单独来看差异似乎不大,不过我们对比的为RTX 3080 Ti显卡,刨除显存的因素,这也是一张旗舰游戏显卡,算力非常强悍。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时间为1分41秒
RTX 3080 Ti渲染时常为1分49秒
第二组对比中为一段900帧的循环动画,并且分为第三人称视角和第一人称视角双镜头。这组对比中,单帧的差距仍然为9秒。
不过可能是自带运动模糊,增加了一定的显存使用率,所以在渲染时RTX 3080 Ti偶尔有报错的情况,只能重新渲染。
耕升GeForce RTX 3090 Ti 炫光·超OC渲染时间为1分32秒
RTX 3080 Ti渲染时常约为1分39秒
在同一帧下,第一人称视角与之前的时间基本相同,这里不做过多阐述。
在这段动画中,我们按照每帧渲染时间相差18秒(双镜头)来计算,一段900帧的动画渲染时常就会相差16200秒,等于270分钟或者4.5小时。
如果按1秒24帧来计算,那么这段动画也只有37秒左右。而在大型的动画电影中,庞大的数据量往往需要电脑夜以继日的渲染,即便是崩溃一次,可能也会浪费很久的时间,所以大显存在内容创作领域的优势显而易见。
06 功耗及温度测试
功耗测试中,我们选择FurMark软件进行拷机测试,并采用GPU-Z检测温度,功耗仅计算显卡自身。
功耗测试(点击查看大图)
耕升GeForce RTX 3090 Ti 炫光·超OC经过我们的实测在满载状态下单卡功耗为412W左右,但是可以看到下面新增的TDP项,GPU满载也只达到了86%的水平。所以根据这个来计算,如果达到100% TDP,实际为480W左右。
温度测试
温度方面,本次的耕升GeForce RTX 3090 Ti 炫光·超OC经过25分钟左右的拷机,温度稳定为72℃左右,峰值达到73℃,另外显存温度为80℃,处于正常工作范围内。
07 耕升扛鼎之作
本次RTX 3090 Ti的成绩进步显著,虽然相比RTX 3090只差了2组SM单元,但频率和功耗的拉高,让他在理论性能上综合提升10%。
前面我们也已经提到,在下一代显卡即将发布之际,RTX 3090 Ti的发布时间会不会太晚了一些?首先原本NVIDIA预定这张卡会在几个月前发布,但出于技术原因让这张卡“回炉重造”,所以比原定计划更晚。另外就是RTX 3090 Ti依然定位内容创作者,24GB的大显存即便在4K分辨率下的游戏都有很大浪费,所以即便下一代显卡发布,它的竞争对手依然是TITAN级别的。
另外NVIDIA官方已经宣布,即便日后发布RTX 40系显卡,RTX 30系也将同时售卖。所以个人猜测,两代显卡在价格和性能方面不会出现太多重叠。
在散热方面,由于RTX 3090采用了单颗容量1GB的显存,所以PCB版双面均有排布,发热量巨大,也更不好设计散热方案。而本次的RTX 3090 Ti也是首次采用了单颗2GB的GDDR6X显存,这也是为什么大家看到本次的RTX 3090 Ti拷机温度更容易控制。
对比此前发布的RTX A6000显卡,不难发现两款产品其实采用了完全相同的核心,都是GA102,都是10752个CUDA,甚至Boost频率都是1860MHz,而目前RTX A6000在京东的售价为34799元,那么这两款产品到底有什么区别?
RTX A6000参数一览
显存方面,RTX 3090 Ti相比RTX A6000少了24GB显存,但由于采用了GDDR6X显存,带宽更高了,整体速度更快。原本专业卡独有的ECC显存校验,本次在RTX 3090 Ti中也得到了支持。不过vGPU显存是不支持的,这也是RTX A6000在专业卡上得天独厚的优势。
另外最重要的,如RTX A6000这种专业卡,在FP64运算性能上都要比消费级显卡高很多RTX A6000为1210 GFLOPS;而RTX 3090 Ti为625 GFLOPS。
游戏方面,其实RTX A6000也有着不错的表现,如果你真的有钱,买一张A6000来打游戏也不是不可以,但它的帧数应该会比RTX 3090 Ti更低,同时散热表现也没有那么好。
但专业卡的长处在于各大专业软件的兼容和适配,以及内部调校。如Catia以及SW等软件针对专业卡都有非常好的优化,不过我们常见的3DSMAX和MAYA等软件,即使是消费级的RTX 3090 Ti同样有着出色的性能和稳定性表现。
RTX 3090 Ti这张显卡的定位依旧是主内容创作者,尽管NVIDIA在各方面的宣传都没有提及游戏性能,但不可否认的是,此次RTX 3090 Ti在理论和游戏测试性能有着大幅度提升,均达到10%左右。
如果你想用它来打游戏,不追求性价比,只要极致性能,那么买一张也没什么问题。
耕升GeForce RTX 3090 Ti 炫光·超OC可以说是本带显卡的扛鼎之作,外观设计我认为是本带之最,外观以及灯光效果都得到了极大加强。不过受制于高功耗和散热需求,卡身同样也比较厚重,这是无法避免的。
目前这张耕升GeForce RTX 3090 Ti 炫光·超OC显卡的售价为15999元,但是有满5999-600元优惠券,如果感兴趣的话可以前往官方旗舰店查看。
08 附录1-各游戏 光线追踪 效果对比
上面我们测试了部分游戏的光追和DLSS性能表现,这些效果具体在游戏中是什么表现,下边笔者选择了两款游戏给大家展示一下。
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在这一组对比中,可以较为明显看出光线追踪的差别。它更为真实的渲染出光线本该有的样子。不过在本作中,是没有白天出现的!游戏中大量环境光实则是为玩家提供照明作用,开启光线追踪,虽然画面更真实了,但在部分昏暗场景下,会更看不清。
这一时间也说不好是游戏本身的问题还是光线追踪的问题,还是说游戏画面并不是越真实才越好?
《幽灵线:东京》RTX ON(点击查看大图)
《幽灵线:东京》RTX OFF(点击查看大图)
在第二组对比中,情况有所好转,水面的倒影更清晰。但同样的,可以看到建筑物上的光线更暗,确实给游戏增加了不少压抑成分。
《光明记忆:无限》RTX ON(点击查看大图)
《光明记忆:无限》RTX OFF(点击查看大图)
《光明记忆:无限》温泉场景中的光追效果是最为耗费显卡性能的。不难发现,最大的变化来自水中的倒影,而这一组倒影的计算难度非常高,由于并不是平静水面,所以要首先要考虑光线在水面的变化,其次与岸边鹅卵石的光线折射效果,最后则是综合前两种效果,将光线照射在水池底部。
《赛博朋克2077》RTX ON(点击查看大图)
《赛博朋克2077》RTX OFF(点击查看大图)
在《赛博朋克2077》中,光追效果随处可见,而在游戏中也运用到了不同的光追效果,包括最常见的光追反射、阴影,还有环境光遮蔽、漫反射照明以及全局光照等比较高级的效果。
《逆水寒》RTX ON(点击图片查看大图)
《逆水寒》RTX OFF(点击图片查看大图)
在网游《逆水寒》中,由于光追效果正处于试验阶段,并没有如宣传片一样的水面反射。但画面整体的阴影更加真实,如头顶树木的阴影,以及水面上荷叶的效果。而且由于光追效果较少,在打开该功能后帧数并没有明显下降。
《堡垒之夜》RTX ON(点击查看大图)
《堡垒之夜》RTX OFF(点击查看大图)
堡垒之夜的光追效果还是比较明显的,其中加入了反射、全局照明和路径追踪等效果。卡车车身上的反射较为明显,角色身上的环境光在打开光追后更为写实,另外仔细看的话远处建筑物的玻璃同样有光线的反射,整体画质改善非常明显。
《魔兽世界9.0》RTX ON(点击查看大图)
《魔兽世界9.0》RTX OFF(点击查看大图)
《魔兽世界9.0》同样作为一款卡通渲染的网游来说,魔兽的年代更加久远,此次加入光追效果在整体视觉上没有堡垒之夜明显。不过如远处的树木阴影,以及近处石台下方的阴影都比较明显。
《控制》RTX ON(点击查看大图)
《控制》RTX OFF(点击查看大图)
《控制》这款游戏所采用的引擎物理效果非常出色,同时光追开关的对比也是肉眼可见的明显。包括玻璃上的人物反光,远处地面的植物反光都比较清晰,同时打开光追后屋顶处的明暗对比也更加明显。
09 附录2- 各游戏DLSS效果对比
《幽灵线:东京》DLSS对比(点击查看大图)
在《幽灵线:东京》的DLSS对比中,我们在4K分辨率下,放大水面倒影局部细节,由于倒影本身为光线追踪反射形成,所以在DLSS计算下,可以明显看到从清晰到模糊的渐变过程,不过在DLSS质量和DLSS平衡模式中,均有着不错的清晰度。
同时图片最上方的霓虹灯,可以看到在DLSS超级性能模式中有着较严重的逸散情况,这也是DLSS对于灯光边界,在AI计算中较难定位的表现。
不过对于游戏画面原生的贴图来说,如最远处墙壁上的“HSHS”字母涂鸦,即使是DLSS超级性能,也有着非常精准的还原能力。
帧数提升方面,五种模式分别为34/59/72/85/99,DLSS相较原生画质的提升为74%/112%/150%/191%,非常暴力。
《幽灵线:东京》DLSS对比(点击查看大图)
在这组对比中,DLSS超级性能模式依然会有边界模糊的问题,但整体来说效果令人惊讶。包括远处灯牌上的字,依然清晰可见。
帧数提升方面,五种模式分别为32/57/68/88/93,DLSS相较原生画质的提升为78%/113%/175%/191%,与上一处对比场景几乎相同。
《幽灵线:东京》DLSS对比(点击查看大图)
最后我们再来对比一下便利店中饮料上的文字,在这一组对比中到DLSS性能模式为止,都有非常好的画面表现,字体轮廓和物体的边界清晰。
帧数提升方面,五种模式分别为40/73/83/90/97,DLSS相较原生画质的提升为83%/108%/125%/143%。
在所有的DLSS超级性能模式中,给人的感觉是画面缺少锐利度,这也是由于超高的分辨率缩放,并不太适合4K分辨率下,如果换成8K分辨率,在基础信息较丰富的情况下,DLSS超级性能中会有不错的表现。
我们再来看看《彩虹六号:异种》各个DLSS模式下的画质表现。超级分辨率技术中,最难以把控的就是这种栅栏的细节部位,但是根据实测来看,即便是超级性能模式中,细节依旧清晰。可以看出较大差距的只有标识牌上的字体,在超级性能模式中,颜色边缘会有模糊的情况。
从帧数提升上来说,相比原生画质分别提升了55%/73%/88%/131%,对于游戏玩家来说,这简直是神迹!
接下来再提高难度,第一幅对比图的栅栏为独立建模,而此图中的棋盘格则是建筑中的花纹细节,可以看到在超级性能模式以上的细节把控都是比较到位的。而遍布地图中的菌毯在DLSS效果中也没有失真或模糊的情况。
帧数方面,相比原生画质分别提升了49%/85%/111%/162%。确实如NVIDIA所说,拥有了AI就拥有了未来,DLSS无论从画质表现还是帧数提升上来说,值得每一位玩家拥有。
《光明记忆:无限》在这一组对比中,在画面差距上,从DLSS关到DLSS性能依旧看不出什么变化,但是在超级性能模式中,墙壁的清晰度以及轮廓都有所下降。
当然总的来说,尽管DLSS贡献了非常大的功劳,但可以看得出《光明记忆:无限》在优化方面下了很大功夫,这对于靠一人主导的游戏来说难能可贵。
《赛博朋克2077》DLSS模式对比
《赛博朋克2077》这款游戏中,以2K/RTX ON/DLSS关闭 原生画质下作为标准,在打开DLSS质量模式后可以看到整体画面几乎没有任何变化,广告牌的字样边缘依然很清晰。在DLSS平衡和DLSS性能模式中依然有着不错的状态,整体相较原生画质并无二致。
《逆水寒》DLSS模式对比
画质说明
在《逆水寒》的DLSS测试中,我们将画面设置为4K分辨率,画质为预设最高。通过关闭、快速、超级性能,3种不同模式来进行帧数以及画面的对比。
首先在关闭DLSS中,游戏帧数为26帧原生画质,打开DLSS快速模式后为41帧,而打开DLSS超级性能模式后为57帧。通过放大图片不难发现原生画质和DLSS快速模式的区别很小,而DLSS超级性能模式中角色背后的装饰会变模糊,以及木条箱的纹理边界会有较明显变化。但帧数提升却非常明显。
《永劫无间》DLSS模式对比
在《永劫无间》的DLSS对比中,原生画质大家可以注意角色发带的编制质感,每一根发丝边缘都较为清晰,同时肩部的服装花纹也有较为明显的凹凸感。在DLSS打开后,由于其工作原理就是缩放后,再由AI算法放大进行边缘重建,所以在质量模式中,发丝就会丢失部分细节,但如果不细看很难发现,同时发带的细节也保留的相当完好。
而在DLSS性能模式中,头发的质感则更差一些,并且发带的编织感有明显下降,另外腰间的配置边缘也会变模糊。最后在DLSS超级性能模式中,角色整体则会较糊,无论是头发还是服饰,所以如果不是非常追求高帧数的玩家,不建议开启DLSS超级性能模式。
10 附录3-Ampere新特性
好的硬件没有软件的加持,相当于空有长柄没有枪头,想要发挥十成威力则必须软硬搭配,反之亦然。此次随着发布会共同推出的还有以下几项非常值得大家关注。
NVIDIA Reflex
以往我们关注延迟大多从显示器上了解到几毫秒极速响应,但那只是作为最终端的显示输出效果,你是否想过从系统内部到实际看到的画面有多大延迟?
NVIDIA Reflex
在20系显卡中NVIDIA反复提及的“帧能赢”,在30系显卡中也做了更进一步的突破,除了NVIDIA将推出自己的电竞显示器NVIDIA 360Hz G-SYNC ESPORTS,还有NVIDIA Reflex技术。
以往如果想测量系统延迟需要高速相机以及定制的LED鼠标电路。而使用带有NVIDIA Reflex技术的显示器将内置精确的延迟分析工具,可在CPU和GPU中优化渲染管道,极大减少延迟时间,将系统延迟整体降低至30ms以下。不过就像图中所示,为此你需要一个支持反射延迟分析的鼠标。
NVIDIA Broadcast
NVIDIA Broadcast是一款易用且专业的直播软件,它的强大之处就在于主播不再需要任何的背景布置,只需要一个普通的摄像头和一张GeForce RTX系列的显卡即可。
宠物派对直播
这款软件可以让你杂乱无章的房间立即变成直播间,其内置了音频降噪、背景虚化、虚拟背景、头部追踪等功能。NVIDIA Broadcast的工作原理是利用AI算法通过DGX超级计算机深度学习而来。
NVENC编码
同时RTX 30系显卡拥有目前最好的硬件解码器,大部分用户的电脑在直播时打开OBS推流后CPU占用会直接飙升到50%左右,而基于GPU的NVENC解码可以极大地减轻CPU负担。
NVIDIA Studio
对于内容创作者来说,提到软件可能大部分只会想到内容创作的相关软件,但NVIDIA专为内容创作者推出的NVIDIA Studio驱动则是承担着连接创作软件和显卡功能的关键。
NVIDIA Studio
NVIDIA Studio驱动经过更新与优化,对于最新版本的Adobe系列软件支持更为稳定,同时附带更出彩的创作功能。利用NVIDIA CUDA技术,GPU加速特效可实现更快的实时视频编辑并加速渲染输出,并让原本只能进行软件编码输出的视频轻松得到硬件的支持。另外在AI计算方面的优势,包括自动标记片段、特效追踪和人脸识别等功能,都有显著的速度提升。
以GPU渲染为14.98秒 而CPU渲染为11分钟
当然NVIDIA Studio的加速创作绝不止Adobe一家,DaVinci、Keyshot、Blender、D5等专业软件中都有非常亮眼的表现。不仅能提供强大且稳定的运行环境,更能以GPU加速,有效提升创作效率。
(7905712)