Banner
Win102004的硬件加速图形处理器GPU功能真的有那么
- 2021-07-08 07:28 -

  无意间看到本问题的一个回复,顿时感觉我穿越到了未来,纳尼?win10 2004这是又搞了啥黑科技?我大CPU要亡了?虽然第一时间感觉那回答不靠谱,我还是老老实实的去搜了一把,弄了半天。可能是这玩意:

  微软最新的Win10版本(2004版,目前是测试版)已经加入了一个新的功能,就是硬件加速GPU计划 ,IM体育这个功能有助手减少延迟,改进你显卡的性能

  这个翻译明显有问题,更好一点的翻译应该是:硬件加速GPU调度,嗯,只是改善了调度,可能会有提升,但是应该不是特别明显,有些网站的测评也证实了这一点:

  Wccftech选择了Core i9-9900K+RTX 2080 Ti/GTX 1650 SUPER这样两套平台,在RTX 2080 Ti上面启用硬件调度的性能变化并不明显,但是在GTX 1650 SUPER这样一张主流级显卡上面则是出现了明显的提升。其原因,如果按照NVIDIA方面的说法来解释,那就是由GPU直接管理显存在效率上带来了一定的提升。也许,这项功能会为很多主流级平台带来可观的免费性能增幅,而对高端平台来说,影响是微乎其微的。

  咱不知道你们对这个功能到底是有多大的误解。说让视频播放还有游戏中CPU执行的部分让GPU参与的,还有一位可以利用GPU多核心特性的,咱看着就尴尬啊。

  GPU参与通用计算,本质上还是属于异构计算的范畴。虽然GPU比CPU多了很多核心,但是这些核心是不能像CPU那样独立调度使用的。现在最新架构还没关注,比较早的架构的话,被划分成一个组的若干个核心,甚至不能运行同一个程序的两个不同分支的;换句话说,即使你写了一个if分支语句,而其中有几个核心出现了和其他核心不同的分支方向,那么这几个核心就得等其他核心运算结束后单独拿时间来计算自己的分支。

  所以说虽然看起来GPU也是个多核心的家伙,看起来也可以做并行计算,但是代码里要处理的问题完全不同啊亲。直接拿CPU代码,用指令翻译之类的方式送给GPU跑的话,那速度估计是要回归奔4了(未经严格比较)。所以说现在才回有各种,专门给GPU写代码的岗位啊。你觉得Windows这一个开关能做到自动把一种处理模式下最优化的代码,自动转换成另一种架构下最优化的代码并执行么?

  至于说这东西到底做了个什么事情。翻开操作系统原理教材,操作系统的作用之一就包括了计算机资源管理这一项。说人话就是,这台电脑只有一张声卡,不能让任何一个程序独自接管这个声卡,操作系统要让所有程序都能在上面播放声音;这台电脑只有一张显卡,不能只让一个程序可以在显卡上有显示,不能只让一个程序可以在显卡上运行计算程序,所以操作系统需要让许多个程序同时使用显卡这一种硬件。

  那么接下来就遇到一个问题,显卡上的资源该如何分配?每个程序可以拿到多大的显存,可以使用多少个计算核心之类的。这部分操作,过去一直是在CPU上运行的,而随着GPU的发展,它带有了可以在一定程度上实现这种功能的硬件之后,Win10开始提供这个选项,允许你使用GPU自带的显存管理器之类的。仅此而已。

  另外建议题主修改一下题目,这个功能不是叫“硬件加速GPU计划”么?咱一直就很想吐槽微软的翻译水准,原文应该是Hardware-accelerated GPU scheduling,难道不应该翻译成“硬件加速GPU调度”么?

  他自己名字都说了,自己加速的GPU调度,是多个程序共享GPU资源时的资源调度。并不会真正加速GPU运行,也不会自动用GPU加速CPU上程序的运行的。

  关键点在于,没有启动这个功能的时候,GPU资源调度的工作是有CPU来处理的。而现在这个过程可以直接在GPU内部完成。

  简单理解的话,如果由CPU来负责GPU调度的模式,类似下属的所有事情都要交给上司审阅的模式;那么GPU自行调度就是上司下放了一定的权限给下属,某些事情可以由下属自行决定而不必等待上司回复。高性能的CPU就仿佛是工作能力很强的上司,可以瞬间完成工作的指派;而低性能的CPU就仿佛是个手忙脚乱的上司,尽管GPU那边已经闲下来了,但是CPU还没准备好下一步的指令。

  也就说这个功能不是加速了GPU,而是在一定程度上防止了性能较差的CPU拖慢了GPU。不是帧数提高了,而是你的电脑一开始就没能充分调动GPU的能力。

  4k分辨率彩虹六号最高特效+TAA倍数100,帧率从40-50(贫民窟地图4k是线ti变成2080ti的感觉。

  据我的观察,GPU和CPU在处理事情的时候效果不同,GPU处理稳定平滑,而CPU会时快时慢。直观的感受是如果一个游戏卡CPU瓶颈,则会卡顿,而卡GPU瓶颈,则帧数下降,但帧生成稳定性一般保持较稳定,不会出现明显即时性卡顿。

  现在的GPU加速,让GPU更多的参与游戏中,直观感受是,稳定性提升远远大于帧数提升。帧数生成比较平滑,整个游戏会顺畅很多。

  但这块20系卡最明显、另外DX12的新游戏最明显。还有个,低U高显最明显。

  我是E31230V3+2060的配置,控制、地平线K分辨率下,平均帧都在30-40帧左右,2004的GPU加速开启不会将帧数提升多少,因为我2060早就超频到2010,显存也是在7500,E3也是锁3.7,内存DDR3超2400。

  但我的观察有2点,1个是2060因为是6G显存,所以4K下动态调用显存,场景中部分物件会低模显示,过去动态显存调用一般控制在5500的大小,而现在GPU加速开启后控制在5700到5900,同时非常厉害的在于,场景中低模显示少太多了,我相信这是因为使用了自适应着色器,将低模部分优化到远景去了,同时大量的优化了显存不断调用的效率,使得整个画面4K高材质覆盖率大幅度上升。

  第二点就是整个流畅度大幅度上升,这个流畅度上升堪比从1600的内存上到2400的程度,30帧下,就可以让地平线中鼠标的直接瞄准机械兽各种弱点丝般顺滑,因为这30帧虽然不高,但帧稳定性非常好,理论上如果稳定性趋于完美,我们看24帧电影也是丝般顺滑不是吗?

  所以2004的GPU加速,对于低U高显,20系配置,直接上4K,玩3A大作满特效的人来说,可以说是鸡血,记住,帧数远远没有帧生成稳定重要,而游戏让GPU主导之后,整个游戏的生成过程会偏向GPU的特性,即稳定,实时满负荷的那种流畅感。

  但我想,这一切都基于新游戏特性,3A上很好,这是明显的向着最新的优化技术靠的优化体系,恐怕对老的、优化差的、吃鸡、LOL这种,效果不明显。

  另外提一下,30系将引入RTX IO,将进一步介入CPU最大的瓶颈,即开放世界的实时载入,也就是众生平等奥德赛之所以众生平等的原因,我下面是准备直入3080,没错,E31230V3直接带3080,我有理由相信,未来随着显卡大部分代替掉CPU的工作之后,E3完全可以配合3080执行4K60帧丝般顺滑的次时代游戏体验。

  PS:做个补充,GPU介入游戏中更多CPU做的事情,并不全是优势,也有可能是劣势。比如在我的配置上,4K运行贪婪之秋,不开GPU加速有40帧,开GPU加速会变成20帧,CPU负载会从60%-90%降为30%左右,这就非常尴尬,属于忙的忙死,闲的闲死,此时就要关闭GPU加速,让CPU担当起责任来。当然我相信3080之后,这个问题不复存在。

  所以2004的GPU加速算是一个手动调控GPU和CPU负载的开关,如果你觉得游戏出现了CPU内存瓶颈式的卡顿,则可开GPU加速,当你发现GPU无法满足30帧左右的最低帧数,已经在100%负载下依旧只能维持20左右甚至更低,则关闭GPU加速。

  另外还有一点,GPU接管CPU需要测试,有的游戏接管的不好,反过来会影响GPU负载,也就是GPU要拉一部分负载不定期去做CPU的事情,结果导致GPU波动,这样就悲剧了。

  我现在测试,有了GPU加速之后,仁王、还有类暗黑类游戏,提升很明显,他非常适应那种以前能到个50-60帧,但还是觉得不够流畅的游戏,但在以前能到30-40帧左右的游戏,CPU要满负荷的,比如奥德赛,贪婪之秋,这种开GPU加速要小心,搞不好就弄成了20帧。地平线是个特例。

  PPS:最新的30系发布后老黄第二个显卡驱动发布之后,我觉得GPU加速获得了进一步的优化和提升。我PS中补充的内容可以忽略不计了。现在基本可以无脑开GPU加速,实测他的1%low平均帧比不开高了5帧左右,这可是在4K下我贴死30-60不等的帧数下,1%low提高5帧对流畅度可谓是质的飞跃。

  不是我想吹,是这个GPU加速后续的补丁让我觉得2060线K的能力。最近B站那个UP主阿狸不是出了一期系统优化游戏特效的视频吗,讲得很好,体积系、阴影系、反射系适当降低,其他全最高,4K,开GPU加速,然后垂直同步30帧,奥德赛在内的的市面顶级3A,基本都可以稳定流畅,而战地1,坦克世界,更可以稍微降一点特效4K70帧之后,保1%low不低于60,U3219Q上运行,丝般顺滑。给你们一个参考。

  本来我3080买不到还有点愁,最近看这几波优化下来,3080或者后续什么TI,S之类的可以直接飙着明天618去了。

  显卡也是总线pcie 上的图形适配器,需要相应的的硬件厂商的驱动,也需要系统核心对其更好的调用方式。

  有可能是更直接的使用了硬件设备,对显卡驱动的稳定性要求更高,不然会看到熟悉的蓝屏......

  问就是还没把更新发给我,就那个准备好更新的页面显示了大半年了。3月又3月,3月又3月,还不更新,都快一年了老大!

  在笔记本上用shotcut导出2K视频,选择硬件编码的线G)会爆满,没过几分钟核显就会罢工(黑屏)从而导出失败,一段时间要么限制视频长度,要么选择软件编码。

  开了硬件加速后选择硬件编码,同样导出2K视频,内存占用只有1-2G,同时也能享受到硬件编码的快速。

  但仍旧建议使用傲腾内存、傲腾增强型SSD的等会再升级,我的快速存储技术兼容问题已经消失,傲腾不知道还有没有。

  你看看GPU上面有多少个核,再看看CPU上面有多少核,就理解了。虽然在性能方面,GPU一个核不如CPU一个核,功能上也差很多,但是架不住人家多呀!蚂蚁也是能吃掉大象的,不是吗?

本文由:IM体育提供

Copyright © 2015-2023 上海im体育 版权所有 ICP备05013835号 网站地图

数字式振动传感器生产厂家,数字加速度传感器公司价格,高精度数据采集仪工作原理,静态应变仪参数哪家好