Banner
微软告诉你硬件加速GPU调度功能如何实现
- 2021-07-06 23:22 -

  微软此前在 Windows 2020 年 5 月更新中引入了硬件加速 GPU 调度功能,但到上个月为止,微软并没有给出关于它的实际作用及任何相关性的解释。因此,微软官方昨日发布了一篇相关博客来介绍该功能,笔者将结合实际简单为大家讲解一下这其中诸多事项。

  微软在 Windows 显示驱动程序(WDDM) 以及 Windows 中引入 GPU 调度已有将近 14 年的时间。随着当下越来越多的软件开始通过利用 GPU 来渲染实现更精美的 UI 和动画,微软发现自己需要更好地确定哪一类程序的 GPU 工作优先级更高,以确保不影响用户日常或游戏体验。于是,WDDM 硬件加速 GPU 调度程序从此诞生了。

  此前 WDDM 的主要调度方式是帧缓冲:当某个软件在第 N 帧执行 GPU 工作时,会让 CPU 提前为第 N+1 帧准备 GPU 命令,籍此保证良好的 CPU-GPU 并行执行能力。但从结果来看,在 CPU 和 GPU 之间帧缓冲虽可明显降低负载,但其副作用也同样明显,其从根本上导致了一定的帧延迟,尤其是 CPU 或者 GPU 达到负载上限时。

  最新版的硬件加速 GPU 调度功能则是通过借助合适的硬件和驱动程序,将大部分 GPU 调度负载从 CPU 转移到专用的 GPU 调度处理器上,于是便实现了缓冲加速并降低输入延迟。

  通过开启硬件 GPU 调度功能,CPU 将分批执行多个帧指令。这种设计在高端平台(i9-10900k+RTX2080Ti)的表现并不明显。因为对 i9 此类硬件来说,调度 GPU 帧缓冲的需求谈不上是何等的艰巨。然而并不是每个人都拥有这种测试平台,相信该功能在低端 CPU 平台运行游戏等方面会拥有更显著的提升。

  在最新版 Windows 中,如果显卡支持的话,用户可通过设置页面(设置 ->

  系统 ->

  显示 ->

  图形设置)选择开启。除 WDDMv2.7 和显卡驱动(AMD 肾上腺素 20.5.1 Beta、英特尔 27.20.100.7859 及其后版本、英伟达 450.12 及其后版本)外,用户还需要拥有支持该功能的硬件设备才能完美使用该功能。

  新的 GPU 调度功能对驱动程序来说是一个根本性的改变,类似于重建房子(图形驱动)的地基(底层代码)。于是为了确保这之间平稳过渡,微软要求相关驱动程序在通过大量相关测试后才能正式发布。故硬件加速 GPU 调度的优点(个人认为可突显高端显卡 + 中低端 CPU组合的优势)可能还需要几个月甚至几年才能完全体现出来。

  值得一提的是,目前该功能似乎还处于试验阶段。IT之家了解到,微软将通过实验平台和遥测系统对用户进行监测,从而有效地运行 A/B 实验(将开启硬件加速 GPU 调度功能的系统与运行旧 GPU 调度器的系统进行比较),同时鼓励 OEM 厂商默认开启硬件加速 GPU 调度功能来配置和验证该系统。

  开启该功能后,从外观看起来或许并没有什么不同,用户或许也很难注意到这种变化,但新的 GPU 调度功能可切切实实地帮助用户在无形之中降低 GPU 等的硬件损耗。

  按照惯例,高通会在今年年底发布骁龙895处理器,这将是2022年安卓旗舰阵营的标配。另一方面,高通的老对手三星有望会在今年下半年带来下一代Exynos处理器,最新消息表明三星新一代Exynos处理器会集成AMD GPU。7月4日消息,博主@i冰宇宙爆料,搭载AMD RND2架构的三星Exynos旗舰芯片今年有可能就会上市。在今年早些时候,三星宣布将推出配备AMD图形处理器的下一代旗舰芯片Exynos。三星在一场活动中表示,即将推出的三星Exynos旗舰处理器中的GPU将基于AMD最新的RDNA2架构打造,这标志着新GPU首次登陆移动平台。值得注意的是,它将带来光线

  在GPU领域,AMD及NVIDIA的领先优势是其他公司无法比的,尤其是高性能显卡领域。国产GPU这两年也在快速追赶,景嘉微最新的JM9系列此前被认为可追上GTX 1080 Ti显卡,让人眼前一亮。在最新的沟通交流会上,景嘉微公司也回应了一些热点话题,有人询问了景嘉微最新的GPU进展情况,IM体育是否可以追赶GTX 1080 Ti显卡。对此,景嘉微方面表示,新产品还没有流片回来,性能要等流片回来,才能比较,希望在3季度能出来。景嘉微早前提到,今年的JM9系列GPU,希望能达到2017年底2018年初的水平。根据官方所列规格,JM9231的性能可达到2016年中低端产品水平,而JM9271核心频率不低于

  追上GTX 1080 Ti?景嘉微:等流片回来才能比 /

  (可变分辨率渲染)起到了关键作用。今年,Snapdragon Elite Gaming首次将可变分辨率渲染(VRS)功能移植到移动游戏领域。在这之前,可变分辨率渲染技术仅可在高端PC和专业游戏机上实现。在渲染每一帧画面时,GPU会对每个像素执行一个着色程序以计算其颜色。一个典型的3A游戏中有360万个像素在显示器上进行着色。可变分辨率渲染允许开发人员指定着色器程序以2个或4个像素为一组仅运行一次,然后将这些颜色结果重复使用于周围像素的着色。这意味着开发者可以仅使用140万像素对整个帧画面进行着色。这将会使整体着色的总像素数减少40%,从而大大减少了GPU的工作负载,节省能耗,让性能

  为了应对这项有史以来最大的计算挑战之一,特斯拉需要配备前所未有的算力。在本周的CVPR(国际计算机视觉与模式识别会议)上,汽车制造商特斯拉的AI高级总监Andrej Karpathy公布了公司内部用于训练Autopilot与自动驾驶深度神经网络的超级计算机。这个集群使用了720个节点的8个NVIDIA A100 Tensor Core GPU(共5760个GPU),实现了1.8 exaflops级别的超强性能。Karpathy表示:“这是一台性能卓越的超级计算机,以FLOPS计,它大概可以在全球超级计算机中排到第5位”。通过将汽车行业前所未有的算力水平作为其研发周期的核心,特斯拉

  顶尖自动驾驶汽车训练超级计算机 /

  三星宣布与AMD在移动GPU领域建立合作关系已经两年了,但我们还没有看到双方带来的第一款产品。三星一度被认为将在本月宣布推出合作的GPU,但这种情况发生了改变。今年年初,三星透露其下一款旗舰产品Exynos芯片将配备AMD GPU。爆料者Ice Universe在当时的一条推文中透露,GPU将于今年发布,甚至可能出现在Galaxy Z Fold3中。快进到2月份,爆料透露,联合开发的GPU将在6月份发布,主处理器定于晚些时候发布。现在,来自爆料者的最新消息称,发布现在已经推迟到7月份。上个月,三星在Computex上提到,该GPU将基于RDNA2架构,这与PlayStation5和Xbox Series S和Series X游戏机

  中国不断打击加密货币矿场的努力已经开始产生连锁反应。正如《南华早报》今天报道的那样,过去几周,中国大陆的显卡价格大幅下降。根据《南华早报》的提示,我们分析了各种 Ampere 显卡的历史定价。您可以在下面的细分中看到定价趋势,但明确的结论是,自从北京开始关闭全国大型矿场后,GPU定价已经下降了 45%。除了是一些最好的游戏显卡之外,Nvidia 的 GeForce RTX 30 系列(安培)卡在加密货币挖掘方面也非常受欢迎。我们不可能查看每个 Ampere 型号的定价,因此我们从每一层随机挑选定制型号来大致了解定价行为。价格战非常激烈,因此同一显卡型号在不同零售商处的价格差异很大。但是,显卡制造商通常在主要在线零售商处拥有

  价格大跌 /

  Microchip有奖问答 新品 MCU 独立于内核的外设(CIP)技术解密

  嵌入式操作系统开发相关总线与接口数据处理消费电子工业电子汽车电子其他技术存储技术综合资讯论坛电子百科词云:

本文由:IM体育提供

Copyright © 2015-2023 上海im体育 版权所有 ICP备05013835号 网站地图

数字式振动传感器生产厂家,数字加速度传感器公司价格,高精度数据采集仪工作原理,静态应变仪参数哪家好