ampere架构和rdna2架构显存延迟测试infinitycache显示优势 -pa真人国际官网

www.cojumper.com

经过了多年的发展,gpu也具备了多层缓存的结构。这些精心设计的缓存架构,可以填补显存和计算单元之间读写速度不匹配的矛盾,与cpu的缓存有类似的作用。

由于gpu架构的不同,不同芯片设计厂商对其缓存的设计也不一样。在ampere架构上,英伟达仍然坚持使用相对传统的l1和l2缓存两级结构。amd在rdna2架构上,则采用了l、l1、l2和infinitycache,事实上infinitycache是充当了l3缓存的角色。近期chipsandcheese发布了一项新研究,比较了英伟达与amd最新显卡的显存延迟情况。

chipsandcheese采用了opencl编写的指针追踪基准,用于评估gpu显存缓存中的延迟。在测试里,使用的是radeonrx68xt和geforcertx39显卡。测试结果表明,rdna2架构比ampere架构具有更低的显存延迟。

在测试中,英伟达ga12的l1和l2缓存之间的延迟超过了1ns,而amdnavi21的l至l2缓存之间的延迟为66ns,加上infinitycache仅增加了2ns的额外延迟。这可能可以解释为什么rdna2架构在较低分辨率的时候会有更出色的性能表现,而ampere架构需要更多并行运算才能有更好的发挥。

无论英伟达还是amd,都注意到了大型高效缓存的重要性。英伟达ga1(ampere)的l2缓存已经增加到了4mb,是gv1(volta)的七倍。amd则率先使用了高带宽的设计,类似的结构也有用于cdna架构的instinct系列,在radeonrx系列中(rdna)为游戏开发了infinitycache。

chipsandcheese还比较了英伟达和amd较老的一些架构,总体而言都在不断改善。不过amd每一代架构都随有一定程度的降低,相对来说更明显。

上一篇: ampere与意法半导体合作开发powerbox 下一篇: amphiman3000丨纵目科技确认申报2025金辑奖·中国汽车新供应链百强
返回顶部
网站地图