ARM AMRv9指令集一文读懂:IPC性能大涨30%!

3月31日凌晨,Arm公司正式推出了全新一代的ARMv9指令集,官方称之为10年来最重要的创新,将是未来3000亿Arm芯片的基础。

包括目前性能最强的Cortex-X1/A78内核在内,现在绝大多数Arm芯片都是基于ARMv8.x指令集的,该指令集于2011年首次推出,主要特点是增加了64位指令集支持。

过去10年计算架构有了太多变化,Arm处理器也不止是移动/嵌入式专用了,已经扩展到了PC、HPC高性能计算、深度学习等等新市场。因此,Arm推出了全新升级的ARMv9指令集。

据介绍,ARMv9在兼容ARMv8的基础上,提升了安全性、增强了矢量计算、机器学习及数字信号处理,同时继续提升处理器性能。

首先来说说性能上的变化,以智能手机等移动平台使用的Cortex-X/A系列为例,X1/A78这一代的性能相比16nm A72提升2.5倍,而下一代的基于ARMv9指令集的Matterhorn和Makalu架构都会保持30%以上的IPC性能提升。需要指出的是,这个IPC性能的提升与频率无关,如果再考虑到未来工艺带来的频率增加,那么CPU性能有望提升40%以上。

除了CPU性能,ARMv9还非常重视整体的性能提升,包括降低内存延迟(从150ns降至90ns)、频率提升(从2.6GHz到3.3GHz)内存带宽(从20GB/s到60GB/s)、缓存等。

ARMv9这次与性能有关的一个重要升级是SVE2指令集,SVE最早是Arm与富士通合作的浮点性能扩展,日本最强也是TOP500最强超算富岳就使用了SVE指令集,现在推出的是第二代SVE浮点指令了。

相比SVE的128位矢量,SVE2可以支持多倍128位运算,最多2048位,因此SVE2可以增强ML机器学习、DSP信号处理能力,提升了未来5G、虚拟现实、增强现实以及CPU本地运行ML的性能,同时ARM未来还会继续提升AI人工智能性能。

除了CPU之外,这次还简单提到了未来的Mali GPU,Arm会增加更多高级功能,比如VRS可变帧率渲染、RT光线追踪及其他高级渲染技术等。

在ARMv9中,最重要的一项挑战其实是数据安全,这一次Arm推出了全新的CCA机密计算体系架构,基于之前的TrustZone安全技术,但引入了动态域技术,它对操作系统及管理程序来说是完全不透明的,不会被系统或者软件提权攻击,而且依然可以接受管理及调度。

总之,Arm今天公布的ARMv9指令集极具创新,是未来10年3000多亿Arm芯片的基础,不过现在具体的细节还很少,只是一个初步介绍,预计今年夏天还会公布更多详细内容。

至于ARMv9处理器的商业化,预计会在2022年早些时候进入市场。

另外值得一提的是,由于华为此前被美国列入实体清单,导致了Arm曾一度断供华为。虽然华为早已购买了ARMv8指令集授权,可以基于该指令集开发自己的内核,但是可能无法使用Arm在华为被列入实体清单之后所推出的Coretex-A78、X1等内核,所以我们也可以看到,目前华为麒麟处理器当中所用到的最先进的内核还是只是基于ARMv8指令集的Coretex-A77。

那么Arm最新推出的ARMv9指令集,以及后续基于该指令集的CPU内核,华为能否获得授权使用呢?

2019年9月,Arm全球负责芯片授权的IP产品事业群总裁热内·哈斯(Rene Haas)曾对外表示,华为和海思是Arm的长期合作伙伴,后续的芯片架构都可以授权给华为海思。哈斯表示,在2019年5月美国政府将华为列入实体清单后,Arm对公司产品进行了厘清,目前有了一个明确结论,即无论是目前的ARMv8架构,还是后续新的芯片架构,都是基于英国技术开发,不会受美国出口管制影响,可以授权给华为海思。

如此看来,华为后续能够继续获得ARMv9指令集以及Arm基于该指令集的CPU内核授权,但是,现在的问题是,华为的芯片制造已经被美国限制。

编辑:芯智讯-林子

本文文字及图片出自 微信公众号

你也许感兴趣的:

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注