ARM发布全新IP,机器学习性能飙升

2020-02-13来源: 雷锋网关键字:ARM  Cortex-M

ARM发布了两款全新的IP,一款是已经非常成功的ARM Cortex-M家族的新成员Cortex-M55,另一款是去年底新发布的Ethos系列的新产品,也是首款针对Cortex-M平台的微神经网络处理器(microNPU)——Ethos-U55。如果将这两个最新的IP结合,机器学习(ML)性能最高可以提高480倍。

 

www.66175.com_【官方首页】-真人百家乐两款新产品AI性能的大幅度提升,是ARM在AIoT市场竞争的强大武器。但是,也反映出了ARM在这一市场的焦虑。

 

AI性能最高提升480倍!ARM着急了?

 

强攻AIoT市场

 

从两款新产品说起,新增的Cortex-M55是ARM AI性能最强大的Cortex-M处理器。有多强大?与前几代的Cortex-M处理器相比,Cortex-M55的ML性能最高可提升15倍,DSP性能也可提升5倍,且具备更佳的能耗比。同时,Cortex-M55也是首款基于ARMv8.1-M架构、内建ARM Helium向量处理技术的处理器,大幅提升DSP与ML的性能还更省电。

 

另外,开发者还可以使用Cortex-M处理器的全新功能,也就是去年十月发布的ARM Custom Instructions (ARM自定义指令集),延伸处理器的能力,对特定工作负载进行优化。

 

www.66175.com_【官方首页】-真人百家乐也就是说,全新的Cortex-M55不仅AI性能更强,能耗比更佳,还有了更强的灵活性。

 

AI性能最高提升480倍!ARM着急了?

 

另外一款新品Ethos-U55的AI性能更加强大,是Cortex-M55的32倍,还有32-256个可配置的MAC。ARM推出这款专用的微神经处理器的目的是借助其高度的可配置性,加速空间受限的嵌入式与物联网设备的ML推理能力。

 

这还不够,如果将Cortex-M55与Ethos-U55搭配,结合后的产品ML性能最高可提升480倍。

 

AI性能最高提升480倍!ARM着急了?

 

www.66175.com_【官方首页】-真人百家乐当然,不要被480倍的巨大提升吓到,因为这个性能的提升是在一个比较低的ML性能的基础上实现的提升。www.66175.com_【官方首页】-真人百家乐用下面的图来直观解释AI性能提升后适用的场景。

 

AI性能最高提升480倍!ARM着急了?

 

Cortex-M55的AI性能可以应用在像异常检测和对象检测的应用中,Cortex-M55与Ethos-U55搭配则可以应用在对AI性能要求更高的手势检测、生物识别、语音识别的应用中,但两者搭配的AI性能又低于Cortex-A CPU、Mali GPU、Ethos-N NPU才能满足的对象分类、实时识应用的需求。

 

这样,我们就能非常清晰的了解Cortex-M55以及Ethos-U55的意义。

 

www.66175.com_【官方首页】-真人百家乐Cortex-M是业界非常成功的微控制器处理器,基于Cortex-M的芯片全球已经出货超过500亿片,广泛应用于各种各样的嵌入式设备当中。但是Cortex-M只能够满足振动检测、传感融合、关键字检测这些简单的AI功能,随着万物皆AI时代的到来,需要Cortex-M、Ethos-U55以及两者的组合的性能去满足更多AIoT应用的需求。

 

也就是说,已有的Cortex-M、Cortex-M55、Ethos-U55以及Cortex-M所有产品与Ethos-U55的组合更全面的AI性能,提升了ARM在终端AI上的吸引力,再加上Cortex-M的ARM Custom Instructions的新功能,能够更好地满足市场规模庞大但碎片化的AIoT市场。

 

ARM在AIoT市场的内外焦虑

 

www.66175.com_【官方首页】-真人百家乐从Cortex-M 到Ethos-N,ARM本应该为其拥有的AI产品感到自信,但市场的竞争似乎并不容许ARM为此满足。实际上,ARM在2018年2月公布了Project Trillium 的机器学习计划,并且预计在2019年第一季度发布首款ML处理器。但ARM直到2019年5月份才发布首款ML处理器,10月份才公布ML系列产品的名称Ethos。

 

ARM ML事业群商业与营销副总裁Dennis Laudick去年接受雷锋网专访时对于产品发布有所延迟这样解释,发布推迟有很多原因,产品开发是主要的问题。ML处理器开发的过程中面临很多挑战,其中一个很大的挑战就是数据移动处理不好就会消耗大量的电,另一个大的挑战就是如何权衡效率和灵活性。

 

在ARM发布首款ML处理器时,苹果、三星、华为集成在其SoC中的NPU已经更新了几代,高通和联发科的神经网络处理器也日趋成熟。也因此,业界不少人都认为ARM错过了进入手机NPU市场的好时机。www.66175.com_【官方首页】-真人百家乐这自然也会让ARM的AI产品更加看重具有广阔前景的AIoT市场。

 

全球第二大市场研究机构MarketsandMarkets去年发布的预测报告显示,2019年全球AIoT市场规模为51亿美元,到2024年,这一数字将增长至162亿美元,复合年增长率为26%。

 

虽然ARM凭借Cortex-M系列处理器在嵌入式设备市场非常成功,但是到了AIoT时代,ARM迎来了一个强劲的对手——RISC-V。www.66175.com_【官方首页】-真人百家乐RISC-V指令集与ARM指令集同属精简指令集,都具有高性能低功耗的特点,不过RISC-V诞生之处就选择了开源,而ARM采用的是授权模式。

 

AI性能最高提升480倍!ARM着急了?

 

RISC-V的开源,可以让开发者实现更加灵活的设计,更容易满足AIoT市场多样化的需求,这也是让ARM感到紧张的关键因素。去年10月,ARM也推出了ARM自定义指令集,以应对RISC-V带来的竞争。

 

并且,RISC-V正在日益壮大,面向AIoT市场的产品也正在陆续推出。GreenWaves Technologies率先推出了基于RISC-V的IoT超低功耗处理器,能效上可以实现20倍优于市场现有100mW以下同类产品。2019年12月推出的新一代产品性能提高10倍,功耗降低5倍。

 

RISC-V重要的IP提供商晶心科技总经理林志明去年接受雷锋网采访时也表示,再花半年推动量产、上市以及软硬件的整合,2019年下半年和2020年年初开始RISC-V的产品就会比较多的投入市场。

 

今年年初,SiFive和CEVA宣布合作,以SiFive的RISC-V CPU,CEVA的DSP内核,AI处理器和软件为中心,实现针对批量最终市场的超低功耗领域特定Edge AI处理器的设计和创建。

 

因此,由多种因素导致的ARM ML产品发布的延迟,以及RISC-V阵营的日益强大,ARM在AI以及AIoT时代难免会有些焦虑,480倍的AI性能提升是缓解这种焦虑的一个关键。

 

生态优势能否延续?

 

当被问及去年5月才推出首款出Ethos还有竞争力吗?Dennis称,ARM的成功一直以来都得益于生态系统,对于NPU来说挑战并不是能够做出自己的NPU,而是NPU在市场上是不是真的好用。我们已经听到合作伙伴反馈说,希望在硬件上能够标准化,他们不想支持15种不同的硬件,所以,他们期待有一个标准化的软件平台能够支持。

 

从构建ARM的AI竞争力而言,即便产品推出有些推迟,但ARM多年来构建的强大生态依旧有助于其NPU的成功。并且,ARM也在致力于打造一致的体验,Cortex-M 软件开发工具完整支持最新发布的Cortex-M55与 Ethos-U55。另外,ARM还与其他开发工具厂商兼容,并且在算法、软件与 OS 方面也获得了伙伴的支持。

 

AI性能最高提升480倍!ARM着急了?

 

更好的软硬件融合以及一致性的开发流程确实是一个AI生态的吸引力所在,也是ARM能够获得更多AIoT市场份额的关键。

 

但对于AIoT的很多应用或许并非如此,GreenWaves Technologies CEO Loic Lietar此前对雷锋网(公众号:雷锋网)表示:“相比手机、PC以及一些高性能处理器,应用于传感设备的微控制器对生态的依赖性没有那么高。从GreenWaves的角度看,我们基于RISC-V的32位微控制器面向的主要是来自物联网等终端市场的边缘计算需求,一个设备将长时间重复运行几个应用, 而并不会像手机或电脑一样安装和卸载不同的应用程序,因此对软件兼容性的依赖程度并不是个问题。”

 

这意味着,ARM强大的生态在AI以及AIoT时代依旧会继续发挥作用,但对于AIoT市场而言,这种生态的吸引力到底有多大,现在还不清楚。

 

当然,毋庸置疑的是,ARM作为一家非常成功的半导体公司,其有强大产品以及丰富的经验,在AIoT这个新的市场,ARM也有强大的竞争力。只是,AIoT市场短期内难以产生巨头,某一种处理器也难以在短期内垄断市场,谁是最终的赢家没有人能准确预测。

 

关键字:ARM  Cortex-M 编辑:muyan 引用地址:http://news.estoresdeals.com/qrs/ic488111.html 本网站转载的所有的文章、图片、音频视频文件等资料的版权归版权所有人所有,本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如果本网所选内容的文章作者及编辑认为其作品不宜公开自由传播,或不应无偿使用,请及时通过电子邮件或电话通知我们,以迅速采取适当措施,避免给双方造成不必要的经济损失。

上一篇:谷歌在开发全新操作系统Pigweed曝光
下一篇:最后一页

关注eeworld公众号 快捷获取更多信息
关注eeworld公众号
快捷获取更多信息
关注eeworld服务号 享受更多官方福利
关注eeworld服务号
享受更多官方福利

推荐阅读

海思ARM平台交叉编译zeroMQ
在使用海思的项目中要使用到ZeroMQ这个消息队列框架,之前在PC端使用感觉不错。所以通过要通过交叉编译,将其移植到ARM平台。移植方法,可以参考 http://blog.csdn.net/sishuihuahua/article/details/77203094  以下是我使用海思交叉编译工具的方法:一、配置编译器./configure --host=arm-himix100-linux --prefix=/opt/hisi-linux/zeromq-4.1.6/arm-zeromq  --without-libsodiumarm-himix100-linux   --host
发表于 2020-02-08
ARM常用汇编指令列表
发表于 2020-02-07
ARM常用汇编指令列表
ARM 处理器寻址方式之间接寻址的几种表达
我们以 LDR 指令为例来分别举例分析。LDR 指令的格式为:LDR{条件} 目的寄存器,<存储器地址>LDR 指令是字加载指令,用于从存储器中将一个 32 位的字数据送到目的寄存器中。该指令通常用于从存储器中读取 32 位的字数据到通用寄存器,然后对数据进行处理。当程序计数器 PC 作为目的寄存器时,指令从存储器中读取的字数据被当作目的地址,从而可以实现程序流程的跳转。指令示例:LDR R3, [R4]             ; 将存储器地址为 R4 的字数据读入寄存器 R3LDR R3, [R1, #8]     
发表于 2020-02-07
ARM 汇编指令 DCD
简介DCD:数据定义( Data Definition )伪指令一般用于为特定的数据分配存储单元,同时可完成已分配存储单元的初始化。语法格式:标号 DCD(或 DCDU) 表达式DCD(或 DCDU)伪指令用于分配一片连续的字存储单元并用指定的表达式初始化。其中表达式可以为程序标号或数字表达式。 DCD 也可用 “ &” 代替。用 DCD 分配的字存储单元是字对齐的,而用 DCDU 分配的字存储单元并不严格字对齐。实例(STM32 启动文件):__Vectors       DCD     __initial_sp     
发表于 2020-02-07
ARM 汇编指令 ADR 与 LDR 使用
简介这两个都是伪指令:ADR 是小范围的地址读取伪指令,LDR 是大范围的读取地址伪指令。可实际使用的区别是: ADR 是将基于 PC 相对偏移的地址值或基于寄存器相对地址值读取的伪指令,而 LDR 用于加载 32 位立即数或一个地址到指定的寄存器中。以下面的汇编代码为例:.global _start_start:    ldr r0, loop    adr r0, loop    ldr r0, =looploop:    nop用以下命令完成汇编、链接操作,并输出反汇编文件[root@localhost asm]# arm
发表于 2020-02-07
arm架构64位(AArch64)汇编优化总结
1、参考http://blog.csdn.net/SoaringLee_fighting/article/details/81906495http://blog.csdn.net/SoaringLee_fighting/article/details/82155608http://blog.csdn.net/u011514906/article/details/38142177http://blog.csdn.net/listener51/article/details/825304642、前言本文是arm架构64位(AArch64执行状态) neon优化的总结文档,主要包括arm架构64位优化的基础知识,特殊用法,打印
发表于 2020-02-07
arm架构64位(AArch64)汇编优化总结
小广播
何立民专栏 单片机及嵌入式宝典

北京航空航天大学教授,20余年来致力于单片机与嵌入式系统推广工作。

电子工程世界版权所有 京ICP证060456号 京ICP备10001474号 电信业务审批[2006]字第258号函 京公海网安备110108001534 Copyright © 2005-2020 estoresdeals.com, Inc. All rights reserved

页面底部区域 foot.htm