终端(duān)、软硬一体、异构计算、深度学习(xí)、神(shén)经网络,它们将成为(wéi)自 2020 年起,众 AI 芯(xīn)片企业制胜未(wèi)来第四次(cì)工业革命的(de)起点和(hé)未(wèi)来法宝。如何改变碎片化的终端(duān),如何通过软硬(yìng)件结合(hé)来提升(shēng)算力,如何使用深度(dù)学习来(lái)更好地服(fú)务未来场景(jǐng),这几(jǐ)个问题成(chéng)为(wéi)了大名(míng)湖畔(pàn)一群行(háng)家里手思考(kǎo)的关键。我们来看看他们思考(kǎo)后作出(chū)了怎(zěn)样的回答(dá)。
撰文 | 晏清(qīng)
2000 年起(qǐ),弱(ruò)人工智能站了起(qǐ)来,跑(pǎo)向下一个阶段2040 年强人工智能。
20 年(nián)后,以(yǐ)人工智能为(wéi)驱(qū)动(dòng)力,由(yóu)「自动化」转变(biàn)为「智能化」的第四次工业革(gé)命。
而(ér)这一切都(dōu)离不开人工智能(néng)三(sān)要素:算力、算法、深度学习的(de)进(jìn)步。
1 第(dì)四(sì)工(gōng)业革命到来,算力先行
基于算力,在面对(duì)现如今(jīn)碎片(piàn)化(huà)的发展(zhǎn),AI 芯片厂商们无疑都知道该采取(qǔ)点不一样(yàng)的措施了:
Arm 中国:「在有限(xiàn)的运力(lì)上,让所有平台(tái)都可以发挥出来的(de)一套软件(jiàn)」
有(yǒu)两个问(wèn)题十分(fèn)关键效能或诉求不(bú)同带来的三(sān)端分裂,和终端的碎(suì)片化
根据以上两点,Arm 中国产品研发副(fù)总裁刘澍认为,由(yóu)不(bú)同的(de)诉求,导致的相互间被割裂的云端、终端,以及中间的(de)区域性服(fú)务本就是在一根链条上,尽管(guǎn)这(zhè)种「碎片化」在终端上体现尤甚。
Arm 中国产(chǎn)品研(yán)发副总裁刘(liú)澍分享关于智能未来的思考(kǎo)
当算(suàn)力平台(tái)在云(yún)端和终端分布不同时,就会带来对形态(tài)的思考,「不同的运算需求,怎么在算力模块上提(tí)供不同的形态呢(ne)?」刘澍在演讲的过程中既是向在座的观众发问,也是 Arm 中国对自(zì)己的算力支撑发(fā)问。是像过去(qù)一样让(ràng)云端和终端完(wán)全分离,还(hái)是(shì)通(tōng)过(guò)何种方式融合、互补?
针对以上问(wèn)题,Arm 中国认为,「从(cóng)算法和软件角度(dù)来(lái)说,任(rèn)何一个(gè)设备都可以帮助我们链接到整个(gè)人工智能的链条上,都能够进(jìn)行数据处(chù)理,并且都能够进(jìn)行(háng)兼容式的(de)网络数据处理(lǐ),这个(gè)是(shì)我们看(kàn)到的一个非常(cháng)重要(yào)的发(fā)展思路(lù)。」
硬件和软件的结合必(bì)定未来计算发展的必由(yóu)之路。因此,在上游,放弃过去的云端发展思维(wéi),接(jiē)受异构技术(shù)形态成为 AI 加速器主(zhǔ)流的现状,放(fàng)弃一味地追(zhuī)求通用计(jì)算,才能更好地帮助通用方法降落在终端。
在(zài)通用计算(suàn)和(hé)专(zhuān)用计算按一(yī)定比(bǐ)例(lì)共存的明天(tiān),希望有(yǒu)一种软件架构可以把 CPU、GPU,乃至于 TPU、NPU 等几部分统一起来,用统一的软件编程行为将碎(suì)片化的(de)市场(chǎng)黏合,将(jiāng)为整个业(yè)界的云端互通提供很(hěn)好的业界迁移(yí)效果。
Arm 中国愿意做的,就是在计(jì)较成本的前提下,为市场(chǎng)尽可能开放选(xuǎn)择:针对自(zì)己的需求,让大家根据场景来选择合(hé)适的计算平台(tái)模块。
他们提出了一个具(jù)体的产品概念,也就是(shì)周易:智能计算机平台。把(bǎ)绝大部分(fèn)系统都会(huì)选择的 CPU、GPU、NPU、VPU 都集(jí)合在一起,当软件把算法、网(wǎng)络(luò)分配(pèi)在这(zhè)些不(bú)同的(de)算力的模块(kuài)上,实现效能的提升。
全志:如何在 SoC 中解决内(nèi)部交互问题是关(guān)键
异(yì)构计(jì)算(suàn)成为人工智能的形态(tài)主流,是业界达成的共识。全志认为,处在一个 SoC 中,全部计(jì)算单元(yuán)共(gòng)享一个系(xì)统全部资(zī)源(yuán)的形式,即 AP SoC,是(shì)他们纵观以前行业的发展,发掘出的最理(lǐ)想的载体。
作为 SoC 厂商(shāng),要在适(shì)应(yīng)未来长期存在(zài)的接口(kǒu)池(Interface Repository,IR)撕裂的现状,同时计划(huá)在未(wèi)来,将注意力集中在终端(duān),在 SoC 中集中(zhōng)解决内部交互问题,实现系统内互联的效果(guǒ)。例如研究内部数据转化(huà)的机制,运用 SoC 抽象层预测并调配(pèi) OP 及内存交(jiāo)互单元,屏蔽底层(céng)硬件的差异,使开发者更加专(zhuān)注(zhù)于模(mó)型的开发。通过这样的方式(shì)合理(lǐ)调配不同计算单元的算度并配合起来,成为当(dāng)下的(de)高效应用。
耐能:终端 AI 网(wǎng)络去中心化,达到(dào)算(suàn)力(lì)共(gòng)享。
致力于(yú)在终端推理芯片市场(chǎng),以(yǐ)客(kè)户为中心,生产高性能、低成本(běn)芯片产品的耐(nài)能(néng)认为:建立终端网络,首(shǒu)先要做的是「去中心化」,来达到算(suàn)力共享。
数(shù)十(shí)亿传感器的(de)数据传输,会(huì)为云(yún)端带来(lái)运算(suàn)处理(lǐ)压力。同时,实时(shí)识别、宽(kuān)带传输压力,隐私安全等问题亟(jí)待(dài)被解决。这时最需要的就是终(zhōng)端,而可(kě)重构性(xìng)成为终端网络的关键。耐能将(jiāng)通过(guò)极高的 MAC 利用率实现尺寸与功耗的最小化。
知存:存(cún)算一体(tǐ)方案(àn)为 AI 芯片打破数据搬运带(dài)来的(de)运算瓶颈。
将(jiāng)存储(chǔ)和(hé)计算结合(hé)在(zài)一起,是知存对由数据搬运导致的运算瓶颈(jǐng)做出的最直(zhí)接的技术选择。
作为(wéi)国内最早接触存(cún)算一体技(jì)术的团队(duì),他们打破常(cháng)规计算架构,采用新(xīn)的方式(shì):直接用(yòng) ROM 单元,把需要(yào)的神经网络、所有的(de)参数都存储在 RAM 单元当中,只需把被处理的语音(yīn)结构存储到神经网络当中,最终输出。效率(lǜ)将由此大幅提(tí)高,并且可以(yǐ)降低(dī)整(zhěng)个(gè)系统的成本。
未来他们还(hái)会针对(duì)存(cún)算一体带来的特定(dìng)摩尔定律进行开(kāi)发,争取在(zài) 28nm 芯片(piàn)上达成存(cún)算一体(tǐ)技(jì)术。
而针对算法,知(zhī)存、旷视、科(kē)大讯(xùn)飞、引力互联分(fèn)别发表了不同的见解:
知(zhī)存(cún)和旷视同时提(tí)到了一个词(cí)「降噪」。
知存的算(suàn)法(fǎ)还在合作开发中。针对语音识别业务,他们已经看到市(shì)场在选择采用深(shēn)度学(xué)习算法制作「噪音抑(yì)制剂」,而降噪识别是算法的一个重点,对算力有(yǒu)非常高(gāo)的要求。目前,只有手机的电池设备才(cái)可以(yǐ)采用这样的算法。
旷(kuàng)视展示神经网络降噪视(shì)觉(jiào)效果
旷视自 2017 年进入手机市场后,顺(shùn)应 5G 时代的到(dào)来,在今(jīn)年和 OPPO Reno 合作推出首发的夜视算法全球首款神经网络(luò)降(jiàng)噪。经(jīng)过(guò)在影像处理前,让图像(xiàng)数据进入神(shén)经网(wǎng)络进行降噪处理,然后再经过(guò)传统处理方(fāng)式,使(shǐ)图片获得更加「干净」和「平衡」的视(shì)觉效果。
旷视(shì)认定算法不(bú)可能独立运行,一定要跟硬件匹配。他(tā)们认为交互(hù)、运算和网络,会是今后人工智能三大落脚点。
科大讯飞(fēi)认(rèn)为(wéi)算法本身的改进是(shì)由深度神经网(wǎng)络开始,其次是大数据,而第三点就是(shì)芯片产商们的努力(lì),产品的迅速迭代(dài)促使算(suàn)力不断提升(shēng)。
引力互(hù)联看(kàn)好边(biān)缘计算市场(chǎng),边缘计算场景对实时性(xìng),对安全性(xìng)要求(qiú)低,甚(shèn)至不需要联网,需要更高效的边(biān)缘计算速度,这样的(de)场景的需要,也(yě)会刺(cì)激大量边缘计(jì)算芯片(piàn)的需求。
最后我们来看看(kàn)深度学习。
百度飞桨产品经(jīng)理(lǐ)赵乔向大家(jiā)分析深度学习平台是未来的选择
百度飞桨 PaddlePaddle 作为国内唯一(yī)一家(jiā)功能齐全的开(kāi)发平台,认为深度学习平台是智能时代选择的工(gōng)作系统。
以早期的 OCR 技术举例,深度学习将大量人工、手(shǒu)工的(de)费时(shí)特征处(chù)理操作,简(jiǎn)化为仅仅是检测和识别两(liǎng)个(gè)步骤。从技(jì)术和产业互联(lián)的角度,百(bǎi)度观察并意识到(dào),深度学习的优势在于随着数据量的线性增长,性(xìng)能也随之线(xiàn)性增长,因(yīn)此在大(dà)数(shù)据模型开(kāi)发当中,深度学习具有非常明显的优势。
深度学习框(kuàng)架开发的模型越来越(yuè)多,AI 产业(yè)的生态将以此为核心(xīn),将算法开(kāi)发者、平台使用(yòng)者和(hé)相关(guān)的伙伴一起(qǐ)包(bāo)裹进人工智能智能产业。开源自研的深度学习框架(jià) PaddlePaddle 是一套整(zhěng)体的(de)方案架构,采取的是端(duān)到端 AI 部署方案,提供(gòng)多端多平台服务(wù),例如 Paddle Lite 就是针对移动端和(hé)嵌入式(shì)终端同时提供服务(wù)的(de)推(tuī)理(lǐ)引擎,目前最新的 Paddle Lite 2.0 提供(gòng)更高(gāo)性(xìng)能的端侧推理能力(lì)。
2 让AI降落
如都教授所(suǒ)说,发(fā)迹阶段(duàn)的弱人工(gōng)智能主要在做一件事(shì),语音识别;而进(jìn)入强(qiáng)人工智能时(shí)代,下一(yī)步要集中发(fā)力的则是视觉(jiào)处理。
在这(zhè)两个(gè)垂直领域(yù),旷视与科大讯飞(fēi)这两个产业先导,也表达出他们对于芯片产业(yè)的(de)观察和思考:
旷视:
手(shǒu)机是(shì) AI 芯片出现最多的地方。自 2017 年起,两年内(nèi)旷视获得(dé)了(le)超(chāo)过(guò) 75% 的手机(jī)市(shì)场占有率。根据 5G,他们对手机芯片做出了如(rú)下(xià)预测:
1)手机(jī)中的传感芯(xīn)片将与屏幕相结合,相机也(yě)会在未来与屏(píng)幕结合;
2)本地的计算,人机的交互,输(shū)入与输出,不会(huì)随(suí)着终端产品的形式改变而发生改(gǎi)变。
他们能明显感觉到(dào),手机一线芯片正(zhèng)在加(jiā)速人工智(zhì)能化。从传(chuán)感端到摄像头,加之人工智(zhì)能化的(de)存储,手机现有的形态消失,转变成一(yī)种可穿戴(dài)的人机(jī)交互设备,也未尝(cháng)是难以想象的未来可能。
科大(dà)讯飞:
人工智能技(jì)术(shù)的载(zǎi)体就(jiù)是芯片。芯片分布在大大小小的物联网设备中,由物(wù)联网连(lián)接起来(lái),必产生强大的势(shì)能。
关于 AI 的(de)计(jì)算架构,他们(men)认(rèn)为同时存在实时、可靠、用(yòng)户隐私安全的三(sān)大挑战(zhàn)。他们认为,不论(lùn)是人(rén)脸识(shí)别、图像处理(lǐ),还是语音识别,本地端处(chù)理的(de)方(fāng)式会是(shì)更加实时、可靠、安全的选择,分布式混合框架在未来应该得到广(guǎng)泛应(yīng)用。因(yīn)此本地(dì) AI芯(xīn)片将要(yào)面对分布式(shì)混合框架的(de)高性(xìng)能、低功耗、可联网的三大要求,并努力做到软硬(yìng)件的深(shēn)度结(jié)合。
而除(chú)了语(yǔ)音识(shí)别、视觉处理这两个(gè)垂直(zhí)领域的应用(yòng)理解,现(xiàn)场更是分享了丰(fēng)富的,基于行业场景的 AI 落地案例(lì):
图片(piàn)来自于百度 PaddlePaddle 网络宣传视频
百(bǎi)度飞桨通过一个现场演示视频(pín),讲述了百度 PaddlePaddle 是如何帮(bāng)助广大开发者将 AI 技术落(luò)地于不(bú)同行业场景的(de):
国家电网的变电站工作人员,用代码制造出无人巡检机器人;
工(gōng)厂的设(shè)备工(gōng)程师,利用大(dà)数(shù)据模(mó)型,将噪音转变为探测机器健康的诊断工具(jù);
农业开发(fā)团队利用深度(dù)学习,为一个村子的农民提供(gòng)实时有(yǒu)效的生产指导建议;
工厂(chǎng)将配料方法和 30 多年的宝贵专业经验(yàn)转化为模型,指导未来的生产。
PaddlePaddle 用以上(shàng)几(jǐ)个(gè)实例(lì)证明了深(shēn)度学习平(píng)台可以切实(shí)服务于社会需要的方方(fāng)面(miàn)面,而(ér)这样子的(de)例子在(zài)未来(lái)也许还会更多。
谷歌全球(qiú)开(kāi)发专家(jiā)武强博士向(xiàng)我们展示智能交通控制(zhì)系统
谷歌智能(néng)交(jiāo)通控制,基于国内交通拥堵造成的(de) 2500 亿损失产生了思(sī)考,并用深度强化(huà)学习(xí)、边缘计(jì)算,以及多智能体,创造出一个尽可能没有交通资源浪费的社会前景(jǐng)。
通过将各(gè)个路口的红绿灯利用起(qǐ)来,互相形成(chéng)通(tōng)信(xìn)协议,创造出一个多智(zhì)能体;在多智能体与现实环境的交互中,不断通过(guò)奖励机制训(xùn)练,达到深度强化(huà)学习,利用深度(dù)强化(huà)学习算法对交通(tōng)流量进行预测分析,由此改变红绿的时长(zhǎng),使不够智能的交通信号(hào)机制也(yě)变得「智能」起(qǐ)来。而选择边(biān)缘计算而非云(yún)端,则(zé)会更加实(shí)时、高效,更有(yǒu)助(zhù)于缓解现实的交通压力。
谷歌让(ràng)我们设想(xiǎng),一辆争分夺秒的救护(hù)车,能够一路绿灯地畅(chàng)行在毫无拥(yōng)堵的马路上,我们期待这个(gè)场景到来的那天。
西井科技向在场观众展示「WellOcean」智慧(huì)港口
我们都知(zhī)道西井科(kē)技的产品核(hé)心是无人(rén)驾驶,但谁又能想到是驾驶在无人的智慧港口里呢(ne)?
人工智能引起的工业革命洋(yáng)流首先袭(xí)向港口。无(wú)人化作业是(shì)他们思考后(hòu)得出的第一个结论,于是(shì) WellOcean 作为智慧港口解决方案出现,使新的、智能化的(de)港口从人员的数量、种类(lèi)进行简(jiǎn)化,让曾今熙熙攘攘的码头变得安静有序。将原来超过 98% 需要人来(lái)完成(chéng)的作(zuò)业,用(yòng)远(yuǎn)程自动化智能工具替代(dài)完成(chéng),既降低了港口和(hé)客户的成本(běn),又提升效率,同时降低了安全事故发生的概(gài)率。如此科技(jì),西井去年发布的(de)首(shǒu)款全时(shí)无人驾驶重(chóng)卡 Q-truck 才能高精度无阻(zǔ)、畅快(kuài)地跑在无(wú)人的智慧码头上(shàng)。
另外,通(tōng)过技术提升(shēng)前(qián)线人员的工(gōng)作效率是(shì)他们的(de)新方向。只需要 14 个摄像头就可以完成(chéng)集装箱信(xìn)息、车辆信息采集,指导岸桥对准(zhǔn)作业箱上(shàng)船的全过(guò)程(chéng)。让 24 小时三班倒(dǎo),8 小时(shí)内(nèi)每 2 分钟就疲于盯梢(shāo)的工作(zuò)人员放松了紧绷的神经。基于时间(jiān)和人力的成本缩减达到(dào)以往成本的 80%,却帮助(zhù)客户(hù)提升了 3 倍的效率。
他们专注于将自(zì)己的技术与场景的结合,期待他(tā)们在未(wèi)来创造出更(gèng)多更(gèng)具体的价值。
3 让AI更(gèng)活(huó)跃
安创加速器副(fù)总裁英语霏为(wéi)大家分享产业生态建(jiàn)设(shè)心得
产(chǎn)业系统的良性发展离不开好的产业生态建设。
安创加速器成功孵(fū)化出(chū)估值 30 亿美元的 AI 独角兽企业(yè)「地平线(xiàn)」,也在此(cǐ)分享了他们作为世界嵌入式移动芯片领域(yù)主导者,以及(jí)作(zuò)为 AIOT 产(chǎn)业的创新创业服务平(píng)台,为(wéi)芯片产业生态(tài)的建设所作出(chū)的贡(gòng)献:
经过多年(nián)实践(jiàn),安创形成了自己的核心服务体(tǐ)系:项目(mù)加速、大(dà)企业创新(xīn)、城市创新(xīn)和跨境创新。
尤(yóu)其值(zhí)得一提的是,在项(xiàng)目加速过程中,他们(men)基于安创成长营,成(chéng)功打造了一(yī)个从核心的芯片、传感器、算法构建的基础(chǔ),到人工智能、物联(lián)网核(hé)心模块等平台层,再到最上层垂直领域例(lì)如交通、医疗、家(jiā)居(jū)、工(gōng)业等应用的产业闭环。通过这种方式,赋予创(chuàng)业型企业(yè)活力,以及(jí)获得由资源对接带来的强推动力。
安(ān)创加速器副总裁英语霏(fēi)告诉大家:「已成功加速了七期企业(yè),项目(mù)总(zǒng)量达到 115 个(gè),其中 33% 是 AI 项目,共计 38 个,AI 芯片项目 13 个(gè)。这个(gè)比例可(kě)以说(shuō)在硬科技(jì)的(de)创业加速平台中算(suàn)是比较大(dà)的份(fèn)额了。」
之(zhī)后,安创还会继续努力为中国本土创新企业提供硬科技技(jì)术(shù)支持(chí)、资金支持或甄(zhēn)选建议,以及创业经验借鉴;也将继续(xù)帮助(zhù)如中国移动、华润、红豆集团、宝(bǎo)马等离技术上游遥远的大企业快速匹配资源,实现(xiàn)大企业创(chuàng)新;更会帮助海外的创业公司搭建起中国「本地化(huà)」的(de)桥梁,目前中英创(chuàng)新(xīn)项目中的 4 家企业(yè)已(yǐ)成功(gōng)落(luò)地中国。
如此引来送(sòng)往(wǎng),形成商(shāng)业(yè)和(hé)产业(yè)的(de)良性合(hé)作。英语霏女士说:「我们始终认为,商业(yè)的核心还是要把生意做起来,这才是良性的商业(yè)环境。」
产业中的社群也需要刻意地(dì)去(qù)建(jiàn)立(lì)与维护:
百(bǎi)度飞桨(jiǎng)是国内(nèi)唯一(yī)功(gōng)能齐全并开放(fàng)的开发平台,最大的(de)目(mù)标还是要发展生(shēng)态。不单(dān)是为了(le)满(mǎn)足金融、航空航天、军(jun1)工、政府等企事业单位(wèi)自主可(kě)控等(děng)关键技术目标的实现,更要努力改变整个产业(yè)界使用(yòng) TensorFlow、Pytorch 等国外的框架(jià)来(lái)进行应用开发的主流现状(zhuàng)。
这就需要人为地开发并培养未来的用户,以及培养未(wèi)来用户的使(shǐ)用习惯。
2018 年正(zhèng)式更名为(wéi)「飞桨」之时,开(kāi)发用户将近一百(bǎi)万。并从这一年开(kāi)始,百度开始和 40 多所高校展开合作,这之中包括北(běi)航(háng),设(shè)立人工智能专门课程和(hé)培训,明年有望向本科生开发深度学习课(kè)程;在用(yòng)户企(qǐ)业中开放成长计划,进行实战训练(liàn);同时还在网站上线视频课程,在教育领域寻找产业合作。
一切(qiē)为(wéi)的是降低国内开发者使(shǐ)用深度(dù)学习的门槛。而就平台本身,他们更加开放(fàng),将百度自己在国际(jì)领域打标得到的模(mó)型也分享出(chū)来。新的学习,如联邦(bāng)学(xué)习等,也同(tóng)样会有新的代码(mǎ)放出来便于开发者使用,进一步降低大(dà)家的开发成本(běn)。
具有同(tóng)样想法的(de)还有引力互联的开发者平台 Model Play。Model Play 平台(tái)已在手机端上(shàng)线,更加(jiā)便(biàn)于使用者随时登陆、开发和共(gòng)享,希望所(suǒ)有人可以很轻松进(jìn)入门槛学习 AI,而(ér)未(wèi)来(lái)的人工智能由在座的产业人士(shì)和未来(lái)的开发(fā)者一起(qǐ)去定义(yì)。
相(xiàng)信在即将到来的二十年里(lǐ),国(guó)内(nèi) AI 芯片产业(yè),面对(duì)新工(gōng)业革(gé)命(mìng)挑战(zhàn),迎头直上,有备无患。