“算力风暴”是横亘于(yú)国内(nèi)大(dà)模型发展(zhǎn)路上(shàng)的第一(yī)道坎,数(shù)据显示,过去四年,大模型(xíng)参数量以年均400%复合增长(zhǎng),AI算(suàn)力需求增长超过(guò)15万(wàn)倍,远超摩尔定律。
“商汤人(rén)工智能(néng)计算中心几乎(hū)已经满负(fù)荷,正在(zài)扩建,上海电信(xìn)等算力提供(gòng)方也在(zài)建(jiàn)设国产算(suàn)力集(jí)群,即将对(duì)外(wài)开放(fàng)。”业(yè)内人士向《IT时(shí)报(bào)》记者表示(shì)。
继打造人(rén)工智能产业高地后,上海提出要建(jiàn)设具有国际影响(xiǎng)力的大模型生态高地,从魔都到(dào)“模(mó)”都(dōu),要跨过算(suàn)力坎。上海(hǎi)正在(zài)以(yǐ)全(quán)市之力(lì)解决算力短缺问题(tí),政府牵头统筹、调度、共享算力资源,还对使用算力的(de)大模型企业大规模发(fā)送“算力券”。
更多中小企业表(biǎo)示,数据和人(rén)才是(shì)大模型之争的核心资源,也(yě)是燃眉(méi)之急。经过近十(shí)年(nián)科创中心建设、五(wǔ)年人工智能高地建设,上海已经深谙创新之(zhī)路。不久前发布的《上海市推动人工智能大模型创新发展(zhǎn)若干(gàn)措施(shī)(2023~2025年)》中提出十一条措施(shī),不仅(jǐn)要共建共享语料数据资(zī)源,还要支持大(dà)模型人(rén)才落户。
“算力风暴”倒逼芯片国产化
上(shàng)海建设自主可控算力网络(luò)
“算力很缺,毕竟做大模型(xíng)预训练急需好用的大集群。”达观数(shù)据CEO陈运(yùn)文向《IT时报》记者提到,为了训练曹(cáo)植大模型(xíng),达观数(shù)据斥巨资自建中等规模的算力集(jí)群,但对小企业来说,如果无(wú)法承担高额(é)算力(lì)成本(běn),只能用别人开发好的(de)大模(mó)型。
在上海,目前规模(mó)最大的算力中心应(yīng)数(shù)商(shāng)汤人(rén)工(gōng)智能(néng)计算(suàn)中心(AIDC),已经上架3万多块GPU,产生超(chāo)过6000 PetaFLOPS算力,可支持20多个千亿(yì)参数规模的大模型同时训(xùn)练。
然(rán)而,即使商汤早在2022年(nián)便已建成这座占地87亩的人工智能计算(suàn)中心,但AIGC带来的大模型算力风暴席卷速(sù)度远(yuǎn)超预期(qī)。如今(jīn),这一亚洲最(zuì)大的智能计算(suàn)中心正(zhèng)在扩建中。
但(dàn),选谁(shuí)的(de)芯(xīn)片?
随着美国(guó)针对英(yīng)伟达高端GPU先后发(fā)布两次(cì)禁(jìn)令,中(zhōng)国企业(yè)已经意(yì)识到,只有(yǒu)支持国产GPU,走(zǒu)自(zì)主可控之路,才能在大模(mó)型之路上走得长远。
上海市经信委基础设施处处长潘(pān)焱(yàn)在2023年(nián)11月举行的“算力网络与大(dà)模型”产业生态论坛上表示,除了保障算力供给与调度外,上海也在构建自(zì)主可控的算力网络建(jiàn)设。同一论(lùn)坛上(shàng),上海电(diàn)信副总工程师肖晴提(tí)到,上海电(diàn)信已经在临港建设了数千卡国产算力集群,2024年争取推出万卡集群。
2023年4月(yuè),《IT时报》记者在参观商汤AIDC时发现,其芯片国产化已在进程中。
同(tóng)样作为(wéi)算力提供方,优刻得(dé)在内(nèi)蒙古(gǔ)乌兰察布和上海青浦两大数据中心可(kě)提(tí)供(gòng)超3000 PetaFLOPS的AI算(suàn)力,也在布(bù)局国产算力,与沐曦、壁仞等国产芯片(piàn)厂商联合测试。
优刻得副(fù)总裁刘杰曾在接受(shòu)《IT时(shí)报》记者(zhě)采(cǎi)访时(shí)表示,虽然在(zài)支持大模型训练上,国(guó)产芯片尚有一段(duàn)距离需追赶,但在大模型推(tuī)理上,国产芯片较有(yǒu)前(qián)景,未来预估(gū)大模型训练和推理的算力芯片需求是1:3至(zhì)1:5,甚(shèn)至更高。
最(zuì)高补贴10%
上海大(dà)规模发放“算力券”
上海市(shì)区两(liǎng)级正在密集出(chū)台(tái)算力(lì)相关政策。据《IT时报》记(jì)者了(le)解,上海政府对算(suàn)力补贴的政(zhèng)策分为两大类,一(yī)是(shì)针对算力提供(gòng)方,对纳入统筹管理的算力平台(tái)进行建设(shè)补贴(tiē);二是针对算力使用方(fāng),对使用算力的单(dān)位(wèi)给(gěi)予最(zuì)高10%算力补贴,类(lèi)似于“算力补贴券”。
2023年11月,上海制定了《上海(hǎi)市推动人(rén)工智能大模型(xíng)创新(xīn)发(fā)展若干措(cuò)施(2023~2025年)》,被称为人工(gōng)智(zhì)能大模型发展十一条措施。其(qí)中,第(dì)三条提到的大模型智能算力加速计划,将对2024年底前在(zài)沪完成智能算力部署并纳入统筹、接(jiē)受调度的(de)算力建(jiàn)设主体,经评估给予适当额(é)度的(de)部署奖励;对租用(yòng)纳入本市统筹调(diào)度的算力(lì)进行(háng)大模型研发的本市主体,经评估按算力(lì)集群(qún)规模和成(chéng)果水平给予最高(gāo)10%的租(zū)用(yòng)补贴。建设(shè)市域极速智能算力承载网,实现市域智能算(suàn)力中心间100Gb/S以上高速直连和毫(háo)秒(miǎo)级时延。
2023年12月,徐汇区开(kāi)展人工智能大模(mó)型(xíng)算力补贴项(xiàng)目,申报条件主要是设立在徐汇区的算力需求(qiú)主体,上年(nián)度研发投(tóu)入占主营业(yè)务收入5%以上,研发人员占项目研发团队(duì)总人数50%以上等等。
徐汇区科委主任张(zhāng)宁在“算(suàn)力网络(luò)与大(dà)模型”生态产业论坛上重点提到几(jǐ)点,一(yī)是在徐汇西岸创建“模速空(kōng)间”大模型生态社区;二是与(yǔ)算力供应(yīng)商(shāng)开展(zhǎn)区域“智能算(suàn)力加(jiā)速计划”,加强市区算力(lì)统筹、探(tàn)索自建算力服(fú)务;三是大模型算(suàn)力补贴项目,确保(bǎo)大模(mó)型企(qǐ)业算力“够用(yòng)、好用”。
上海市经信委也(yě)在落实(shí)“模速空间(jiān)”的(de)专项政(zhèng)策(cè),协调上海电信等算(suàn)力供应(yīng)方,加速对“模(mó)速(sù)空间”的算(suàn)力供给,对接入驻企业的算力需求,支持企业的模型开发(fā)与应(yīng)用。
根据规划,到2025年,上海市数据中心(xīn)算力(lì)将(jiāng)超过18000 PFLOPS,人工智(zhì)能公共算力服务平台能级跃升,完善算力交易机(jī)制,实现(xiàn)跨地域算力智(zhì)能调(diào)度,通过高效(xiào)算力调度(dù),推(tuī)动算(suàn)力供需均衡,带动产业发(fā)展作用(yòng)显著(zhe)增强。这是《上海市推进算力资源统一调度(dù)指导意见》提出的2025年计划,可见上海对解(jiě)决算力困局的清晰目标。
谁掌握优质数据谁突围(wéi)
上海共建共享数据资源
算力、算法、数据,被(bèi)认为是大模型(xíng)的竞争三要素。近期(qī),研(yán)究机构Epoch AI指出,对数(shù)据需求急剧增加(jiā),以致可用于(yú)训练的高质(zhì)量文本可能会在2026年耗尽。
“优质数据才是未来大模型的核(hé)心竞争力,谁掌握的优质数据多,谁(shuí)能用得更好,谁就能突围(wéi),但中文教科书只有(yǒu)英文的十分之(zhī)一。”达观(guān)数据CEO陈运文认为,知识密度高的(de)文档资料才是(shì)大(dà)模型训练的优质数据,包括教科书、论文、报告等,而微信聊天记录、淘宝聊天(tiān)记录(lù)等数据的有(yǒu)效性弱。目前,散落在(zài)出版社、图书馆等机构的优(yōu)质数据(jù),难以界定(dìng)版权归属于作者、出版社(shè)还是其他(tā)机构(gòu),这将成为大模型发展的(de)一大(dà)难点。
优刻得(dé)计算产品线总经理钟春山也(yě)认为,中(zhōng)文数据(jù)的短缺将阻碍大模型的发展,应加大(dà)数(shù)据共(gòng)享。另外,政府可以多开放应用场景给大模型公司,场景用起来有三个好处:首先能形成反(fǎn)馈,对模型(xíng)进行调整优(yōu)化;其(qí)次(cì)能产生更多经济价值,让大模型真正深入(rù)产业;最(zuì)后能帮助各行各业(yè)提(tí)高效率,解决信息不(bú)对称的(de)问题等。
目前,全球70%的(de)数(shù)据源仅停留在免费公开数据集的层面(miàn),上海(hǎi)数交所(suǒ)总经(jīng)理汤奇峰也曾表示(shì),大模型成长所需的高质量数据库仍存在供给不足、质量不高、多样性(xìng)匮(kuì)乏、标准欠缺等问题。
2023年(nián)7月6日世界人工智能(néng)大(dà)会开幕式(shì)上,上海宣布成(chéng)立大模型(xíng)语(yǔ)料数据联(lián)盟,由上海人工智(zhì)能实验室(shì)联合中(zhōng)央广播电视总台、人(rén)民网、国家气(qì)象(xiàng)中心、中国(guó)科学技(jì)术信息研究所、上海报业集团、上海(hǎi)文(wén)广集团等(děng)10家单(dān)位(wèi)联合发起。
2023年(nián)11月,联盟“朋友圈”扩容,12家新成员加入,同时,上海人工智能实验(yàn)室联合(hé)人民(mín)网发起成立中国大模型语料数据联盟安全治理专委(wěi)会,为的是推动大(dà)模型数据安(ān)全治理与隐(yǐn)私保护(hù)。
早在人工(gōng)智(zhì)能(néng)发展初期,上海(hǎi)已(yǐ)经在数据共享上开了(le)许多(duō)先(xiān)河(hé)。此次,上(shàng)海市人工智能大模型发展十一条措(cuò)施也提到,共建共享语料数据资源,包(bāo)括组建大模型语料数(shù)据(jù)联盟、建立语料数(shù)据知(zhī)识产(chǎn)权保护框架、依托上海数据交(jiāo)易所建立语料数据交易板块等(děng)。
AI工程(chéng)师薪(xīn)酬跃居首位
上(shàng)海吸引大模型人才落户
AI Agent是大(dà)语(yǔ)言模(mó)型落(luò)地的最热应用(yòng)场景之(zhī)一,澜(lán)码科(kē)技是研发(fā)AI Agent等大(dà)模型应用的公司(sī)。“我们直接调用大模型,算力成(chéng)本由大(dà)模型公司承(chéng)担(dān),类比云(yún)计(jì)算公(gōng)司,我们调用云服务,按(àn)需付费,所以难(nán)点是如何挑(tiāo)选(xuǎn)不同能力、不同价格的大(dà)模型。”澜码科技CEO周健(jiàn)解释道,算力对(duì)大(dà)模(mó)型(xíng)下游(yóu)企业来说(shuō),还不是最难的挑战。
对周健来说,最大的(de)挑战是人,AI产品经理、AI需求(qiú)分析师都(dōu)十分稀缺。
咨询公司(sī)麦肯锡一份关于人(rén)工智能的(de)报告显(xiǎn)示,预计2030年(nián)中国对AI专(zhuān)业人员的(de)需求将增至2022年(nián)的6倍,人(rén)才缺口将达到400万人。抢人大战让人工智能工(gōng)程师的薪酬水涨船(chuán)高,智联招聘2023年第四季度(dù)《中国企业招(zhāo)聘薪酬报告(gào)》显示,人工智能工程师的平(píng)均招聘月(yuè)薪(xīn)跃居职业榜首位,高达22788元。
早(zǎo)在2018年,上海就(jiù)已(yǐ)开(kāi)始筑巢引(yǐn)凤,上海(hǎi)市经信(xìn)委主任张英曾介(jiè)绍,从2018年至(zhì)2022年,五年(nián)间,上海(hǎi)人工智能产(chǎn)业(yè)规模从1340亿(yì)元提升(shēng)至3056亿元,产业人才从10万(wàn)提升(shēng)到23万。
如今则进(jìn)一步落(luò)实吸引大模型人才(cái)的政策。上海市人工智能大模型发展十一条措施也提(tí)到,优先推荐大模型创新重点人才纳(nà)入国家和本市相关高层(céng)次人才计(jì)划,重点支持大(dà)模型(xíng)相关紧缺技能人才落户等。
“上(shàng)海的数(shù)字(zì)化建设水平、数字化人(rén)才储备,都是上海发展(zhǎn)生成式人(rén)工智能的先天(tiān)优势(shì)。”这是吸引周健留在上海创(chuàng)业的重(chóng)要原因(yīn)。
人工(gōng)智能走到(dào)2.0时(shí)代,这句(jù)话(huà)在上海AI圈,已然具体可感知。金山(shān)办公(gōng)WPS AI背(bèi)后(hòu)的大模型创业公司(sī)MiniMax,其联合(hé)创(chuàng)始人是前商汤科技(jì)副总裁、通用(yòng)智能技术负(fù)责人闫俊杰。主攻AI Agent的澜码科技,其创(chuàng)始人兼CEO周(zhōu)健是依图10号员工。
在(zài)一波接一(yī)波的人工智能浪潮中(zhōng),能留住人才,才是筑(zhù)造高地(dì)的(de)根(gēn)本。
大模型企业到(dào)底最(zuì)缺什(shí)么?多家上海大(dà)模型上下(xià)游企业告(gào)诉《IT时报》记者,当前最紧急的是(shì)缺算力,中期要解决的是缺人才,未(wèi)来最重要的难题是(shì)缺数据。
上海,因为错过了(le)互联网浪潮(cháo)下诞生的BAT,多少年(nián)来(lái)被质疑不(bú)适合(hé)创业。但它用近10年的时间(jiān)证(zhèng)明,上海适合创新。2015年,上海提出要建(jiàn)设具有全球影响力的科技创新中心(xīn),在创新上寻觅新疆域。
人(rén)工(gōng)智能是上(shàng)海走向科技创新中心的三驾马(mǎ)车之一,2022年,上(shàng)海出台人工智能(néng)领域首部省(shěng)级地方性法(fǎ)规《上海市促进人(rén)工智能产(chǎn)业发(fā)展(zhǎn)条例》,正式提出把上海(hǎi)市(shì)建成具有国际影响力的人工(gōng)智能高地(dì)。不仅为我国人工智能治理贡献了“上海方案”,也为上海接(jiē)住大模(mó)型(xíng)浪潮铺(pù)了(le)路(lù)。
如(rú)今,上海市(shì)人工智能(néng)大模型发(fā)展十一条措施出台,政府在算力、人(rén)才、数据等方面全维度着力,可见魔都上海向(xiàng)“模”都的转型,是(shì)坚定而具体的。