“算力风(fēng)暴”是横亘于国内大模型发展路上(shàng)的第(dì)一道坎(kǎn),数据显示,过去(qù)四年,大模型参数量以年均400%复合增(zēng)长,AI算力(lì)需(xū)求增长超(chāo)过15万倍,远(yuǎn)超摩尔定(dìng)律。
“商汤人工智能计(jì)算中心几乎已经满负荷,正在扩建,上海电信等算(suàn)力提供方也在建设(shè)国(guó)产算力集群,即将对外开放。”业内人士向(xiàng)《IT时报》记(jì)者表示。
继打造人工智能产业(yè)高(gāo)地(dì)后,上海提出要建设具有国际影响力的(de)大模型(xíng)生态(tài)高地,从魔都到“模”都,要跨过算力坎。上海正(zhèng)在以(yǐ)全市之(zhī)力(lì)解决算(suàn)力(lì)短缺(quē)问题(tí),政府牵头(tóu)统筹、调度、共享算(suàn)力资源,还(hái)对使用(yòng)算力(lì)的大模型企业大规模发送“算力券”。
更多(duō)中小企业表(biǎo)示,数据和人才是大模型之争的核(hé)心(xīn)资(zī)源,也是燃眉之急。经过近十年科(kē)创中心建设、五年人工智能高(gāo)地建设,上海已(yǐ)经深谙创新之路。不久前发(fā)布的《上海市推(tuī)动人工智能(néng)大模型创新发展若干措(cuò)施(2023~2025年)》中提(tí)出(chū)十一条措施(shī),不仅要共建共享语料数据资源,还要支持(chí)大(dà)模型人才落户。
“算(suàn)力风暴”倒(dǎo)逼(bī)芯(xīn)片国产化
上海(hǎi)建(jiàn)设自主(zhǔ)可控算(suàn)力网络
“算力很缺(quē),毕竟做大模(mó)型预训练急需好用的大集群。”达观数据(jù)CEO陈运文向《IT时(shí)报》记者提到,为了训练(liàn)曹植大(dà)模型,达观数据斥巨资(zī)自建中(zhōng)等规模(mó)的算力(lì)集群(qún),但(dàn)对小企业来(lái)说,如果无(wú)法承担(dān)高(gāo)额(é)算力成本,只能用别人开发好的大模型。
在上海,目前规模最大(dà)的(de)算力中心应(yīng)数商汤人工智能计算(suàn)中(zhōng)心(xīn)(AIDC),已(yǐ)经上(shàng)架3万多块GPU,产生超过(guò)6000 PetaFLOPS算力,可支持20多个千亿参(cān)数规(guī)模的大模型同时训练。
然而,即使商汤(tāng)早在(zài)2022年便已(yǐ)建(jiàn)成这座占地87亩的人工智(zhì)能计算中心,但(dàn)AIGC带来的大模型(xíng)算力风暴席(xí)卷(juàn)速度(dù)远超预期。如今(jīn),这一亚洲(zhōu)最大的(de)智能计算(suàn)中心(xīn)正在扩建中。
但,选谁的芯片?
随着美国针对英伟达高端GPU先(xiān)后发(fā)布两次禁令,中国(guó)企业(yè)已经意识到,只有支持国产GPU,走自主可控之路(lù),才能在大模型之路(lù)上走得长远。
上海市经信委(wěi)基(jī)础设施处处(chù)长潘焱在2023年11月举行的“算力网络与大模型”产业生态论坛上(shàng)表示(shì),除了保障算力供给与调度(dù)外,上海也在构建自主可控的算力网络(luò)建设。同一论坛(tán)上,上海电信(xìn)副总工程师肖晴(qíng)提到(dào),上海电信已经在(zài)临港(gǎng)建设(shè)了数千卡国产算力集群,2024年争取推出万卡集群(qún)。
2023年4月,《IT时报》记者(zhě)在参观商汤AIDC时发现(xiàn),其芯片(piàn)国(guó)产化已(yǐ)在(zài)进程中。
同(tóng)样作为算力提供方,优刻得在内蒙古乌兰(lán)察布和(hé)上(shàng)海青浦两大数据中心可提供(gòng)超3000 PetaFLOPS的(de)AI算力,也(yě)在布局国产算力,与沐(mù)曦、壁仞(rèn)等国产芯片厂商(shāng)联合测试。
优(yōu)刻得副(fù)总裁刘杰曾在接受(shòu)《IT时报(bào)》记者采访(fǎng)时表示,虽(suī)然在支持大模型训练上,国(guó)产芯(xīn)片尚有一段距离需追赶,但在大模型(xíng)推理上,国产芯片较有前景(jǐng),未(wèi)来预估大模型训练和推理的算力芯片需(xū)求是1:3至1:5,甚至更高(gāo)。
最高补贴10%
上海大规模发放(fàng)“算(suàn)力券”
上海市区(qū)两级正在(zài)密集出(chū)台(tái)算力相(xiàng)关政策。据(jù)《IT时报》记者了解,上海政府对算力(lì)补贴的政策分为两大类,一是针对(duì)算力提供方,对纳(nà)入统筹(chóu)管(guǎn)理的(de)算力平台进行建设补贴;二是针对(duì)算力使用方(fāng),对使用算力的(de)单位给(gěi)予最高10%算力补贴,类似于“算力补贴券”。
2023年11月(yuè),上海制定了《上(shàng)海市推动人工智能大(dà)模型创新(xīn)发展若干措施(2023~2025年)》,被称为人工智(zhì)能大(dà)模型发展(zhǎn)十一条措施。其中,第三条提到的(de)大(dà)模型(xíng)智能(néng)算力加速计(jì)划,将对2024年底(dǐ)前在沪完成智能算力部署(shǔ)并纳入统筹、接受调度的算力建设主体,经评估给予适当额度的部署奖(jiǎng)励;对租用纳入本市统筹(chóu)调度的算(suàn)力进行大(dà)模型研发的本市主体,经评估按算力集群规模和成果水平(píng)给予最高10%的租用补贴。建设市域极(jí)速智(zhì)能(néng)算力承载网,实现市域(yù)智能算力中心(xīn)间100Gb/S以上(shàng)高速(sù)直连和毫秒(miǎo)级时延。
2023年12月,徐汇区(qū)开展(zhǎn)人工智能大模型算力补贴项目,申(shēn)报条件主要是(shì)设立在徐汇区的算力需求(qiú)主体,上年度研发投入占主营业务收入5%以上,研发人员占项目(mù)研发团(tuán)队总人(rén)数50%以上等(děng)等(děng)。
徐汇(huì)区科(kē)委主任张宁(níng)在“算力网络与大模型”生态产业论坛上重点提到几(jǐ)点,一是在徐汇西(xī)岸创建“模速空(kōng)间”大模型(xíng)生态社区;二是与算力供(gòng)应商开展区域“智能算力加速计划”,加强市区算(suàn)力统筹、探(tàn)索自建(jiàn)算力服务;三(sān)是大模型(xíng)算力补贴项目,确(què)保大模(mó)型企业算力“够用、好用(yòng)”。
上海(hǎi)市经信委也在落实“模速空间(jiān)”的(de)专项政(zhèng)策,协调上海电(diàn)信等算(suàn)力供应方(fāng),加速对“模速(sù)空(kōng)间”的算(suàn)力供给,对接入驻企业的算力需求,支持企业的模(mó)型(xíng)开(kāi)发与应用。
根据规(guī)划,到2025年,上海市数据(jù)中(zhōng)心算力(lì)将超过18000 PFLOPS,人工智(zhì)能(néng)公共算(suàn)力服务平台能级跃升,完善算力交易机制,实(shí)现(xiàn)跨地(dì)域算力(lì)智能调度,通过高效算力调度,推动算(suàn)力供需均衡,带动产业发展作用显著增强。这(zhè)是《上海市推进算力资源统一(yī)调度指导意见》提(tí)出的2025年计划,可见上(shàng)海对解决算力困(kùn)局的清晰目(mù)标(biāo)。
谁掌握优质数(shù)据(jù)谁突(tū)围
上海共建共享数据资源
算力、算法、数(shù)据,被认为是大模型的竞争三要素(sù)。近期,研究机构Epoch AI指出,对数(shù)据需求急剧增加,以致(zhì)可用于训练的高(gāo)质(zhì)量文本可能会在2026年(nián)耗尽(jìn)。
“优质(zhì)数(shù)据才是(shì)未来大模型的核(hé)心竞(jìng)争力,谁掌握的优质数据多,谁能用得(dé)更好,谁就能突围,但(dàn)中文教科书只有英文的十(shí)分之一(yī)。”达观(guān)数(shù)据(jù)CEO陈运(yùn)文认为,知识密度高的文档资料才(cái)是大模(mó)型训练的优质数据,包括(kuò)教科书、论文(wén)、报(bào)告(gào)等,而微信聊天记录、淘宝聊(liáo)天记录等数据的有效性弱。目前,散落在出版社、图书馆等(děng)机构的(de)优质数据,难以界定版权归属于作者、出版社还是其他机构(gòu),这将成为大(dà)模型发展的一(yī)大难点。
优刻得计(jì)算产品线总经理钟春山也认(rèn)为,中文数据的短缺将阻碍大模型的发展,应加大数据共享。另外,政府可(kě)以多开放应用场景给大(dà)模(mó)型公司,场景用起来有三个好处:首先能形(xíng)成反(fǎn)馈,对模型进行调整优化;其次能产生(shēng)更多经济价值,让大模型真正(zhèng)深(shēn)入产业(yè);最后能(néng)帮助各(gè)行(háng)各(gè)业(yè)提高效率,解(jiě)决信息不对称的问题等。
目前(qián),全球70%的数据源仅停留在免费公开数(shù)据集的层面,上海数交所总经(jīng)理汤奇峰也曾表示,大模型成(chéng)长所(suǒ)需的高质量数据库仍存在供给(gěi)不足、质量不高、多样(yàng)性匮乏(fá)、标准欠缺等(děng)问题。
2023年7月6日世界人工智能大会开(kāi)幕式上,上海宣(xuān)布成立(lì)大模型语(yǔ)料数(shù)据联盟(méng),由上(shàng)海(hǎi)人(rén)工智能(néng)实验室联合中央广播电(diàn)视(shì)总台、人民网(wǎng)、国家气象(xiàng)中心、中国科学技术信息研(yán)究所、上(shàng)海(hǎi)报业集团、上海(hǎi)文广集团等10家单位联合(hé)发(fā)起。
2023年11月,联盟“朋友圈(quān)”扩容,12家新成员加入(rù),同时,上海人工智(zhì)能实验室联合人民网发起成(chéng)立(lì)中国大模型语料数据联(lián)盟安全治理(lǐ)专委会,为的是(shì)推(tuī)动大模型数据(jù)安全治(zhì)理与隐私保护。
早在人工智能发展初(chū)期,上(shàng)海已经在数据共(gòng)享(xiǎng)上开了许(xǔ)多先(xiān)河。此次,上(shàng)海市人工智能大模型(xíng)发展十一条(tiáo)措施(shī)也提到,共建共享语料数据资源,包括组建大模(mó)型语料数据(jù)联盟、建(jiàn)立语(yǔ)料(liào)数(shù)据知(zhī)识产(chǎn)权(quán)保护(hù)框架、依托(tuō)上(shàng)海数据(jù)交易(yì)所建立语料数据交(jiāo)易板块等。
AI工程师薪酬(chóu)跃居首位
上海(hǎi)吸引大模型人(rén)才落户(hù)
AI Agent是大(dà)语(yǔ)言模型落地(dì)的最热应用场景之(zhī)一,澜码(mǎ)科技是研(yán)发AI Agent等(děng)大模型(xíng)应用的公司。“我们(men)直接调用大模型,算(suàn)力成本由大模型公司承担(dān),类比云(yún)计算公司,我们调用云服(fú)务,按(àn)需付费,所以难(nán)点(diǎn)是如何挑选不同能力(lì)、不同(tóng)价格的大模型。”澜码科(kē)技CEO周健解释道,算力对大模(mó)型下游企业(yè)来说,还不是(shì)最难的挑(tiāo)战。
对周健(jiàn)来说,最大的(de)挑战是(shì)人,AI产(chǎn)品经理、AI需求分析师都十分稀缺。
咨询公司麦肯锡一(yī)份关于(yú)人工智(zhì)能(néng)的(de)报告显示,预计2030年中国对AI专(zhuān)业人员的需求(qiú)将增至2022年的6倍,人才缺(quē)口将达到400万人。抢人大(dà)战让(ràng)人(rén)工智能工程师的薪酬水涨船(chuán)高,智联招(zhāo)聘(pìn)2023年第四季度《中国企(qǐ)业(yè)招聘薪酬报告(gào)》显示,人(rén)工(gōng)智(zhì)能工(gōng)程师的平均招聘(pìn)月薪跃居职业榜首位,高达22788元(yuán)。
早在(zài)2018年,上海就已开始筑巢引凤,上海市经信委主任张英(yīng)曾介绍,从2018年(nián)至2022年,五年间,上(shàng)海人工智能产业(yè)规模从1340亿元(yuán)提升至3056亿元,产业人才从10万(wàn)提升到23万。
如今(jīn)则进一步落(luò)实吸引(yǐn)大模(mó)型人才的政策。上海(hǎi)市(shì)人(rén)工(gōng)智(zhì)能(néng)大模(mó)型发展十一(yī)条措施也提到,优(yōu)先(xiān)推荐大(dà)模型创新重点人才纳入国家和本市相关(guān)高层次人才(cái)计(jì)划,重点(diǎn)支持大(dà)模(mó)型相关紧缺技能人(rén)才落户等。
“上海(hǎi)的(de)数字化建设水平、数(shù)字化(huà)人(rén)才储备,都是上海发展(zhǎn)生成(chéng)式人工智能(néng)的先天优势。”这是吸引周健留(liú)在上海创(chuàng)业的(de)重要(yào)原因。
人工智能走到2.0时(shí)代,这句话在上海AI圈(quān),已然具体可感知。金山办公WPS AI背后的(de)大模型创业公司MiniMax,其联(lián)合(hé)创始人是(shì)前(qián)商汤科(kē)技副总裁、通(tōng)用智(zhì)能技(jì)术负责人闫(yán)俊杰(jié)。主攻(gōng)AI Agent的澜码科技,其创始人兼CEO周健是依图(tú)10号员工。
在一波(bō)接一(yī)波的人工智能浪潮中,能留(liú)住人才,才是筑造高地的(de)根本。
大模型企业到底最(zuì)缺(quē)什么(me)?多家上海大(dà)模型上下游企业告(gào)诉(sù)《IT时报》记者,当前最紧急(jí)的是(shì)缺算力,中期要(yào)解决的(de)是(shì)缺人(rén)才(cái),未来最(zuì)重(chóng)要的难题是(shì)缺数据。
上海,因为错(cuò)过了(le)互联网浪潮下诞(dàn)生的BAT,多少年来被质疑(yí)不适合创业。但(dàn)它(tā)用近10年的(de)时间证明,上海适合创(chuàng)新。2015年,上海提出要建设具(jù)有全(quán)球影响(xiǎng)力(lì)的(de)科技创新(xīn)中(zhōng)心,在(zài)创新上寻觅新疆域。
人(rén)工智能是上(shàng)海走向科技创新中心(xīn)的三驾马车之一,2022年,上(shàng)海出(chū)台人工智能领域首部省级地方性法规《上(shàng)海市(shì)促进(jìn)人工智能产业发展条例》,正式提出把上(shàng)海市建(jiàn)成具有国际影(yǐng)响力的(de)人工智能高地(dì)。不仅为我国人工智能治(zhì)理贡献了“上海方案”,也为上(shàng)海接住大模型浪潮铺了路。
如今,上海市人工智能大模型发展十一条措施(shī)出台(tái),政(zhèng)府在(zài)算(suàn)力、人(rén)才、数(shù)据等方(fāng)面全维度着力,可见魔都上海向(xiàng)“模(mó)”都的转型,是坚定而具体(tǐ)的(de)。