​中科院“ 出品 ”!新一代人工智能大模型问世
发布时间:2023年06月20日

导读

 

又一国产大模型来了!中国科学院自动化研究所6月16日上午在上海发布了该所研制的新一代人工智能大模型——紫东太初2.0。

全新大模型相比第一代着力提升了决策与判断能力,实现了从感知、认知到决策的跨越,未来将在医疗、交通、工业生产等领域发挥更大作用。

 

人工智能大模型是一个庞大复杂的网络系统,类似于人的大脑,其中的节点和数据量越多,处理能力也越强大,通常这种大模型节点数都在百亿以上。

 

作为我国首个存储千亿参数的图文音三模态大模型,第一代紫东太初人工智能大模型在2021年问世时实现了无标识的图像、文字、语音的识别能力,这次发布的新一代大模型则升级融入了视频、传感信号、3D点云等识别能力,突破了多模态分组认知编码、解码,全模态认知等关键技术,提升了系统的决策和判断能力,打通了系统识别能力从感知、认知到决策的通路,从而拓展出更为广泛的应用场景。

 

目前,紫东太初大模型已经在神经外科手术导航、短视频内容审核、医疗多模态鉴别诊断、交通违规图像研读等多领域应用。

 

AI大模型成“科技顶流”

 

5月28日,科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示,中国研发的大模型数量排名全球第二,仅次于美国,目前中国10亿参数规模以上的大模型已发布79个。

 

而从大模型区域分布来看,中国已有14个地区在开展大模型研发,其中,北京、广东、浙江、上海处于第一梯队,数量最多的北京有38个大模型,第二位的广东有20个。

 

在全球大模型竞赛中,中国科学院院士、中国计算机学会开源发展委员会主任王怀民表示,过去5年世界上参数量超过百亿的大模型大约有45个,其中有32个出现在美国,9个出现在中国,4个出现在欧洲。

 

民生证券吕伟分析指出,自4月11日《生成式人工智能服务管理方法》征求意见稿发布,短短2个月内,顶层及各地纷纷出台相关AI大模型推动政策,在产业发展早期获得政策如此重视几乎是空前的。而在技术与政策逐步明朗的格局下,新一轮AI大模型产品升级上线与产品应用发布大幕也随之拉开。在经历二月至三月的大模型集中发布期、四月至五月的产品研发期之后,六月起AI大模型产品和应用有望迎来集中发布。

 

“大模型竞争没有绝对壁垒”

 

北京智源人工智能研究院院长黄铁军表示,大模型最终会成为未来社会的一种新型基础设施,其提供“智力”能力,输送给千行百业和千家万户。因此,人工智能进入大模型时代之后,会形成一个体系化的产业生态。

 

简单来说,就像电力时代的电网一样,千行百业、千家万户都在用电,但并不是自己发电,而是有专门的发电厂,发电方式也是多种多样,如煤电、火电、风电、核电……也有企业去生产各种各样的电器。

 

“有了大模型就像人类学会发电了,目前可能是一种技术路径走通了,但后续一定还会有各种各样‘发电手段’不断演进迭代、降本增效。这意味着,就像不会有国家或企业垄断发电一样,大模型也没有绝对壁垒和门槛,大家比拼的是成本和效率,竞争的是应用和生态。”黄铁军说。

 

李开复也表示,未来的AI 2.0时代会有三大生态层:基础模型层、中间层和应用层。“以大模型为代表的AI 2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面‘赛马’。”他说。

 

至于创业者和投资人如何选择自己在这个庞大生态中的地位和角色,李开复认为,需要基于不同的判断。

 

比如,基础模型层的大模型平台公司当然机会巨大,天花板会非常高,就像PC互联网时代的微软和移动互联网时代的谷歌,但风险也是最大的,因为平台公司一定是少数;如果是做应用层,风险就没有那么大,而且每一个生产力领域都可能成长出垂直领域的领先公司,但规模可能无法与平台公司相比。对于投资人来说,则永远是在风险和回报之间寻求平衡。