中科院“ 出品 ”！新一代人工智能大模型问世 - 信息快递

中科院“ 出品 ”！新一代人工智能大模型问世

发布时间：2023年06月20日

导读

又一国产大模型来了！中国科学院自动化研究所6月16日上午在上海发布了该所研制的新一代人工智能大模型——紫东太初2.0。

全新大模型相比第一代着力提升了决策与判断能力，实现了从感知、认知到决策的跨越，未来将在医疗、交通、工业生产等领域发挥更大作用。

人工智能大模型是一个庞大复杂的网络系统，类似于人的大脑，其中的节点和数据量越多，处理能力也越强大，通常这种大模型节点数都在百亿以上。

作为我国首个存储千亿参数的图文音三模态大模型，第一代紫东太初人工智能大模型在2021年问世时实现了无标识的图像、文字、语音的识别能力，这次发布的新一代大模型则升级融入了视频、传感信号、3D点云等识别能力，突破了多模态分组认知编码、解码，全模态认知等关键技术，提升了系统的决策和判断能力，打通了系统识别能力从感知、认知到决策的通路，从而拓展出更为广泛的应用场景。

目前，紫东太初大模型已经在神经外科手术导航、短视频内容审核、医疗多模态鉴别诊断、交通违规图像研读等多领域应用。

AI大模型成“科技顶流”

5月28日，科技部新一代人工智能发展研究中心发布的《中国人工智能大模型地图研究报告》显示，中国研发的大模型数量排名全球第二，仅次于美国，目前中国10亿参数规模以上的大模型已发布79个。

而从大模型区域分布来看，中国已有14个地区在开展大模型研发，其中，北京、广东、浙江、上海处于第一梯队，数量最多的北京有38个大模型，第二位的广东有20个。

在全球大模型竞赛中，中国科学院院士、中国计算机学会开源发展委员会主任王怀民表示，过去5年世界上参数量超过百亿的大模型大约有45个，其中有32个出现在美国，9个出现在中国，4个出现在欧洲。

民生证券吕伟分析指出，自4月11日《生成式人工智能服务管理方法》征求意见稿发布，短短2个月内，顶层及各地纷纷出台相关AI大模型推动政策，在产业发展早期获得政策如此重视几乎是空前的。而在技术与政策逐步明朗的格局下，新一轮AI大模型产品升级上线与产品应用发布大幕也随之拉开。在经历二月至三月的大模型集中发布期、四月至五月的产品研发期之后，六月起AI大模型产品和应用有望迎来集中发布。

“大模型竞争没有绝对壁垒”

北京智源人工智能研究院院长黄铁军表示，大模型最终会成为未来社会的一种新型基础设施，其提供“智力”能力，输送给千行百业和千家万户。因此，人工智能进入大模型时代之后，会形成一个体系化的产业生态。

简单来说，就像电力时代的电网一样，千行百业、千家万户都在用电，但并不是自己发电，而是有专门的发电厂，发电方式也是多种多样，如煤电、火电、风电、核电……也有企业去生产各种各样的电器。

“有了大模型就像人类学会发电了，目前可能是一种技术路径走通了，但后续一定还会有各种各样‘发电手段’不断演进迭代、降本增效。这意味着，就像不会有国家或企业垄断发电一样，大模型也没有绝对壁垒和门槛，大家比拼的是成本和效率，竞争的是应用和生态。”黄铁军说。

李开复也表示，未来的AI 2.0时代会有三大生态层：基础模型层、中间层和应用层。“以大模型为代表的AI 2.0市场规模巨大，足以容纳巨头、中小企业和初创公司在里面‘赛马’。”他说。

至于创业者和投资人如何选择自己在这个庞大生态中的地位和角色，李开复认为，需要基于不同的判断。

比如，基础模型层的大模型平台公司当然机会巨大，天花板会非常高，就像PC互联网时代的微软和移动互联网时代的谷歌，但风险也是最大的，因为平台公司一定是少数；如果是做应用层，风险就没有那么大，而且每一个生产力领域都可能成长出垂直领域的领先公司，但规模可能无法与平台公司相比。对于投资人来说，则永远是在风险和回报之间寻求平衡。