大模型是人工智能新一轮爆发的转折点。互联网厂商、运营商等科技企业竞相布局大模型赛道,在全球掀起了一场人工智能大模型之战。国资体系中,中国联通、中国移动、中国电信、中国电科、国投集团、国家电网、南方电网等央企以不同方式加速布局大模型。
通用人工智能成为当前世界大国博弈的科技制高点之一。
4月28日召开的中共中央政治局会议指出,要重视通用人工智能发展,营造创新生态,重视防范风险。
5月5日召开的二十届中央财经委员会第一次会议强调,要把握人工智能等新科技革命浪潮,适应人与自然和谐共生的要求,保持并增强产业体系完备和配套能力强的优势,高效集聚全球创新要素,推进产业智能化、绿色化、融合化,建设具有完整性、先进性、安全性的现代化产业体系。
通用人工智能时代来临,人工智能产业飞速发展,生成式人工智能(AIGC)、大模型成为主流。其中,大模型正在成为推动新一轮科技创新、产业升级、生产力跃迁的重要力量。目前,互联网厂商、运营商等科技企业竞相布局大模型赛道,在全球掀起了一场人工智能大模型之战。
大模型是人工智能新一轮爆发的转折点,也是通用人工智能时代的原点,它的泛化能力将人工智能从过去“一场景一适配”的方式解放,类似工业革命从小作坊生产发展为工厂批量化生产,也意味着人工智能将实现由“能用”到“好用”“泛用”的转变。与此同时,随着大模型语言能力的发展和目前的混合专家系统模式,以自然语言交互大模型做“管家”的模式或将成为下一个时代的主流。
据不完全统计,截至目前,中国从事人工智能大模型研发的企业超过100家,其中80余个大模型已公开发布。
国资体系中,中国联通、中国移动、中国电信、中国电科、国投集团、国家电网、南方电网等央企以不同方式加速布局大模型。
央企布局大模型路径
业界看来,目前央企布局大模型分为两种路径和类型:第一种是通信类央企从算力和数据出发,以通用大模型赋能千行百业;第二种是其他行业的央企从场景数据出发,以行业大模型反哺自身业务。
中国移动研究院首席科学家、人工智能与智慧运营中心总经理冯俊兰表示,迎接通用人工智能时代的到来,需要有新的智能服务与相应范式:一是要创新运营供给模式,实现全场景全要素能力运营与供给;二是要创新业务赋能模式,实现从X+AI向AI+X的根本性变革;三是要创新产业合作模式,实现向体系化协同创新转变。
野村综研咨询顾问张凯则认为,AI时代,运营商作为产业链的重要参与企业,不满足于仅仅提供算力基础,而是希望在未来数字化社会中,继续领导数字化产业链。因此,必须拥有人工智能大模型的话语权。
以此为目的,三大基础运营商入局人工智能大模型赛道。
6月28日,中国联通发布图文大模型“鸿湖图文大模型1.0”,可实现以文生图、视频剪辑、以图生图等功能。“鸿湖图文大模型1.0”立足文旅产业的真实需求和年轻用户群的增值业务场景,主打国风水墨画生成。该大模型已成功赋能文旅数字人的建设,实现了降本增效。
7月2日,中国电信发布大模型“TeleChat”,中国电信数字智能科技分公司依托电信云网融合优势,利用自研技术增强大模型的预训练和推理能力,赋能数据中台、智能客服和智慧政务。
7月9日,中国移动发布“九天·海算政务大模型”,首创政务大模型—信息场—应用端到端政务服务体系,满足动态管理、公文写作等需求,并可以为人工客服提供回复建议。
三大基础运营商之外,6月9日,中国电科旗下电科太极发布大模型“小可”。该产品能够构建工厂一体化流转平台,实现岗位工人、产线设备、信息系统之间基于自然语言的交互,优化工厂自动化、数字化、智能化运作流程。
6月28日,国投下属美亚柏科发布国内首个公共安全大模型“天擎”,其已具备警务意图识别、警务情报分析、案情推理等业务理解能力。基于该大模型,办案人员只需输入一条指令,就能将相关人员的涉案线索一站式呈现,并自主得出研判结论,大幅提高办案效率和研判的准确率。
其他行业央企中,国家电网所属国网数科对大模型的应用与探索,更关注于模型服务化、工程化能力以及生态的打造,构建了基于“大模型+小模型”的电力大模型引擎,提供平台化的模型服务,减少重复训练和重复创新,串联了不同场景的业务知识和需求。
国网数科控股公司数字技术研究院(双创中心)运营总监张宾表示,国网数科大模型聚焦源网荷储和供应链两类模型的训练和服务化应用,做到有所为有所不为。依托电力大模型引擎,国网数科还为公司内兄弟单位提供模型微调、训练、发布等技术服务,提高公司大模型生产、应用效率。
7月5日,南方电网人工智能科技有限公司上线全国电力行业百亿参数规模大模型,为南方电网输配电、电力调度、市场营销、安监、综合管理等业务提供了解决方案。据了解,整体流程除训练微调之外,还使用强化学习评价模型迭代微调,推动智能客服、生产和安监等业务域落地,已形成从研发到应用场地落地的方法论。
南方电网人工智能科技有限公司副总经理、南方电网公司高级技术专家梁寿愚表示,南方电网以高智慧产品和解决方案为导向,在垂直领域发力,将针对智能客服场景完成二次训练,实现智能机器人、智能客服助手、智能质检、智能外呼、智能知识库等功能。预计2023年底,高频业务实现“机器代人”的比例将由60%提高到80%。
此外,位于深圳的鹏城实验室近期也发布消息称,将推出“鹏城·脑海”大模型计划,打造安全可控、开源开放的自然语言预训练大模型底座,尤其是面向数字政务、智慧金融、智能制造等应用场景。
大模型的价值
基于对大模型的认知,中国联通研究院智能技术研究部吴浩然表示,从商业价值角度讲,中国联通等运营商布局大模型领域是必要的。运营商在移动互联网时代未能利用好流量成为管道运营商,在智能互联时代将积极尝试转变,成为新时代的综合数字服务运营商。
在清华大学人工智能研究院视觉智能研究中心主任邓志东看来,大模型的价值在于应用,要在多样化的实际应用场景中赋能智能经济与智能社会的发展。
中国工程院院士邬贺铨认为,除了对话、写诗、作画等应用之外,要将大模型切实投入到城市发展、金融科技、生物医药、工业制造、科学研究等领域,在实体产业落地,为社会经济带来实实在在的价值。
赛迪顾问公司的研究报告显示,从大模型应用类型来看,国外研发的大模型主要以通用大模型为主,而中国国产大模型更加贴近产业端,呈现出行业大模型占比较高的发展形态。
业界人士认为,以大模型生成技术为核心,人工智能正在成为下一轮数字化发展的关键动力,为解决产业痛点带来全新的思路。
例如,在助力战略性新兴产业发展方面,大模型能够通过对海量数据的分析和挖掘,提供更加精准的市场预测和分析,提高战略规划和决策的科学性和准确性;大模型可以应用于新产品研发、生产制造、供应链管理等领域,提高生产效率和质量,降低成本;此外,大模型还可以应用于智慧城市、智能交通等领域,推动新兴产业和传统产业的深度融合。
中国电信大数据和AI中心/数字智能科技分公司产品和解决方案中心总经理刘翼向外界表示,目前,央企正在积极探索大模型的商业模式,具体包括三种产品形态,一是众所周知的行业大模型;二是搭建大模型的开发和训练平台,让其他大模型来训练研发;三是大模型的软硬一体化产品,即提供“算力+大模型+大模型开发服务+场景”工具箱。
同时,国资央企正在探索形成“大模型研发—应用—合作”的方法路径,构建良性生态,全面研判并应对人工智能发展带来的风险及挑战。
模态融合是发展趋势
“在研发鸿湖图文大模型时,中国联通也在探讨大模型产业的未来发展趋势。”吴浩然说,大模型主要有四大发展趋势,第一,模态融合是最大的发展趋势。单模态大模型仍称不上为通用人工智能,融合所有模态再进一步发展后,才能迎来真正的通用人工智能时代。
第二,混合专家系统类思路是目前大模型落地比较优质的路径。过去十几年来,人工智能尤其是深度学习技术的发展积累了很多优质的模型,将大模型与这些模型结合,乃至将大模型与各类数字化系统结合、与机器部件结合,将是未来大模型由纯数字经济,向数字经济赋能实体经济转变的重要途径。
第三,大模型稀疏化是未来大模型落地的重要路径之一。当前大模型参数量仍呈快速增长态势,稠密大模型的计算推理势必将占用极大的算力资源,阻碍大模型的快速落地和泛在服务。而大模型稀疏化将极大降低大模型的部署成本,提高推理速度,使大模型真正“飞入寻常百姓家”。
第四,大模型短期内仍会以C端场景为主落地。B端由于存在大量判别式场景,仍需模型能力进一步增强。但长期来看,能否解决判别式场景的高精度同时保持高度泛化能力,是未来大模型能否在B端广泛应用的决定性因素,可以说C端决定未来大模型的下限,B端决定未来大模型的上限。
大模型的性能主要受算力、数据、算法三方面因素影响。在算法方面,国产大模型与国际先进水平相比没有根本性差异,基本是围绕深度神经网络、注意力机制、人工调优等基础算法上进行模型结构或局部算法优化,而在算力、数据等方面则与国际先进水平存在差距。
业界普遍认为,未来应从算力、数据等方面进一步夯实国产大模型根基。具体包括,第一,加快推进算力基础设施建设。推进鹏城云脑三期等国家重大算力基础设施建设,并以此为基础进一步形成覆盖全国的算力网络,使得算力的供给与使用像电网、水网一样触手可及。此外,建设技术创新中心、生态实验室等平台,加强中试与验证,带动产业链上下游企业共同攻关突破新技术、研发新产品。
第二,建立可信数据联盟,为国产大模型训练提供安全的高质量数据,组建面向人工智能大模型的可信数据联盟,提供高质量的丰富中文语料库,打造数字时代“四库全书”。
第三,打造关键领域大模型建设的标杆示范工程,发挥标杆示范工程的引领带动作用,带动各行业积极融入大模型发展进程,加快形成一批符合国家需求的软硬件产品和解决方案,形成需求牵引供给、供给创造需求的良性循环。
评论