近日,围绕火爆全网的ChatGPT话题,联想集团CTO、高级副总裁芮勇博士接受了《中国计算机学会通讯》(CCCF)的专访,并分享了对ChatGPT等大模型的看法。芮勇表示,联想新IT架构将在AI新范式加速智能化变革的过程中继续发挥重要作用。除了基础架构之外,联想还在考虑AIGC技术在产品和业务里的应用。
从大模型到AGI还有多远?
ChatGPT是OpenAI GPT系列中为对话场景优化的语言模型,属于Foundation Models,即基础模型,简称为“大模型”。芮勇将它的特点概括为“一大三多”:一大是指参数规模大,是千亿参数级别的超大型人工智能模型;三多是指利用多来源、多模态、多任务的互联网规模海量数据进行训练。
芮勇认为,大模型首先在内容理解领域大获成功,例如BERT问世时刷新了11项自然语言理解任务的记录,最近又在内容生成领域取得了瞩目成就,也就是AIGC。
对于外界普遍关心的大模型是否催生了AI新范式,芮勇给出的答案是,简单来讲,AI范式的转变,是从“针对特定任务,更新预训练模型”(small models + fine-tuning)转换到“根据上下文提示自动理解并执行各类任务,无需更新模型参数或架构”(large models + in-context learning)。
ChatGPT的成功,让业界看到了由大模型通往AGI (通用人工智能) 的曙光,不过,芮勇认为,大模型能走多远,前景到底如何,是否能实现“多任务,多模态,多化身的大一统”,目前还颇有争议。
他进一步解释,近几年大模型有了突破式进展,很多人持乐观态度。从Gartner技术成熟度曲线可以看到,大模型目前处于“期望膨胀阶段”(Peak of Inflated Expectations) 。人们对它的期望很高,但也应该看到,大模型尚未解决的问题还很多。比如谷歌版的ChatGPT,取名Bard,首次公开展示就出现回答结果不准确的问题,导致公司市值一天之内蒸发超1000亿美元。此外,对话机器人生成句子里包含的信息无法溯源,甚至包含偏向性和冒犯性言论等等。可见,通往AGI的道路还很漫长。
联想在大模型普及中发挥怎样的作用?
大模型的兴起,为进行智能化变革的企业带来了很多新的机遇。芮勇以联想为例进行了介绍。联想借鉴大模型背后的基础性算法,将小样本学习应用到基于计算机视觉的产品缺陷检测当中,提升了质检系统对新产品和新产线的快速迁移能力;此外,联想还将强化学习技术和人机协作的理念应用到供应链优化当中,使得供应链在剧烈变化的环境中,不断提升韧性。
对于联想将在AI新范式和大模型普及中发挥怎样的作用,芮勇表示,长远来看,很有可能AI新范式(large models + in-context learning)与旧范式(small models + fine-tune)共存,或是相互结合,而不会单个范式一统天下。联想将充分发挥“端-边-云-网-智”新IT架构的优势,来支撑新旧范式的结合与转换。联想提出的新IT架构,既致力于推动自身的智能化变革,也着眼于赋能各行各业的智能化转型。AI模型对运行环境需求越来越高,例如云-边-端的高度协同,异构计算与负载均衡、设备之间的互联互通、数据安全与隐私保护、模型本身的伸缩性与扩展性等等。联想在这些方面都有着深厚的技术积累,新IT架构在AI新范式加速智能化变革的过程中也会继续发挥重要作用。
除了基础架构之外,联想还在考虑AIGC技术在产品和业务里的应用。比如,在智能设备中对跨模态的生成模型进行优化和裁剪,使之能加载到手机或平板上实现个性化内容生成。在智能解决方案方面,我们考虑把AIGC用于新产品营销与新客户触达。目前,大模型还没有与知识有效结合,我们正在研究数据驱动与知识驱动相结合的方法,即Hybrid Learning来改进大模型的不足。另外,在大模型落地过程中,也需要彻底解决对环境变化或是新领域、新任务的自适应问题,即Adaptive Learning,这些都是联想人工智能的探索方向。
相关稿件