大模型,洗牌开始了AI大模型扇动翅膀,掀起了历史的波澜。但没人想到,浪潮仅仅卷过半年,就将迎来一次彻底的大洗牌。去年11月30日,ChatGPT正式发布,2个月用户过亿。今年6月,ChatGPT流量开始下滑。网站与移动客户端流量环比下跌9.7%,用户在网站的使用时长下降8.5%。这被解读成AI泡沫的一个征兆:初期新鲜感消失,AI要回到现实;另一猜测,是OpenAI的对手强者如云,它并没有真正的技术护城河。
谷歌内部文件泄密泄露:我们没有护城河,OpenAI也没有OpenAI迅速给GPT-4安排上Code Interpreter功能,赚足一波眼球。“这就是GPT-4.5!”人们欢呼。然而,Meta(前Facebook)突然动手,直接将自己的大语言模型Llama 2开源了。Llama 2的水平在GPT-3之上。它的免费开源商用,简直是一次杀手级的突袭,堪称“AI大模型的安卓时刻”。这意味着,许多公司尚在研发的大模型,已被淘汰了。因为别人可以直接用开源模型,免费的。国内的AI进程,更加热火朝天。今年3月,百度首个发布了“文心一言”,开启国产大模型“超越ChatGPT”之路。120天狂飙突进,互联网科技公司、学术界大牛、大厂创业者、地方国家队纷纷下场。国内发布了79款10亿参数以上的大模型。
不过,行业和专家都提出了质疑:这么多的大模型,同质化严重吗?谁的技术更强?谁在更快进入产业,解决问题?这个风头上,国际数据公司IDC发布了《AI大模型技术能力评估报告,2023》,想要设立一些标准。IDC围绕产品技术、行业应用、服务生态三个维度,设计了36项评估标准,对头部大模型进行测评。目前,国内的百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商都在评估之中。
从结果看,百度的文心大模型3.5综合评分最高。并且,在算法模型、行业覆盖上,都拿到唯一的满分。文心从发布后一直在迭代。文心大模型3.5相比之前,模型效果已提升了50%,训练速度提升2倍,推理速度提升了30倍。多个公开测评显示,文心3.5的综合能力已超过ChatGPT 3.5。在中文能力上,已有超出GPT-4的表现,拉平了中美的技术差。AI大模型第一战正式结束,参赛者站在十字路口。超越GPT-3的开源模型,还会继续出现。通用大模型注定是少数人的游戏,留下技术最顶尖的。更多创业者将集中到中间层、应用层,在这些基础模型之上做创新。IDC中国高级分析师杨雯表示:
AI大模型的主要价值体现在技术、应用以及商业化3个方面:在技术方面,AI大模型带来了认知智能技术跨越式发展;在应用方面,AI大模型可以为人类提供更加精准和高效的服务;在商业化方面,AI大模型将会带来软件入口级的颠覆,并促进上层生态发展。
国内大模型公司,在迅速形成共识:技术差距追平后,产业纵深和商业化能力,是下一阶段的战场。
大模型,扎堆进产业前几天,我们在WAIC世界人工智能大会上,几乎只能看到中美的公司。行业客户们围在各个大厂的展台前,最想知道两件事:AI到底能解决什么问题?怎么卖,卖多少钱?
WAIC的现场目前的大模型参数规模太大,加上算力成本极高,暂时还无法降低价格。动辄千万、上亿的部署成本,让人望而却步。在具体的行业场景,尤其是一些专业性强、知识密度高的领域,大模型的表现也还不够精准。行业大模型、产业落地、赋能千行百业,成为各大厂商给出的标准答案。百度文心大模型,提出源于产业实践,服务于产业实践;华为云的盘古大模型,喊出了“不做诗,只做事”,聚焦行业场景和垂直领域;腾讯云也认为,“企业需要的,是在实际场景中真正解决了某个问题,而不是在100个场景中,解决了70-80%的问题”,他们探索了超50个行业大模型的应用解决方案;京东言犀大模型,也是立足做产业大模型,要“把供应链做透 ,把大模型做实”。这些厂商身上,透出一股极为务实、“接地气”的气质。这有些反常的。更多想象的AI研究者,在科研机构、实验室里把技术打磨成熟,像ChatGPT,而非直接到行业中应用。背后真相是,仅在过去10年,国内就经历了两轮AI创业潮。但幸存者寥寥。
“AI教父”Geoffrey Hinton2012年的ImageNet大赛,“图灵三巨头”中的杰弗里·辛顿以卷积神经网络夺冠,让深度学习火了。学院派们下场创业,如科大讯飞、商汤、旷视、云从等AI公司成为资本宠儿。
纪录片AlphaGo剧照2016年,AlphaGo战胜围棋冠军李世石,AI真正意义上出圈了。AI创业和融资进入高峰期,互联网大厂全部入局。
2012-2023人工智能融资趋势70%的中国AI公司成立于2014-2018年,但90%的公司到2019年还深陷亏损。在技术研发和产业落地之间,隔着一个复杂的现实鸿沟。大部分创业者没熬到今年的AI潮。而“活下来”的AI公司,也都领悟到了:人工智能一定要落地去解决问题,才能形成良性的商业模式,才能持续创造价值。所以AI大模型们,都争先恐后往行业里钻。
千行百业,用大模型重做一遍产业落地跑在前面的公司,都已布局了十几年。他们从之前的云计算、互联网+、企业软件、新基建潮、产业互联网时期,就在积累行业合作者和高质量数据。在帮助行业数字化期间,他们就是从一线场景、复杂问题、庞杂需求的摔打里练出来的。在IDC评估中,百度文心拿到了唯一的行业覆盖度满分,因为其AI在能源、金融、教育、城市、工业、医疗等领域都有布局和落地。
制造业的产业升级,是大家的期待。在2008年,中国有4500种商品要靠进口,很多是技术和工业品,比如集成电路、屏幕、汽车、工业设备。到今天,我们很多技术实现了自立自强,比如大飞机、新能源汽车、液晶显示面板。很多工厂的智能化,是从质检环节开始的。过去,一条流水线要十几个质检工人,人工的效率很低,即便之后有了工业视觉的辅助,也是一份辛苦、附加值很低的工作。显示面板又是典型的高精产品,生产工序复杂、精密,良品率极为关键,几微米的瑕疵也无法容忍。TCL与百度文心合作,构建了电子制造行业大模型。将训练样本减少30%-40%,还让TCL两个产线检测mAP指标平均提升10%+,新产线冷启动效率提升3倍,产线上线开发周期降低30%。而在汽车制造,百度与长安汽车的合作又不同。汽车设计需要经验丰富的工程师,在2万多种零部件、几十万个参数里,去寻找满足需求的排列组合,再写成文档、画出图纸。通过百度大模型,可以迅速进行信息组合,自动生成设计文档,大幅减少了汽车研发的时间和成本。如果把行业大模型的能力,从一个工厂放大到一座城市,就是百度打造的智能交通解决方案。今年的五一,居民旅游出行达到高峰。假期前的最后一个工作日,北京城市的拥堵指数暴增了2.5倍,从二环堵到了六环。亦庄,成了当时北京唯一不堵车的“绿洲”。因为当地部署AI全域信控方案,亦庄300多个智能路口,都能根据车流量自动调节红绿灯。
同样的AI交通已经在国内69个城市落地。根据百度测算,这能让通行效率提升15%-30%,从而拉动GDP2.4%-4.8%的增长。除此之外,百度文心还和浦发银行打造金融行业大模型,与国家电网做电力大模型,还打造了政务、汽车、城市、航天、传媒等11个行业大模型。数字化程度高的企业,有数据积累、人才团队、基础设施,落地大模型应用相应也会走得更快。绝大部分中小企业还未数字化,他们并非没有机会,但更需要低成本、低门槛、开箱即用的系列产品。湖北襄阳一位铁路工人,靠自学使用百度飞桨的开发套件,独立实现了从建设数据集、到模型训练、再到模型部署的整套流程,做了一个自动识别火车车号的应用程序。以前检查货运火车的车号,往往要人工核对数小时,襄阳车辆段用了这个程序后,只用3分钟就能做完,给当地车辆段节省了20多万的成本。研究机构Epoch估算,AI和大模型训练,要不了3年时间,在2026年就会耗尽所有高质量数据。
左起:低质量文本、高质量文本、图像数据耗尽时间数据是未来AI竞争的一个胜负点。把AI普及的门槛不断降低,到产业落地中去,产生和积累更多高质量数据。这个过程中,AI能力也会不断迭代,更符合行业需求,从而开启增长的飞轮。
百度集团执行副总裁、百度智能云事业群总裁沈抖说,未来所有企业都将强依赖大模型,所有产品都会基于大模型开发。
百度文心,AI十年技术+产业落地的先跑,是百度过去十年All in AI,战略转向最好的嘉奖。现如今,百度是全球少数在芯片、架构、大模型、产业应用上,都拥有先进自研技术的企业。与微软、谷歌、Meta一起,被评为全球四大AI公司。算力和芯片是当下焦点。大模型的基础层需要数以万计的芯片,而英伟达GPU面临断供。百度自研有昆仑芯,目前已部署几万片,并对外向行业输出。第三代的昆仑芯片预计在2024年初就会量产。同时,百度智能云在山西阳泉修建了亚洲最大单体智算中心,每秒可以完成4EFLOPS(400亿亿次浮点运算),满足文心的训练和推理。在框架层,百度的飞桨PaddlePaddle是中国首个开源的产业级深度学习框架,替代谷歌TensorFlow和Meta的Pytorch,在中国的市场综合份额排第一。
模型层的文心大模型,包含30多个大模型,分为基础大模型、任务大模型、行业大模型三级体系,全面满足产业需求。
百度内部的产品,如搜索、信息流、地图等,都已在进行AI原生重构。同时,飞桨长期深耕产业落地,连接着750万的开发者,20万家企事业单位。文心共享飞桨生态,解决了大模型研发和部署难题,加快文心的产业落地。作为AI的领军者,百度不但培育出本土化的中国AI平台和工具,还在搭建一个教育、产业、开发社区的AI生态,要在5年为社会培养500万AI人才,补充国内AI人才缺口。今年5月,百度也宣布设立10亿元的百度文心投资基金,鼓励投资中国的AI创业者,鼓励他们文心大模型的能力、百度智能云的算力,去开发和创新。
百度创始人李彦宏说:
新的国际竞争战略关键点,不是一个国家有多少个大模型,而是你的大模型上有多少原生的AI应用,这些应用在多大程度上提升了生产效率。
如果我们能挤上牌桌,获得竞赛入场券,中国将拥有更壮大的数字化产业,数字经济规模将获得巨大增长。”我们总是高估未来2年的变化,而又低估未来10年的变革。不管你叫它智能时代、第四次工业革命,人工智能是用技术变革,打破一切格局的难得机遇。大模型推动的历史车轮,才刚刚开始。接下来的十年,注定也属于AI。先期的泡沫会不断释放,大模型公司不断洗牌,这是必然的过程。在产业落地的进程中,留下那些能真正走进行业,去解决问题、创造生态的公司。
相关稿件