中国大模型肉搏：得技术者胜，得产业者强

中国大模型肉搏：得技术者胜，得产业者强: 2023-07-24 16:28 来源：次阅读; 分享：
微信扫一扫：分享
微信里点“发现”，扫一下
二维码便可将本文分享至朋友圈。

　　大模型，洗牌开始了AI大模型扇动翅膀，掀起了历史的波澜。但没人想到，浪潮仅仅卷过半年，就将迎来一次彻底的大洗牌。去年11月30日，ChatGPT正式发布，2个月用户过亿。今年6月，ChatGPT流量开始下滑。网站与移动客户端流量环比下跌9.7%，用户在网站的使用时长下降8.5%。这被解读成AI泡沫的一个征兆：初期新鲜感消失，AI要回到现实；另一猜测，是OpenAI的对手强者如云，它并没有真正的技术护城河。

　　谷歌内部文件泄密泄露：我们没有护城河，OpenAI也没有OpenAI迅速给GPT-4安排上Code Interpreter功能，赚足一波眼球。“这就是GPT-4.5！”人们欢呼。然而，Meta（前Facebook）突然动手，直接将自己的大语言模型Llama 2开源了。Llama 2的水平在GPT-3之上。它的免费开源商用，简直是一次杀手级的突袭，堪称“AI大模型的安卓时刻”。这意味着，许多公司尚在研发的大模型，已被淘汰了。因为别人可以直接用开源模型，免费的。国内的AI进程，更加热火朝天。今年3月，百度首个发布了“文心一言”，开启国产大模型“超越ChatGPT”之路。120天狂飙突进，互联网科技公司、学术界大牛、大厂创业者、地方国家队纷纷下场。国内发布了79款10亿参数以上的大模型。

　　不过，行业和专家都提出了质疑：这么多的大模型，同质化严重吗？谁的技术更强？谁在更快进入产业，解决问题？这个风头上，国际数据公司IDC发布了《AI大模型技术能力评估报告，2023》，想要设立一些标准。IDC围绕产品技术、行业应用、服务生态三个维度，设计了36项评估标准，对头部大模型进行测评。目前，国内的百度、阿里、腾讯、华为、科大讯飞、360、商汤等14家厂商都在评估之中。

　　从结果看，百度的文心大模型3.5综合评分最高。并且，在算法模型、行业覆盖上，都拿到唯一的满分。文心从发布后一直在迭代。文心大模型3.5相比之前，模型效果已提升了50%，训练速度提升2倍，推理速度提升了30倍。多个公开测评显示，文心3.5的综合能力已超过ChatGPT 3.5。在中文能力上，已有超出GPT-4的表现，拉平了中美的技术差。AI大模型第一战正式结束，参赛者站在十字路口。超越GPT-3的开源模型，还会继续出现。通用大模型注定是少数人的游戏，留下技术最顶尖的。更多创业者将集中到中间层、应用层，在这些基础模型之上做创新。IDC中国高级分析师杨雯表示：

　　AI大模型的主要价值体现在技术、应用以及商业化3个方面：在技术方面，AI大模型带来了认知智能技术跨越式发展；在应用方面，AI大模型可以为人类提供更加精准和高效的服务；在商业化方面，AI大模型将会带来软件入口级的颠覆，并促进上层生态发展。

　　国内大模型公司，在迅速形成共识：技术差距追平后，产业纵深和商业化能力，是下一阶段的战场。

　　大模型，扎堆进产业前几天，我们在WAIC世界人工智能大会上，几乎只能看到中美的公司。行业客户们围在各个大厂的展台前，最想知道两件事：AI到底能解决什么问题？怎么卖，卖多少钱？

　　WAIC的现场目前的大模型参数规模太大，加上算力成本极高，暂时还无法降低价格。动辄千万、上亿的部署成本，让人望而却步。在具体的行业场景，尤其是一些专业性强、知识密度高的领域，大模型的表现也还不够精准。行业大模型、产业落地、赋能千行百业，成为各大厂商给出的标准答案。百度文心大模型，提出源于产业实践，服务于产业实践；华为云的盘古大模型，喊出了“不做诗，只做事”，聚焦行业场景和垂直领域；腾讯云也认为，“企业需要的，是在实际场景中真正解决了某个问题，而不是在100个场景中，解决了70-80%的问题”，他们探索了超50个行业大模型的应用解决方案；京东言犀大模型，也是立足做产业大模型，要“把供应链做透，把大模型做实”。这些厂商身上，透出一股极为务实、“接地气”的气质。这有些反常的。更多想象的AI研究者，在科研机构、实验室里把技术打磨成熟，像ChatGPT，而非直接到行业中应用。背后真相是，仅在过去10年，国内就经历了两轮AI创业潮。但幸存者寥寥。

　　“AI教父”Geoffrey Hinton2012年的ImageNet大赛，“图灵三巨头”中的杰弗里·辛顿以卷积神经网络夺冠，让深度学习火了。学院派们下场创业，如科大讯飞、商汤、旷视、云从等AI公司成为资本宠儿。

　　纪录片AlphaGo剧照2016年，AlphaGo战胜围棋冠军李世石，AI真正意义上出圈了。AI创业和融资进入高峰期，互联网大厂全部入局。

　　2012-2023人工智能融资趋势70%的中国AI公司成立于2014-2018年，但90%的公司到2019年还深陷亏损。在技术研发和产业落地之间，隔着一个复杂的现实鸿沟。大部分创业者没熬到今年的AI潮。而“活下来”的AI公司，也都领悟到了：人工智能一定要落地去解决问题，才能形成良性的商业模式，才能持续创造价值。所以AI大模型们，都争先恐后往行业里钻。

　　千行百业，用大模型重做一遍产业落地跑在前面的公司，都已布局了十几年。他们从之前的云计算、互联网+、企业软件、新基建潮、产业互联网时期，就在积累行业合作者和高质量数据。在帮助行业数字化期间，他们就是从一线场景、复杂问题、庞杂需求的摔打里练出来的。在IDC评估中，百度文心拿到了唯一的行业覆盖度满分，因为其AI在能源、金融、教育、城市、工业、医疗等领域都有布局和落地。

　　制造业的产业升级，是大家的期待。在2008年，中国有4500种商品要靠进口，很多是技术和工业品，比如集成电路、屏幕、汽车、工业设备。到今天，我们很多技术实现了自立自强，比如大飞机、新能源汽车、液晶显示面板。很多工厂的智能化，是从质检环节开始的。过去，一条流水线要十几个质检工人，人工的效率很低，即便之后有了工业视觉的辅助，也是一份辛苦、附加值很低的工作。显示面板又是典型的高精产品，生产工序复杂、精密，良品率极为关键，几微米的瑕疵也无法容忍。TCL与百度文心合作，构建了电子制造行业大模型。将训练样本减少30%-40%，还让TCL两个产线检测mAP指标平均提升10%+，新产线冷启动效率提升3倍，产线上线开发周期降低30%。而在汽车制造，百度与长安汽车的合作又不同。汽车设计需要经验丰富的工程师，在2万多种零部件、几十万个参数里，去寻找满足需求的排列组合，再写成文档、画出图纸。通过百度大模型，可以迅速进行信息组合，自动生成设计文档，大幅减少了汽车研发的时间和成本。如果把行业大模型的能力，从一个工厂放大到一座城市，就是百度打造的智能交通解决方案。今年的五一，居民旅游出行达到高峰。假期前的最后一个工作日，北京城市的拥堵指数暴增了2.5倍，从二环堵到了六环。亦庄，成了当时北京唯一不堵车的“绿洲”。因为当地部署AI全域信控方案，亦庄300多个智能路口，都能根据车流量自动调节红绿灯。

　　同样的AI交通已经在国内69个城市落地。根据百度测算，这能让通行效率提升15%-30%，从而拉动GDP2.4%-4.8%的增长。除此之外，百度文心还和浦发银行打造金融行业大模型，与国家电网做电力大模型，还打造了政务、汽车、城市、航天、传媒等11个行业大模型。数字化程度高的企业，有数据积累、人才团队、基础设施，落地大模型应用相应也会走得更快。绝大部分中小企业还未数字化，他们并非没有机会，但更需要低成本、低门槛、开箱即用的系列产品。湖北襄阳一位铁路工人，靠自学使用百度飞桨的开发套件，独立实现了从建设数据集、到模型训练、再到模型部署的整套流程，做了一个自动识别火车车号的应用程序。以前检查货运火车的车号，往往要人工核对数小时，襄阳车辆段用了这个程序后，只用3分钟就能做完，给当地车辆段节省了20多万的成本。研究机构Epoch估算，AI和大模型训练，要不了3年时间，在2026年就会耗尽所有高质量数据。

左起：低质量文本、高质量文本、图像数据耗尽时间数据是未来AI竞争的一个胜负点。把AI普及的门槛不断降低，到产业落地中去，产生和积累更多高质量数据。这个过程中，AI能力也会不断迭代，更符合行业需求，从而开启增长的飞轮。

　　百度集团执行副总裁、百度智能云事业群总裁沈抖说，未来所有企业都将强依赖大模型，所有产品都会基于大模型开发。

　　百度文心，AI十年技术+产业落地的先跑，是百度过去十年All in AI，战略转向最好的嘉奖。现如今，百度是全球少数在芯片、架构、大模型、产业应用上，都拥有先进自研技术的企业。与微软、谷歌、Meta一起，被评为全球四大AI公司。算力和芯片是当下焦点。大模型的基础层需要数以万计的芯片，而英伟达GPU面临断供。百度自研有昆仑芯，目前已部署几万片，并对外向行业输出。第三代的昆仑芯片预计在2024年初就会量产。同时，百度智能云在山西阳泉修建了亚洲最大单体智算中心，每秒可以完成4EFLOPS（400亿亿次浮点运算），满足文心的训练和推理。在框架层，百度的飞桨PaddlePaddle是中国首个开源的产业级深度学习框架，替代谷歌TensorFlow和Meta的Pytorch，在中国的市场综合份额排第一。

　　模型层的文心大模型，包含30多个大模型，分为基础大模型、任务大模型、行业大模型三级体系，全面满足产业需求。

　　百度内部的产品，如搜索、信息流、地图等，都已在进行AI原生重构。同时，飞桨长期深耕产业落地，连接着750万的开发者，20万家企事业单位。文心共享飞桨生态，解决了大模型研发和部署难题，加快文心的产业落地。作为AI的领军者，百度不但培育出本土化的中国AI平台和工具，还在搭建一个教育、产业、开发社区的AI生态，要在5年为社会培养500万AI人才，补充国内AI人才缺口。今年5月，百度也宣布设立10亿元的百度文心投资基金，鼓励投资中国的AI创业者，鼓励他们文心大模型的能力、百度智能云的算力，去开发和创新。

　　百度创始人李彦宏说：

　　新的国际竞争战略关键点，不是一个国家有多少个大模型，而是你的大模型上有多少原生的AI应用，这些应用在多大程度上提升了生产效率。

　　如果我们能挤上牌桌，获得竞赛入场券，中国将拥有更壮大的数字化产业，数字经济规模将获得巨大增长。”我们总是高估未来2年的变化，而又低估未来10年的变革。不管你叫它智能时代、第四次工业革命，人工智能是用技术变革，打破一切格局的难得机遇。大模型推动的历史车轮，才刚刚开始。接下来的十年，注定也属于AI。先期的泡沫会不断释放，大模型公司不断洗牌，这是必然的过程。在产业落地的进程中，留下那些能真正走进行业，去解决问题、创造生态的公司。