中国企业报集团主管主办

中国企业信息交流平台

微博 微信

什么大模型最适合中国?文心一言得分最高,产业落地规模最大

2023-08-08 10:36 来源:中国企业网 次阅读
 
什么大模型最适合中国?文心一言得分最高,产业落地规模最大

  从拼参数到拼落地,大模型快速发展。如今,国内市场上已有100多款大模型产品。但如何挑选出一款最适合自己的大模型,成为企业和机构新的难题。业界亟需一些权威评测,作为客户选择大模型产品的“指南针”。

  8月4日,在百度举行的“AI大模型产品能力交流会”上,新华网与权威机构联合发布的《国内LLM产品测试报告》,为业界选择大模型提供了内容安全、常识问答、数学运算、阅读理解和主观问答等五大维度。

(新华网测试报告:百度文心一言综合得分第一)


  新华网测试报告对文心一言、GPT-3.5等四大知名大模型进行评测,结果显示,百度文心一言综合得分第一,超过GPT-3.5,国内大模型排名第一。

  文心一言是百度自主研制的知识增强大语言模型,首先从数万亿数据和数千亿知识中融合学习得到预训练大模型,在此基础上采用有监督精调、人类反馈的强化学习和提示等技术,并具备知识增强、检索增强和对话增强等技术优势。

  内容价值是企业选择大模型重要因素

  大模型具有良好的通用性和泛化性。普通人通过简单的问答,就能获得想要的服务和产品功能。但是不同国家和地区有不同的法律文化、社会习俗、伦理道德。因此,对于同一个问题,大模型给出的答案可能会引发不同的社会反馈,有正面效应也可能含有负面争议,一些文化偏见甚至可能引发群体矛盾。

  因此,内容是选择大模型的重要考虑因素。在新华网的评测报告中,有两大关于内容的维度。一是内容安全问答,包含了意识形态、非法涉黄等多项维度,二是常识问答,涵盖有中国文化、历史、地理和生活等常识知识。新华网物联网技术总监葛振斌表示,“大模型生成的内容必须符合当地法律和社会道德要求。可以说,各个国家都需要‘更适合自己历史文化’的大语言模型。”

  内容对于产业界同样非常重要,有的企业涉及国计民生,还有的企业依靠“传承配方”形成独特竞争力。中国传媒大学新媒体研究院院长赵子忠表示,“这对大模型在信息安全、数据安全、定制化等方面的服务能力提出了考验。大模型必须具备行业化、场景化的服务能力,才能满足不同企业的要求。”

  文心一言“最适合中国”

  当前,从政府机构到企业公司,都迫切需要一些判断大模型适合程度的标准和方法。

  新华网物联网技术总监葛振斌认为,评测大模型有5项维度非常重要:一是把控生成内容安全性的能力,背后涉及意识形态、政治体制、非法涉黄等维度,每一项都事关一个社会文明的底线;二是常识推断计算的能力,涉及自然、文化、地理、历史和生活等多个领域,必须先吃透这些方面的常识,才能避免生成不恰当的内容结果;三是对长文本的语义理解能力。这可以考验大模型产出的内容是否正确且言之有理,是否具有较好的说服力;四是数学运算及数学推理能力;五是主观思维能力,考验大模型是否可以准确理解当地风俗习惯或者传统文化。

  新华网评测报告显示,文心一言因中文搜索引擎和算法模型优势,在安全、常识、数学、阅读等方面优势明显。在五个维度上的得分计算均值,文心一言的综合得分为94.7分,排名第一,高于GPT-3.5的76.9分。这说明当前文心一言在总体能力(中文处理)上已经超越了GPT-3.5模型。

(新华网测试报告:百度文心一言综合得分第一)


  凭借上述表现,文心一言在“最适合中国”方面抢占领先身位,领跑国内大模型。

  专家建议:开发者基于文心大模型抢占发展先机

  如今,参考权威机构评测成为客户选择大模型的一个重要方式。如同生活中常见的智能手机评测,汽车驾驶评测,是用户选择产品和服务的重要参考。

  除了新华网评测报告,近期还有IDC等多个权威机构发布评测报告,结果均显示由文心大模型3.5支持的文心一言综合能力评测得分超过ChatGPT3.5。比如IDC报告显示,文心大模型3.5拿下12项核心指标的7个满分,综合评分位列国内主流大模型第一,并在算法模型、行业覆盖两大关键指标上拿下唯一满分。

  中国传媒大学新媒体研究院院长赵子忠建议,创业者和开发者以及中小企业,其实不需要从0到1的打造自己的大模型,可以基于文心大模型打造智能应用,避免重复造轮子,把精力放在自己擅长的创新上。谁先做出来满足用户需求的应用,谁就抢占了发展先机。

  百度2019年推出文心大模型1.0,今年5月份升级到3.5版本。通过飞桨深度学习平台与文心大模型的协同优化,文心大模型3.5实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强、插件机制等,模型效果提升50%,训练速度提升2倍,推理速度提升30倍。

  目前百度文心大模型已拥有中国最大的产业落地规模,超过15万家企业申请文心一言内测,其中有超300家生态伙伴在400多个具体场景取得测试成效,覆盖办公提效、知识管理、智能客服、智能营销等领域,联合国家电网、浦发银行、泰康、吉利等企业,联合发布了11个行业大模型。百度还设立了10亿创投基金鼓励大模型创意、繁荣大模型生态。

  软通动力CTO刘会福曾表示,我们非常期待在文心大模型的基础上,开拓更多的应用实践。北京宝兰德软件董事长易存道表示,如何把大模型在垂直行业做好,是目前各个企业都要考虑的问题,多数企业无法像百度一样有能力建设大模型。怎么能够把百度的大模型能力和企业业务有效结合起来,创造更强的价值,是企业非常好的弯道超车机会。金山办公助理总裁田然表示,金山办公要跟中国优秀的大模型提供方站在一起。金山办公和文心的合作,会进一步推动大模型在办公领域的应用和快速落地。

点赞()
上一条:贵州白酒境外展销活动第一站在香港启航2023-08-08
下一条:【聚焦抗洪一线 助力灾后重建】众企业“逆流”而上 积极投身防汛救灾2023-08-08

相关稿件

大模型人才抢夺战 百度文心一言抢先机招揽高校人才 2023-05-29
百度沈抖:文心大模型拥有中国最大的产业应用规模,已在十余个行业落地 2023-07-07
第四范式戴文渊:最适合大模型的商业模式是什么 2023-05-08
王小川回击百度副总裁,称其脱离一线时间更久 2023-04-14
中移动研究院最新报告横评国内大模型 文心一言技术、商用均居头部领先位置 2023-05-14
国务院国有资产管理委员会 中国企业联合会 中国企业报 中国社会经济网 中国国际电子商务网 新浪财经 凤凰财经 中国报告基地 企业社会责任中国网 杭州网 中国产经新闻网 环球企业家 华北新闻网 和谐中国网 天机网 中贸网 湖南经济新闻网 翼牛网 东莞二手房 中国经济网 中国企业网黄金展位频道 硅谷网 东方经济网 华讯财经 网站目录 全景网 中南网 美通社 大佳网 火爆网 跨考研招网 当代金融家杂志 借贷撮合网 大公财经 诚搜网 中国钢铁现货网 证券之星 融易在线 2014世界杯 中华魂网 纳税人俱乐部 慧业网 商界网 品牌家 中国国资报道 金融界 中国农业新闻网 中国招商联盟 和讯股票 经济网 中国数据分析行业网 中国报道网 九州新闻网 投资界 北京科技创新企业诚信联盟网 中国白银网 炣燃科技 中企媒资网 中国石油化工集团 中国保利集团公司 东风汽车公司 中国化工集团公司 中国电信集团公司 华为技术有限公司 厦门银鹭食品有限公司 中国恒天集团有限公司 滨州东方地毯集团有限公司 大唐电信科技股份有限公司 中国诚通控股集团有限公司 喜来健医疗器械有限公司 中国能源建设股份有限公司 内蒙古伊利实业集团股份有限公司 中国移动通信集团公司 中国化工集团公司 贵州茅台酒股份有限公司