百度股价三天连涨了12.8%。看网上评论和分析,应该是与上周(3月16日)发布了被称为“中国版ChatGPT”生成式对话产品“文心一言”有关。
随着美国OpenAI研发的聊天机器人程序ChatGPT的推出,最近一个时期,有关ChatGPT和AI是网上、微信群讨论的热门话题。我归纳了一下,讨论的主题主要集中在两个方面,一是AI未来会如何发展,将会给人类的未来带来什么?二是中国与美国在这方面有多大差距,差距是如何造成的,何时能够赶上?很多人为此感到焦急和忧虑,有些“恨铁不成钢”的情绪。百度比较及时地推出“文心一言”,客观上是对这种焦虑情绪的回应,应该能够在一定程度上缓解这种焦虑情绪。
从现场演示来看,“文心一言”在文学创作、商业文案创作、数理推算、中文理解、多模态生成等方面的能力比较突出。“文心一言”依托于百度搜索业务所积累的海量的知识图谱,在上述几个方面做得比较好应该是顺理成章的。据介绍,“文心一言”大模型的训练数据包括万亿级网页数据、数十亿搜索数据和图片数据、百亿级语音日均调用数据及5500亿事实的知识图谱,因此其在中文语言的处理上,具有独特的优势。而且,据说数据规模大,参数达到千亿级,大模型就可能发生“智能涌现”,涌现出知识和逻辑推理能力。此外,百度的数据形态也最贴合回答和生成需求。在百度搜索中,问答和生成类的搜索请求占比很高。这些,都为“文心一言”在自然语言问答和创意内容生成上提供了很好的条件。
也有网友指出“文心一言”对有些问题回答得不够好。我的理解是目前“文心一言”还有些“偏科”。要它在各个方面都做得好,还需要进行不断训练。我们相信它会不断一进步,很可能会进步很快。
值得肯定的是,在全球各大厂中,类似的AI产品,百度是第一个做出来的。这类大型的语言模型,需要多年的研发,不断地改进,不是短期内靠突击能做出来的。特别是深度学习、自然语言处理,需要多年的坚持和积累,没法速成。
在类似OpenAIChatGPT和百度“文心一言”这样的领域,硬件的限制少,主要是软件的能力,应该说基本上没有“卡脖子”的问题。我们国家在这方面应该是有优势的。百度有很好的基础,又有很好的政策、市场、人才方面的优势,达到世界先进水平应该是很有希望的。我们拭目以待。
(作者系作者上海交大上海高级金融学院教授陈欣)
相关稿件