近日,瑞莱智慧RealAI发起设立多模态大模型公司「北京生数科技有限公司」(简称生数科技),以加速构建通用人工智能能力。
生数科技成立于2023年3月,将专注于打造世界领先的可控多模态通用大模型。日前,生数科技已完成近亿元人民币天使轮融资,本轮融资由蚂蚁集团领投,BV百度风投、卓源资本跟投,目前估值已达1亿美金。
领跑安全通用人工智能,添重磅引擎 瑞莱智慧CEO田天表示,本次瑞莱智慧发起设立生数科技具有战略意义,将进一步完善公司大模型基础能力,从而打造安全的通用人工智能。瑞莱智慧是清华大学人工智能研究院的孵化企业,自成立之初,就致力于研究和发展安全可控的第三代人工智能技术,建立通用AI模型能力和人工智能安全能力:通过通用人工智能模型来适应各类复杂的智能应用场景和任务;并通过人工智能安全能力,真正使人工智能造福人类整体利益。
瑞莱智慧具备国际领先的人工智能研究能力,坚持源头创新和底层研究,在生成式人工智能等领域不断发表世界领先科研成果。成立以来,瑞莱智慧研发团队核心成员在人工智能领域顶会上发表论文数百篇,多次在国际测评和竞赛中斩获冠军,获得授权专利100余项。同时,瑞莱智慧积极推动行业规范化,累计参与30余项国家标准、行业标准制定。
2023年5月,瑞莱智慧首批入选北京市通用人工智能产业创新伙伴计划。
目前,瑞莱智慧已形成三大平台产品:AI模型应用平台,基于多模态基础大模型、垂直能力大模型及模型应用开发技术,为各类客户提供AI理解和AI生成等应用;AI安全平台,为通用大语言模型、人脸识别、自动驾驶等模型进行安全检测与防护,并提供AI合成内容检测等AIGC滥用治理服务;AI隐私计算平台,在确保数据和隐私不泄露前提下进行AI模型训练和推理,拓展AI数据业务应用。
凭借行业领先的人工智能技术研发和应用落地能力,瑞莱智慧面向城市治理、金融、教育科研、智能汽车等场景,已成功服务了300余家大型客户。
自研多模态大模型,能力超越谷歌、OpenAI、英伟达同类模型 生数科技研究团队是国内最早开展扩散概率模型基础理论和算法研究的团队,覆盖基础理论、骨干网络、高速采样、可控生成等全栈底层原创研发能力。团队研究成果被OpenAI及开源扩散模型Stable Diffusion等采用作为最佳推理算法。
生数科技CEO唐家渝表示,作为当前科技领域最重要的演进方向,AIGC领域质变发展的关键就在于底层核心技术的持续突破,这也正是拥有深厚科研背景的生数科技所具备的核心竞争力之一。今年初,团队开源了全球首个基于Transformer的多模态扩散大模型UniDiffuser,首次实现基于一个底层模型高质量地完成图生文、图文联合生成、图文改写等多种生成任务。目前其文本生成图像能力在多种测评指标和实际生成效果上,超越了全球最大开源项目stable diffusion的基础模型。
生数科技多模态大模型在3D内容生成、视频生成等任务中也实现全球范围内超高水平的生成效果。例如,该模型已可在无需任何3D数据的前提下通过文本描述自动化生成业内最高质量的3D内容,生成效果已大幅领先Shap-E(OpenAI)、DreamFusion(谷歌)、Magic3D(英伟达)等主流模型水平。
以下为3D生成效果展示:生数科技多模态大模型3D生成效果:细节、纹理、颜色展现丰富,真实感强
Google DreamFusion 3D生成效果
OpenAI SHAP-E 3D生成效果
NVIDIA Magic3D 生成效果
以下为视频生成效果展示: 根据文本描述进行视频元素编辑,从左至右分别为原视频、生数科技效果、Runway效果,生数科技在细节把控、真实度方面效果更显著
Prompt: a girl with exquisite and rich makeup
Prompt: a Swarovski crystal swan is swimming in a river
Prompt: a red car
以下为图像生成效果展示:
接下来,瑞莱智慧将与生数科技紧密合作,结合多模态大模型生成能力打造瑞莱智慧综合AI行业解决方案,在垂直行业落地应用,通过可控生成能力赋能智慧营销、多媒体内容理解分析、数字资产创建、多模态私域问答等场景,助力政务、金融、教育、汽车等各行业客户智能化升级,创造更多价值。