近日,北京市经济和信息化局举办了AIGC(生成式人工智能)产业链专精特新企业融通路演活动,并正式发布《AIGC产业链北京市专精特新企业图谱》(下称《图谱》)。云测数据凭借丰富的高质量人工智能数据服务经验和前沿数据平台技术能力,入选《图谱》数据层代表企业。
《图谱》显示,在AIGC产业链领域,北京市走在全国前列,在算力、数据、场景、投资、人才等方面优势显著,并有57家优质专精特新企业处在重要产业节点,包括算力层14家、数据层11家、模型层10家、应用层22家。北京市经济和信息化局表示,入选《图谱》的专精特新企业致力于突破算力芯片、中文数据集、深度学习框架等领域的卡点和堵点,为AIGC产业链强链、补链、固链贡献力量,推动中国AIGC行业高质量发展。
云测数据作为人工智能产业发展的重要参与者和建设者,正在不断用前沿技术推动AI训练数据服务领域加速发展,自成立以来始终坚持以技术创新加速行业发展为己任,立足扎根市场的实践积累,在保障数据隐私和安全合规的前提下,进行前瞻业务布局与前沿技术能力探索,持续为智能驾驶、智慧城市、智能家居、智慧金融等众多领域提供高质量数据集、数据采集/数据标注服务、数据标注平台&数据管理工具等,全方位支持文本、语音、图像、视频等各类型数据的处理。
当前,5G、边缘计算等新基础设施建设加速,自动驾驶、智慧医疗、智能制造等领域对人工智能的广泛应用需求,大模型作为当前人工智能技术发展的关键方向,正在引领产业变革和产生深远影响。与此同时,大模型也面临训练成本高、应用场景单一、缺乏高质量细分领域数据等难题。,海量高质量AI数据的获取和处理能力,将直接影响一个机构在大模型技术上的竞争力。此前,云测数据已推出垂直行业大模型AI数据解决方案,为行业大模型提供从持续预训练、任务微调、评测联调测试到应用发布的端到端过程中的高质高效数据。
多年的人工智能数据服务经验与技术积累,云测数据早已打造了丰富的数据样本资源池以及多维数据采集工具和流水线作业化的数据清洗工作平台,可以基于企业要求提供定向垂直场景的数据服务,为大模型持续训练赋能。云测数据垂直行业大模型数据解决方案,可以为行业客户深度定制数据采集方案,助力获取高价值数据,在面对微调任务会根据大模型落地场景特点,提供包含QA-instruct、prompt等文本类任务项目和多模态大模型的相关能力支持。在完成微调后,云测数据通过垂直领域的人员和专家积累+评测体系和服务,帮助企业对各个垂直应用落地领域进行评估。并通过以集成数据底座为核心的数据标注平台,将难例数据回流完成清洗标注,为更有效率的模型调优做准备。
目前,云测数据已率先形成了人工智能数据的“采、标、管、存一站式服务”,结合丰富的行业经验、产研技术投入、管理体系等,持续为计算机视觉、语音识别、自然语言处理、知识图谱等AI主流技术领域提供高价值数据支持。深度合作伙伴覆盖了多个行业,包括汽车、安防、手机、家居、金融、教育、新零售、生态系统等。
相关稿件