10月14日,双态IT乌镇用户大会成功举办。其间由百度智能云与鼎茂科技联合举办的专场分论坛,聚集了百度智能云、鼎茂科技、建信金科、上海人工智能研究院、国方创新等企业、机构的各领域专家,以“利用AI大模型技术加速推进智能运维大脑建设”为主题,围绕AI大模型在技术维度、智能运维领域的应用维度、安全合规等多个角度,分享了最新的实践经验和前沿探索。
主题专场由跃为资本副总裁宋芃主持。他提到:“当下AI大模型成为多个产业领域关注的技术重点;同时智能运维也在向企业IT管理的核心发展,从IT管理扩容到更多的企业支持领域,新一代的智能运维系统快速向企业级智能运维大脑升级。此次百度智能云与鼎茂科技等多家机构的专场研讨,是大模型先锋技术和智能运维行业实践领域的一次深度结合,将带来更多有突破、好借鉴的精彩分享。”
—— 嘉宾分享内容梗概 ——
AI技术,尤其是近期热点的大语言模型突破,能够给智能运维领域带来怎样的加速发展,备受行业关注和期待。如何结合智能运维相关的领域知识、聚焦行业场景,持续落地相应AI智能化解决方案,已成为业界探索的目标和方向。这其中有哪些挑战和可能的技术路径?
围绕这些挑战和解题思路,鼎茂科技CTO 何诚,分享了《企业级AIOps落地挑战及与大模型结合发展趋势》。演讲主要围绕企业级AIOps端到端智能化解决方案落地的问题和挑战,提出了技术和解决方案应对思路。同时对AI大模型技术在智能运维领域的落地探索以及未来发展趋势进行了分享。
何诚总首先基于鼎茂多年的实践经验,剖析了企业在有效应用AIOps端到端智能化解决方案的过程中面临的三个挑战:
数据的价值密度和标准化程度低,导致实际可用的样本和数据相对较少。
随着业务和环境的变化,数据分布和内容动态变化,使得智能化应用方案的动态适配以及应用经验和领域知识的平滑迁移难度大增。
从IT软硬件资源到业务各层之间关系复杂并且相互影响,跨层多模态数据的统一整合分析极为困难。
接着何诚总分享了鼎茂在应对这些挑战中采用的有效技术解决方案以及实践探索,包括:
设计并实现鼎茂的可观测指标中心,内置IT运维领域丰富的知识体系,以不同角色管理的IT运维对象为视角和运维核心,结合特定运维数据体系实际状况,分析并优化数据治理的管理体系和价值体系,实现IT对象之间、对象指标之间、指标数据之间的依存和影响状态可追查,为智能运维场景降本增效,从而极大提升了数据资产价值。
采用多种前沿的终生学习方案,包括在线学习(Online Learning)、增量学习(Incremental Learning)、迁移学习(Transfer Learning)、强化学习(Reinforcement Learning)等,实现智能运维解决方案的持续学习和接收反馈迭代提升。并将上述关键技术作为基础算子能力,集成到鼎茂的AI服务引擎ARCANA-AI Engine中,缩短业务理解和智能化解决方案实现并落地部署时间。
提出”一横、一纵、一深入“的跨层根因分析方法体系,通过鼎茂Di-RCA解决方案实现复杂问题,多模态数据跨层根因分析,缩小问题定界范围,快速提升解决问题效率。
在探讨智能运维解决方案与AI大模型结合升级的发展趋势上,何诚总分析了大语言模型在AIOps领域应用的三个变化阶段,包括直接调用外部开放大模型,结合知识图谱构建本地行业大模型以及未来通过本地行业大模型构建智能运维大脑。通过调研和分析,明确指出当前企业级大模型应用,应该以结合行业知识图谱,构建本地行业大模型(Foundation Model)为主要目标和方向,以此解决计算资源瓶颈、数据安全、缺乏领域知识产生幻觉等核心问题。
何诚总还介绍了鼎茂在智能运维领域AI大模型方向探索的路径和进展,主要涵盖在支持结构化数据多任务分析的时序大模型框架,支持非结构化数据多任务分析以及知识图谱增强的语言大模型框架,以及最终实现支持多模态复杂问题综合分析的统一领域大模型框架。
何诚总最后表示,AI技术和应用域将快速发展,鼎茂也将始终在AI驱动的数智平台的基础上,构建支持企业IT运维到业务决策端到端的智能化解决方案的智能运维大脑,协助更多企业客户进行数字化和智能化变革。
百度文心大模型是国内首屈一指的AI大模型,在各个产业的应用正不断扩大和深化。百度智能云作为国内引领AI技术发展的先锋企业,其AI大模型和解决方案在各个产业的应用中发挥着重要作用。
百度智能云私有云部高级产品经理王发,分享《AI原生思维下的大模型智能运维实践和展望》。演讲阐述了在前沿技术视角下,对于大模型和AIOps领域的探索和展望。
王发总首先强调了AI原生思维的重要性。随着生成式AI技术的不断发展,我们应改变传统思维方式,以适应这个AI时代。AI原生应用是利用生成、推理、记忆等AI能力,并能自然地与其他系统进行交互。这不仅简化了操作流程,而且还能提供更高效的工作方式。
百度在智能运维领域也做出了重大贡献。自2000年以来,百度已经经历了四个阶段:人工运维时代、自动化运维时代、AIOps领域和利用大模型加持AIOps。在这个过程中,百度推出了一系列AIOps产品,如异常检测、告警收敛和故障传播图等。但尽管现有的AIOps产品已经做得很好,专家们仍然发现了其局限性。
王发总提到,为了解决现有问题,专家们开始探索如何利用大模型加持AIOps。由于大模型具有出色的评价能力、复杂任务拆解和执行能力以及出色的生成能力,它们可以更好地解决运维中的复杂问题。例如,大模型可以评价并优化巡检脚本;将复杂问题分解成更小的任务,以便更有效地执行;以及通过文生文、文生图和文生视频等方式,快速解决问题。
王发总最后表示:随着AI原生应用的发展,我们有理由相信,未来的智能运维将更加便捷、高效和智能化。通过很多领先公司的努力,我们期待看到更多创新和突破,以推动智能运维的发展。
AIOps技术和应用领域正在进入一个新的发展阶段,其价值从传统的运维管理走向全域智能。随着AI技术的发展,结合当下AI大模型技术的新一代AIOps行业解决方案,正在成为许多行业未来的技术战略。新一代的AIOps将以智能运维大脑的形态出现,并为企业的发展提供深度服务。
鼎茂科技AIOps解决方案总监 郭顺友,分享《智能运维大脑的建设思路》。详细介绍了如何构建企业级的智能运维大脑,并分享了在多个行业的落地实践。
他指出:智能运维大脑是以丰富的运维项目最佳实践经验为基础,结合强大的AI算法引擎作为核心能力,融入客户真实运维场景,沉淀出的一套全域运维能力集合。
鼎茂根据落地实践经验,将智能运维大脑的建设路径归集为四个阶段:
1.多维多模态数据的精细化治理;
2.颠覆传统运维模式,基于指标中心进行统一运维对象模型建设;
3.基于AI引擎闭环赋能智能化运维场景;
4.实现智能运维大脑上层的故障检测、故障分析、故障处置、资源优化、知识图谱等智能化场景建设。
通过智能运维大脑的建设,助力用户从传统运维到一体化智能运维发展方向的进阶,全面提升企业运维效能和数智化运营能力。实现问题的高准确性发现和风险隐患的提前感知、高效的故障检测和分析诊断能力、全域闭环AI算法引擎覆盖,以及精细化的数据价值体现,最终实现运维效率可达到1分钟发现、5分钟诊断、10分钟处置。
基于对行业的深刻洞察,建信金科的DAK运维理念-运维数字能力、算法能力、运维知识体系,也被包括建行在内的众多大型金融机构采纳为智能运维体系建设的关注要素。
建信金科智能云解决方案专家赵峥,分享《基于DAK的智能运维探索与实践》。
本次分享中,赵峥总介绍了在技术趋势、信创监管、业务发展三方面需求的驱动下,金融行业运维数字化转型面临着环境多、数据多、要求高的巨大挑战,同时为大家明晰了DAK运维数字能力、算法能力、运维知识体系的三大建设思路,分享了通过“平台化+场景+知识”模式搭建全栈式智能运维工具产品的经验。
他指出,在企业智能运维体系架构中,知识、AI和数据三个平台构成了运维大脑的核心。在知识内容生命周期中的知识收集、知识管理、知识挖掘、知识应用四个领域,自动化与人工智能技术的快速发展,大量抽象而复杂的知识场景,可以不再依赖人力,通过信息技术的融合能够形成巨大的知识赋能,构建知识生产力的第二载体。
最后赵峥总总结:向研发和业务交付价值、重视数据和知识、建立智能化思维,将作为智能运维实践的重中之重。
AI大模型从诞生以来就伴随着隐私性、安全性的讨论。从数据隐私、模型训练过程的商业机密泄露、大模型公平性要求的监管审查,以及对抗攻击等等层面,都受到关注。
上海人工智能研究院总工程师,王资凯,分享《合规条件下的生成式人工智能落地》。
王资凯总结合目前的实际生产现状:训练大的模型需要大量的高质量训练数据;庞大的算力需求直接提升了惊人的成本;模型效果的保障需要在算法模型的细节不断地尝试和优化;推理速度是限制大模型落地应用的重要瓶颈;黑盒体质导致满足不了垂直领域所要求的安全性和可解释性……
针对这些现状,他对AIGC的发展可能提出了一些预见性的想法:构造高质量的领域/产业数据集?围绕场景推出小模型?推出“模型既服务”模式?针对细分领域/产业的推理设施?针对细分行业的模型测试集?围绕细分内容做可控生成和检索增强?
全面就AIGC的缺陷、监管、影响和落地几个方面,系统性阐述了如何在道德和伦理规范的前提下,满足合规条件,将生成式AI技术应用于实际场景中的前景和可能性。
智能运维领域几年前就吸引了资本的关注,随着技术的不断进步和应用场景的扩大,智能运维领域也在持续演进和创新,资本也在重新观测行业的趋势和未来。
国方创新投资总监,张治,分享《资本视角下智能运维领域的前景》。
他指出数字化转型进入深水区,云化、云原生化的趋势不可逆,再叠加上信创的推动,客户的IT复杂度在急剧提升,这带动了IT运维逐渐从人工运维往自动化运维方向发展,在此背景下以IT运维管理软件与分析软件为代表的IT运维产品在市场规模也在快速提升。
通过与成熟海外市场的发展对比,他还为智能运维行业的赛道者指出:因为中国的现实情况,现阶段智能运维企业的核心竞争力在于从服务高IT水平客户中产品、技术与场景的打磨,这会有一个共建的过程。这两年我们也看到部分头部玩家已经完成最佳实践方案打磨,下一阶段,智能运维企业需要寻找高质量发展的路径,从与客户共建进入到建议客户,引领客户的过程。
会议最后,来自用户侧和同业侧的业内人士也就大模型在领域内的应用难点和价值量化向与会专家进行了互动探讨。
值得期待的是,智能化从技术到产业落地正在加速。对IT和业务决策的影响价值来看,也已经从代码生成、效率工具升级发展到多环节、多领域的赋能。同样值得期待和关注的是,在to B智能运维领域,AIGC的产品化时代。
相关稿件