010-8287 0100

工作日 09:00-18:00(周末至17:30)
010-8287 0100

数智QA|AI大模型时代,IT运维将有哪些变化?

  • 2024-02-01
  • 0
  • pzp84jk5usf92ddf3lr38fgb13l6v1538920.gif

    yz0x88kdgfn7bvwsmx5ftwltadsda6610913.jpg

    当你春节假期抱着手机抢红包的时候

    当你与TA煲视频电话的时候

    当你买完东西扫码支付的时候

    当你输入目的地开始叫车的时候

    ...

    你一定不愿看到手机应用进度一直转圈、画面卡顿

    流畅的体验,离不开背后万千ICT基础设施的支持

    正是这些基础设施不断应对互联网流量洪峰的冲击,时刻响应用户的应用请求。而数字基础设施和企业业务的稳定运行,更离不开IT运维的精心管理和保障。

    4u1mukhbiwr1rqvnwoqqhr75m5da49434982.jpg

    IT运维,简而言之,就是对IT环境、系统、设备及网络进行全面的维护和管理。IT运维包括但不限于对硬件、软件、网络、数据库及安全设施等的监控、维护、优化和故障排除,在IT基础设施运营等方面扮演着至关重要的角色。如今,IT运维已经成为保证企业稳定运营、提高系统效率、保障数据安全、快速响应故障以及推动技术创新和智能化转型的关键力量。

    随着AI、云计算、大数据等技术的不断发展,特别是生成式人工智能及AI大模型的发展,IT运维也在不断创新和演进,进入“智能运维时代”。

    本期的《数智QA》,我们将从多个维度,深入探讨智能运维为行业智能化带来的影响。

     数智  QA 

    当前企业IT运维普遍面临哪些问题?

    Artificial Intelligence for IT Operations

    运维机制不完善:没有建立起稳定、规范的IT运维机制,导致运维流程的操作层面缺乏统一的标准和指导,使得运维工作难以规范化、系统化。

    运维质量低下:由于运维工作的复杂性和繁琐性,以及缺乏有效的运维工具和技术支持,导致IT运维本身的质量很难提高,存在大量的重复性劳动和手动操作。

    团队建设有待提升:运维团队中技能水平参差不齐,一些关键技能和知识仅存在于少数核心人员中,导致过度依赖这些人员,一旦他们离职或生病,整个运维工作可能面临严峻考验。

    运维成本高昂:企业业务的不断发展和IT系统日益复杂,导致运维成本不断攀升,成为企业的沉重负担。如何降低运维成本、提高运维效率成为企业亟待解决的问题。

    什么是智能运维?

    Artificial Intelligence for IT Operations

    智能运维即AIOps(Artificial Intelligence for IT Operations),由Gartner在2016年最先提出,是将人工智能和机器学习技术应用于IT运维领域的一种方法。AIOps可提高处理故障的响应速度、降低故障影响范围、增强系统稳定性和可靠性,并提高IT运维团队的工作效率和资源利用率。

    4mrc0iopejk578azvynjqqvapwwepq577795.jpg

    相较于传统IT运维,智能运维有哪些优势?

    Artificial Intelligence for IT Operations

    主要体现在五个方面:

    1.强大的数据处理和分析能力:AIOps通过数据平台广泛采集、处理和分析数字化业务运行过程中的多样化运维数据,包括告警、指标、日志、配置以及运维工单等类别,提升了运维大数据的治理能力、优化数据质量,为进一步激活运维数据的价值打下了良好基础。

    2.快速的故障预判及风险防范能力:AIOps能够对实时数据进行异常检测和问题预判,有效降低数字化业务的运行风险,提升可用性和稳定性。运维人员能够提前发现潜在问题并采取相应的措施,从而避免或减少故障的发生。

    3.更低的运维人力成本:AIOps使真正意义上的跨域根本原因定位成为可能,降低对专业运维人员经验技能的依赖,迅速缩短故障排查时间并有效降低人力成本。

    c3rnjcl720b1hp5bekxl7g5jqkrnxv979741.jpg

    4.更高的自动化和智能化效率:AIOps可以自动化许多传统的运维任务,如日志分析、事件管理、故障诊断等。同时,AIOps还具备智能化的决策支持能力,可以为运维团队提供实时的警报、推荐解决方案和执行修复操作等智能化支持。

    5.更好的业务理解能力:AIOps不仅能够关注IT系统本身的状态和性能,还能够感知业务侧的影响力。这使得运维团队能够更好地理解业务需求并优先处理对业务影响较大的问题,从而确保业务的连续性和稳定性。

    中国信通院《中国AIOps现状调查报告(2023)》显示,2023年有55.69%的受访企业加大了在AIOps智能运维的投入资金。其中,保证运维质量,提高运维效率仍为目前企业关注度最高的应用方向。

    全新AI时代,大模型加持的智能运维将发挥什么作用?

    Artificial Intelligence for IT Operations

    1.智能化监控和预警:AI大模型能够处理海量的运维数据,通过实时监控和智能分析,及时发现系统的异常和潜在问题。这将使得运维团队能够更快速、准确地响应故障,并提前采取预防措施,避免或减少故障的发生。

    2.自动化运维和修复:借助AI大模型,AIOps将实现更高程度的自动化。从日志分析、事件管理到故障诊断和修复,许多繁琐的运维任务将由AI系统自动完成。

    1tvk3l1z3i91x2779g7xtlsye0ao11286133.jpg

    以Lenovo xCloud联想混合云智能运维解决方案为例,该方案基于联想技术与解决方案交付团队多年来服务联想内部业务的实践经验积淀而成。联想混合云AIOps以数据驱动的智能分析为大脑、任务驱动的自动化平台为手脚,实现对混合云环境端到端的智能管理,助力IT不同角色实现以业务价值为导向的IT运营,保障业务连续性,实现快速业务交付,降本增效。

    联想混合云AIOps为客户提供了丰富的运维场景支持,并实现开箱即用,同时具备高灵活性,可为企业提供个性化运维服务。通过建立企业统一的运维数据湖,对数据进行采集、治理、分析、存储,联想混合云AIOps可为企业建立系统的知识图谱并实现全方位、多视角的智能数据分析和可视,支持企业对业务运营进行智能决策,加速企业智能化进程。目前,联想混合云AIOps解决方案已经在IT资产和配置管理、自动化运维管理、一体化运维平台等领域实现落地应用。

    在吉利星睿智算中心·智能仿真平台建设中,依托联想混合云AIOps解决方案,联想为吉利提供了统一运维入口及访问控制,实现一体化运维管理。集群自动化运维支持对高性能计算资源维护和使用过程中的日常运维工作,统一的高性能计算任务调度、管理及执行,使仿真任务计算效率提升10%。丰富的运维自动化场景进一步降低了运维技术门槛,智算中心运维效率提升30%,平台计算效率提升30%,并有望将计算效率进一步提升10%-30%。

    3.个性化运维服务:AI技术助力之下,AIOps将越来越注重为企业提供个性化服务。AI大模型能够根据企业的业务需求和系统特点,定制化提供运维解决方案,满足企业的特定需求。

    4.知识图谱与智能决策:AI大模型能够构建运维知识图谱,将分散的运维知识整合起来,形成结构化的知识体系。基于这个知识体系,AI系统能够提供智能的决策支持,帮助运维团队作出更明智的决策。

    ip9a3yw6spx7pdrd3fu91cig6k52fk783073.jpg

    在某省级大型能源集团的IT运维中,联想为该集团及分公司构建了统一的运维平台,支持企业资产管理、服务运营、监控告警等服务,大幅提升了运维标准化和成熟度。在联想混合云AIOps解决方案助力下,该集团数据中心故障切换时间缩短4.5倍,硬件成本节约40%,业务承载能力提升6倍。

    5.安全性增强:AI大模型在网络安全领域也有广泛应用,能够实时监测和识别潜在的安全威胁,自动采取防御措施。这将使得IT运维在保障系统安全方面更加高效和可靠。

    uei86rc2zxmra1g8u5kgt557tg1xqn215768.jpg

    Gartner的数据显示,2023年AIOps在中国的市场渗透率只达到了目标受众的5%-20%。这一数据意味着仍有大量企业还未进行AIOps建设,未来AIOps市场前景广阔。目前,已经开始应用AIOps的企业,智能运维水平普遍还处于辅助智能化运维阶段,主要以系统辅助分析,帮助人工进行决策和操作为主。随着AI大模型和生成式AI技术的加速落地,AIOps智能运维也将循序渐进不断升级,在质量、成本、效率、安全等维度持续完善,助推企业智能化转型。

    有任何疑问? 联络销售支持!

    联系我们
    在线询单
    填写完您的需求之后,点击提交,我们将在一个工作日内与您联系。
    在线客服