以平台化重构智能运维市场,必示科技突破背后的价值启示

发布于: 雪球转发:0回复:0喜欢:0

我们知道,在传统的信息化时代,IT部门往往扮演着业务“跟随者”的角色,遵从业务需求支持企业的ERP、财务、OA系统的运转,而运维人员的主要工作,也只是承担封闭IT环境中硬件设备和软件系统的日常巡检、维护、升级工作,由于业务对IT的依赖程度不高,企业对运维效率的能力要求也不高。

但是,随着数字化转型不断推进,企业不仅越来越依赖IT的高效运转,IT部门的角色同样也发生了巨大的转变,由“跟随者”变成了“支撑者”甚至业务创新的“引领者”。所以,传统的IT运维工具和运维方法已无法解决企业遇到的种种问题,智能运维(AIOps)也就成了企业运维领域探索和创新的新方向。

在此背景下,成立于2016年底的必示科技,通过长时间的研究和技术沉淀,率先打造出了国内首款多场景可编排智能运维平台,该平台融合了十余种面向运维的专业算法,并可将各算法模块的效用进行编排组合,不仅满足了复杂运维场景中对多种数据进行多样化分析的需求,也彻底将运维流程中的人工分析工作变得更加智能化。

毫无疑问,在中国的智能运维市场,必示科技既是落地的实践者,更是未来的引领者,这背后无疑是必示科技凭借较强的技术研发能力,以及对中国企业用户痛点的深入洞察,使得必示科技在大量的市场成功实践中,探索出了一条差异化的智能运维之路,也真正重新定义了智能运维在中国的发展之路。

智能运维的机遇和挑战

过去几年,智能运维市场越来越受重视,它是指将人工智能应用于运维领域,并基于已有的运维数据,如日志、监控信息、应用信息等,通过机器学习的方式来进一步解决自动化运维没有办法解决的问题。

按照Gartner相关报告预测,智能运维的全球部署将从2017年的10%增加到2020年的50%,其行业应用除了互联网之外,还包括了电信、金融、电力、医疗、航空等等领域。值得一提的是,在中国市场智能运维从正式提出到实际的落地也有两三年的时间,并取得了初步的落地效果。

运维是数字世界的的基础设施级别的技术,随着支撑数字世界的软硬件系统越来越庞大、越来越复杂,运维对智能化的要求就会越来越高。因此,智能运维将会是未来运维技术发展的必然趋势。

清华大学裴丹教授曾提出:未来智能运维的发展将会有九大发展趋势,即行业多样化、产业生态化、数据多样化、场景多样化、场景精细化、算法服务化、技术平台化、落地加速化、成熟度评估的加速化,而这九大趋势也会助力AIOps在中国市场今后几年的兴起和爆发。

尽管智能运维的前景被持续看好,但在落地过程中,仍然要面对很多的困难。必示科技联合创始人兼CEO刘大鹏对此也感同身受,他说:“机器学习和运维两个行业都有几十年的历史,要把两个方向实现结合,其实面临着很大的挑战和很高的门槛。”

必示科技联合创始人兼CEO刘大鹏

一方面,是从事机器学习领域的人员,很难迅速了解智能运维的知识和场景,如各类监控数据,要梳理很长时间才能理解;而从事运维领域的人员又很难把机器学习吃透,特别是在一个大型分布式系统运行环境中找到适合机器学习能做、又对运维有帮助的事情是相当困难的,这也意味着两者之间存在着一个巨大的鸿沟。

另一方面,是智能运维中分析场景众多,维度复杂,加上运维数据多样化,导致运维数据在机器学习的应用中,往往会和理想假设的情况完全不同。一个典型的例子是,当年CNN(卷积神经网络)发明时并非专为运维场景设计,这些数据看起来能够输入到机器学习的方法中,但真正运行起来会发现效果和想象中差距甚远,也让智能运维在实际落地的时候是不可用的。

由此可见,智能运维虽然“理想很丰满,但现实却骨感”。那么,如何更好的发挥智能运维真正的价值?在此过程中,又需要解决哪些落地的难点和痛点呢?

以平台化重构智能运维

实际上,在刘大鹏看来,运维场景很复杂,很少只看一种监控数据,就能发现、定位问题。不仅如此,随着越来越多新的算法的出现,新的挑战又出现了。例如,数据和算法种类不断增加,扩展是问题,部署是问题,各种算法的配合是问题,算法和数据之间关系复杂也是问题,同时如何满足快速交付不同客户的需求,这些都是智能运维落地中需要解决的痛点和难题。

正是基于对行业需求的判断,必示科技在过去几年投入了大量的研究,并通过落地的行业实践,率先在国内打造出了首款多场景可编排的智能运维平台,该平台首次把算法、图谱、数据这三大智能运维中的关键元素结合在一起,不仅能够很好地进行数据关系的管理,也可以实现算法的编排和整合,真正以平台化的优势重构了智能运维落地过程中面临的挑战,具体来说:

首先,必示科技的智能运维平台整合了大量可开箱即用的运维算法,这些算法并不是简单的开源算法,而是在大量运维场景和运维数据中,经过长期打磨且得到了行业头部客户的实践和验证。

所以,这就让必示科技智能运维平台不仅能够通过多种算法组合,将运维场景中多样的人工分析工作进行全面智能化,且能大幅度提升复杂运维场景的解决效率;同时,精巧的算法工程化,还能让智能运维不止有质量,也有数量,可让分布式可扩展架构轻松分析十万级指标和TB级的日志;此外,算法与模型还可根据数据自学习、零配置科技运行,让客户在运维的过程中,真正告别复杂公式与模型,轻松实现开箱即用。

截止目前,必示科技智能运维平台已沉淀出10余项运维场景专用的高效算法,包括单指标异常检测、异常机器定位、日志模板智能解析、多维明细异常定位、日志异常定位、告警去噪聚合、批处理任务时间异常检测、趋势预测、调用链根因定位、智能相似事件查找、智能瓶颈报表、指标智能提取等,这些算法能够服务于运维的不同场景,解决数据治理、故障发现、故障收敛、故障定位、故障决策领域的难题,真正让平台具备了“多算法、多数据、多场景”的能力。

其次,在开箱即用的运维算法的基础上,必示科技智能运维平台又构建了强大的运维知识图谱能力。可以说,运维知识图谱是智能运维平台底层关键的架构,是管理数据关系和编排算法的重要支撑。

据了解,必示科技把运维知识图谱规划为三个阶段。其中,第一阶段是必示科技已经100%完成的,主要实现了两个功能:第一是从外部接入数据关系(如CMDB、配置文件等),第二是可以支持多样的算法编排。

第二阶段必示科技则完成了70%,主要规划了两个功能:一是在图谱上做推理的操作,例如几百个系统之间有复杂关系,检测到50个系统出现了异常,到底是哪个系统出了问题,其实这是基于图谱的推断和查找。另外一个功能是外部知识的链接和融合,如手册中的故障信息,而这部分则需要借助外部的知识来进一步完善产品的能力。

第三阶段目前仍处于规划之中,必示科技希望在这个版本中,一方面是在1.0基于已有配置关系建立数据关系的模式变成自动的,包括图谱关系的自动补全等;另一方面则是构建“智能排障树”,让系统能根据不同的数据和关系,自动推荐算法组合。

不难看出,开箱即用的运维算法加上基于运维知识图谱的平台化,让必示科技打造出的智能运维平台,不仅真正实现了可落地,同时也把中国智能运维的技术能力提升到了一个全新的高度。

正如刘大鹏所言:“我们希望把必示智能运维平台打造成一个垂直、专业、开箱即用的产品,这是每一个智能运维领域的从业者所期待的,也是必示科技一直以来所坚持的价值主张。”

突破背后的价值与启示

正所谓高度决定视野,视野决定格局,必示科技之所以能够在短短几年时间,就能打造出国内首款多场景可编排的智能运维平台,背后则源于其优秀的人才团队,雄厚的技术研发实力,以及大量的落地实践,由此让必示科技能够在智能运维市场得以“突破”,其成长的步伐也越跑越快。

一是,从人才团队看,必示科技拥有来自清华大学计算机系的顶级算法团队;核心技术团队来自微软亚洲研究院、阿里百度等互联网领军企业,已在国际前沿学术会议上发表论文100余篇;销售团队、交付团队和产品团队均拥有平均有10年以上行业经验的资深专家。

二是,从技术研发看,必示科技最新发布的智能运维平台,打造了一个以人工智能算法和知识图谱为支撑、具有统一算法框架,涵盖统一数据接入、算法编排、智能分析、数据存储和前台展示的专业化、一体化、功能强大、开箱即用的智能运维平台,真正将前沿算法与领域经验实现了完美融合,更证明了必示科技在发展方向和技术创新上的远见性。

三是,从资本角度看,必示科技还获得了众多一线资本的青睐,从成立之初到现在完成了三轮融资,这些一线的资本在投资时会对必示进行360度的考察,从某种程度而言,也是对必示的综合实力的把关和验证。更为关键的是,有了资本的认可和加持,更能让必示科技持续强化建设智能运维平台级产品,丰富智能运维算法,扩大智能运维团队,进一步提高产品和服务的客户价值。

最后,从落地实践看,必示科技还服务了众多头部客户,并积极去做实践检验。而这也是必示科技在中国智能运维市场中能够“脱颖而出”的关键因素。目前,必示科技的智能运维平台已赢得了交通银行招商银行光大银行民生银行、广发银行、华夏银行上海银行光大证券等金融机构客户的认可。在客户真实IT运维场景中,必示科技研发的智能运维算法产品故障发现和定位的准确率超过90%,使平均故障解决时间减少50%以上。

总的来说,正是必示科技强大的人才优势和对运维市场的深入洞察和理解,以及不断强化自身的价值和竞争力,使得必示科技的产品和方案更加完善,也更加接地气,充分满足了中国用户的实际需求,这让必示科技的市场不断创出好成绩,更实现了与中国客户的共同成长,这也是必示科技带给中国创新公司的价值与启示。

更为重要的是,众多头部客户的选择更证明了必示科技方向的正确性。更何况,经过过去几年市场洗礼和考验的必示科技已经打造出了自身创新、并随时代不断进化的基因,这也让它未来的发展也具备了更大的想象空间。