楼主: 选型宝
496 0

[原创报告] 选型宝访谈:打造细胞级的IT透视能力,构建健壮的业务运维体系! [推广有奖]

  • 0关注
  • 0粉丝

等待验证会员

本科生

26%

还不是VIP/贵宾

-

威望
0
论坛币
10 个
通用积分
1.0000
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
500 点
帖子
39
精华
0
在线时间
20 小时
注册时间
2019-8-1
最后登录
2020-3-15

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

写在前面

随着数字化转型的深入和“互联网+”战略的推进,企业CIO所扮演的角色正变得越来越重要。在获得更多职业机会的同时,CIO们也面临着前所未有的压力和挑战:一方面,业务互联网化之后,对IT系统的依赖程度越来越高;另一方面,移动化、云端化等趋势的出现,又使IT系统本身变得越来越复杂......

如何建立线上业务系统与传统IT之间的有效连接?如何让IT系统和业务系统变得更加透明、可控?当这些问题成为一种普遍存在时,一个新的概念应运而生了,那就是:业务运维。

究竟什么是业务运维?业务运维解决方案能为企业和CIO带来哪些价值?如何让业务运维快速落地?带着这些问题,选型直播采访了国内业务运维的倡导者和领跑者-云智慧(北京)科技有限公司的总裁刘洪涛先生。

下面,就让我们一起来听,选型宝首席架构师李维良与云智慧总裁刘洪涛的精彩对话吧。


刘洪涛

云智慧 总裁



李维良

选型宝 首席架构师


李维良(主持人)

运维经历了怎样的发展过程,业务运维与IT运维、硬件运维、系统运维等有什么区别呢?

刘洪涛

随着IT技术的发展和企业信息化的深入,运维的概念和内涵也在不断地变化和演进。最早的运维主要是面对各种硬件,解决硬件的故障和可用性问题,所以称为硬件运维,也叫基础运维。随着越来越多的企业信息系统上线,运维需要把OA、财务、库存等系统也管起来,于是就出现了系统运维的概念。在系统运维阶段,主要关注点还是设备有没有宕机,系统有没有出现故障,只要硬件和系统运转正常,运维的工作就算做到位了。

今天,越来越多的线下业务搬到了线上,这些线上业务完全依赖于IT系统的运行,对IT系统的要求也更高。在这种情况下,企业IT管理者的关注重点从过去的硬件和系统,上升到了业务层面,比如:业务收入出现波动与用户体验变化有没有关联关系?这种波动是由IT系统的哪些问题引起的?如何通过改善IT系统性能,提高业务运营效率?

在这样的背景下,业务运维概念应运而生。业务运维以用户体验为核心,以业务价值为导向,它是IT运维与互联网深度融合的产物,是运维管理在云计算、大数据等技术推动下所产生的必然结果。业务运维将传统的IT运维提升到了一个新的高度,也赋予了企业CIO们更多新的使命。


李维良

业务运维包含哪些内容,旨在为企业CIO解决哪些问题?

刘洪涛

业务运维在国外叫DPM(Digital Performance Management),也就是数字化性能管理。DPM是以大数据为基础的,它会对整个系统进行数据分析,并将分析结果应用于运营和维护。

基于DPM的理念和方法,云智慧率先在国内提出了业务运维的概念。业务运维的基础,也是数据的采集和管理,其中包括:硬件监控、系统监控、用户行为监控、外网监控等等,我们称之为全链路监控。监控的目的就是拿到系统运行的基础数据,为进一步的分析提供依据。

在采集和监控的基础上,业务运维会进一步关注终端用户体验,通过全局应用拓扑、关键事务分析等,用大数据手段对整个系统的性能进行分析,深度透视应用运行状态,快速定位业务瓶颈,及时排除各种故障。

在应用性能管理之上,业务运维还可以实现很多和智能运维相关的功能,比如:用户行为分析、智能故障预警、业务容量规划等。

同时,业务运维系统提供贯穿所有模块的可视化功能,通过实时、图形化显示的业务运维可视化大屏,企业CIO、CEO等决策者和运维、运营部门的管理者,可以非常直观的看到整个IT和业务系统的运行健康状态。

总结一下,业务运维是一套以大数据技术为基础,覆盖企业所有业务系统和IT系统的完整解决方案,通过全链路监控、端到端应用性能管理、实时分析与可视化展示等,帮助企业持续提升业务运营和IT管理效率。


李维良

业务运维与运维监控、APM(应用性能管理)之间有什么关系?

刘洪涛

运维监控是通过分布在互联网上的若干监测点,定时向指定的网站或应用发送探测请求,并根据反馈结果,做出分析和报警,帮助企业及时发现和解决服务器宕机、服务不可用等问题。APM则是以代理或探针的方式,从应用系统内部获取运行状态等数据,帮助我们感知用户体验、发现应用性能瓶颈的产品。

业务运维的基础是数据,而监控和APM恰好可以通过内部、外部两种途径,为业务运维系统提供数据支持。因此,监控和APM是业务运维的重要基础,它们也构成了业务运维系统的几个重要功能模块。

而业务运维则是监控和APM的延伸和升级,借助大数据处理等技术,把原来相对孤立的性能数据做更深入、更智能的关联分析,并以可视化的方式呈现出来,从而为企业的IT管理者提供了一个更完整、更先进的运维解决方案。

李维良

做为一家专业的业务运维解决方案服务商,云智慧都有哪些产品和解决方案?

刘洪涛

云智慧的第一个产品,是大家非常熟悉的监控宝。监控宝通过部署在全球的数百个监测点,实现基于外网探测的网站监控、服务器性能监控、API监控等功能,并且提供了统一的报警、分析和故障排除能力。

我们第二个产品叫透视宝,实际上就是应用性能管理(APM)系统。透视宝通过在移动端安装SDK、对浏览器端做代码植入、在服务器端加入探针等方式,采集应用系统的各种性能数据,帮助用户快速发现和准确定位应用的性能问题。APM面对的应用更多样,与应用的结合更紧密,因此,它的实施难度更大,技术门槛更高。

云智慧的第三个产品是压测宝,它是基于公网、为企业提供大规模真实用户访问的压力测试产品。企业的业务互联网化之后,经常会遇到“6·18”店庆促销这样的活动,就可能会出现无法预估的大规模访问。企业的线上平台能否承载这样的访问?这就需要一款压测产品,为企业做事前的压力测试。与市面上其他压测工具使用实验室模拟流量不同,压测宝提供了来自网络的真实流量。而且,压测宝还可以实现包括网站前端、后端,甚至机房环境在内的全业务流程的测试。

云智慧的监控宝、透视宝、压测宝,我们通常称为“三宝”。除此之外,我们还有一“屏”,那就是业务运维可视化展示大屏。在大屏上,大家可以看到IT系统性能、业务系统拓扑、应用健康状态、用户体验指数、用户转化漏斗等丰富的信息。而且,这些内容是实时显示的,对企业决策非常有帮助。

三宝一屏,再加上我们的大数据处理能力,共同构成了云智慧的核心竞争力。


李维良

对CIO来说,智能业务运维解决方案的核心价值是什么?

刘洪涛

对于那些正处于“互联网+”转型阶段的CIO来说,要搭建一个线上业务平台并不难,有很多商业的、开源的、或基于SaaS的工具可以使用。问题在于,企业原有的ERP、供应链、库存、财务管理等诸多系统是不能推倒重建的,这些基于传统业务模式开发的IT系统,与新的线上业务系统缺乏天然的联系,很容易出现IT断层。

以常见的库存管理为例,传统零售行业通常是按月盘库,最多是按周盘库的,而对线上业务来说,每一笔交易成功后,都需要及时更新库存信息。这就是一条出现在传统IT与线上业务之间的鸿沟,成为很多CIO们心中的痛。

业务运维的出现,就是为了帮助企业IT管理者们填平这道巨大的鸿沟,让传统的IT系统在继续发挥其业务支撑作用的同时,能够更有效地支撑线上业务系统的运行。构建贯通业务与IT的绿色通道,消除线上业务与IT系统之间的断层,这就是云智慧业务运维解决方案带给CIO们的最核心的价值。

李维良

云智慧业务运维解决方案重点关注哪些行业,有哪些成功案例?

刘洪涛

业务运维毕竟属于IT基础领域的一个需求,因此它的行业属性并不明显。当然,互联网化程度比较高的行业是我们的重点关注对象,比如:商业零售、连锁快消、运营商、金融、互联网等。

云智慧业务运维解决方案的成功案例很多,今天我给大家讲一个发生在某咖啡连锁企业的故事:某天上午10点,这家全球知名的咖啡连锁企业发现自己的线上业务下降了30%。在排除了广告投放、定价调整等外部因素之后,问题被定位在了系统故障上。在前端,这家企业有一个电商平台,在后端,还有七、八个系统为其提供支撑,而这些支撑系统,则是由不同的供应商,在过去若干年陆续开发的。

要解决类似问题,传统的做法,是将各家供应商叫来一起开会,业内叫做“会诊”或“会商”。如果会商后仍然不能定位故障,更激进的办法是再请一个IT咨询公司进来,帮助重新梳理业务流程,查找问题原因,而这样的服务,是按每小时若干美金收费的。在这种模式下,要解决一个类似的问题,通常需要1-2周的时间。这家企业每天的交易额是3000多万元,如果下降30%,意味着每天就要损失1000万左右。而且,在故障期间,还可能因为用户体验下降,造成客户流失。

由于有云智慧业务运维平台为其提供保障,这个客户用了不到一个小时,就定位到问题原因并顺利解决了。

问题是怎样解决的呢?首先,当业务发生波动时,业务运维平台会第一时间发现并自动报警,提醒用户业务出现了问题。然后,平台会列出跟业务波动关联的各个支撑系统,自动分析并发现问题, 并将最有可能出现问题的系统标红显示。接下来,我们会引导客户一层一层地查找问题原因,从代码到中间件,再到数据库、操作系统、服务器,存储,网络等。

通过这种方式,我们的客户很快找到了问题的原因:原来是一台负责第三方支付接口的服务器硬盘满了,导致系统变慢,平均每3笔交易就会有1笔因支付请求过期而失败。

在传统运维眼中,硬盘空间不足这样的问题很难被发现或引起重视,因为设备没有宕机,应用也没有死掉,整个IT系统看起来都是正常的。有了业务运维系统之后,前端业务与IT支撑系统被有效地连接在了一起,使用户能够通过业务数据的异常波动,及时发现问题,并借助业务运维系统准确定位原因并解决问题。

李维良

对于企业的CIO来说,业务运维怎样才能快速落地?

刘洪涛

我们一直强调,做为互联网时代创新的解决方案,业务运维是松耦合的,是可以弹性部署和灵活配置的。因此,建议企业的CIO们可以针对企业中最典型的应用场景,部署一套适度规模的业务运维系统,先将最迫切的问题解决掉。未来,根据业务需求,逐步扩大业务运维的应用范围。

由点及面,从小到大,再加上云智慧技术服务团队的支持,业务运维解决方案就能够在企业快速落地。

李维良

谢谢刘总的分享。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:IT选型 选型 业务运维 智能业务运维

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-4-26 15:27