您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 业务级运维利器_应用性能管理_听云吴静涛
业务级运维利器吴静涛听云技术副总裁BS转云+端带来新的挑战CDN虚拟计算虚拟存储虚拟网络DBAlog研发网络运维外网监控客服WebAppDB终端终端性能硬件老旧/低配建议关闭无用应用,释放资源OS版本版本更新造成APP兼容问题监控全部用户状况,快速发现接入方式Wifi/2G丢包,延迟,带宽监控图片等下载的吞吐量,提出建议APP屏幕布局渲染图片过大,布局不合理监控应用过程,提出建议进程调用进程/接口调用产生慢交互监控调用,发现top慢交互代码效率延迟,产生慢交互监控函数,方法的代码执行,定位代码段闪退/崩溃代码,兼容,崩溃轨迹回溯,记录用户操作和环境网络传输异常路由南北电信拆分,电信间结算发现问题,协调解决,或变更CDN节点CDN节点设计节点不合理,性能问题CDN选型评估,运行评估延迟/抖动丢包,延迟,带宽不够实时监控,在用户投诉前处理数据中心设备延迟设备层级太多数据中心整合,平台化硬件性能硬件老旧,低配设备/架构升级,并发压力设计容量和突发压力业务上线前实际用户压测,应用架构第三方,EBS/SOA,DB运维监控由网络,端口,到应用调用代码效率排队,产生慢应用过程实时监控,发现慢应用/慢SQL,定位代码段传统运维和业务级运维革新的方式,业务级运维的方法•真实用户的体验数字化1.最终用户体验视角展现2.慢交互追踪解决卡顿3.崩溃轨迹回溯解决闪退4.行业对比(竞品分析)•全网监控业务流量传输1.应用流程和传输监测2.首屏时间评估,CDN评估3.在造成用户影响前报警4.行业对比(竞品分析)•应用实时性能监控1.生产环境的性能展现2.代码级监控和慢应用追踪3.应用性能的诊断,追踪和优化依据研发网络CDN评估业务运维主机CDN虚拟计算虚拟存储虚拟网络DBAlog研发网络运维外网监控客服WebAppDB位置方式技术侵入式竞品对标网络问题定位全样本代码级定位后端服务监控客户端主动基于自动化测试的拨测--OO------被动浏览器嵌码O----O----App嵌码O--OOO--服务端被动旁路监听----OO--O应用探针O----OOO构建全网应用性能监控的方式客户端APMClient客户端APM监测方式主动式基于自动化测试的性能拨测客户端APM监测方式被动式基于页面插码或App嵌码的性能监测•建立覆盖全面的监测网络:地域、运营商、接入方式•可调度的分布式自动化监测引擎:网络测试(ping,traceroute),浏览器测试,流媒体测试、手机浏览器测试等基于自动化测试的主动式性能拨测•在页面中插入JavaScript代码以采集最终用户的性能体验•NavigationTiming()通过页面插码监测客户端浏览器应用性能移动应用的客户端性能采集•手机浏览器自动拨测•页面插码•应用内插码+H5页面内插件+jsBirdgeWebApp:NativeApp:HybridApp:•应用内插码•网络访问性能采集•方法调用性能采集•Crash日志采集客户端APM方式的优缺点主动式采集方式——优点•非侵入式,不影响性能•可做发布前、发布后监测•互联网压力测试•竞品对标,服务选型•精确定位网络问题主动式采集方式——缺点•样本偏差•监测网络部署成本高被动式采集方式——优点•全样本覆盖,准确性高•成本相对较低监测网络节点真实用户被动式采集方式——缺点•无法提供竞品和对标数据•手工插码的开发工作量大•对性能的影响服务器端APMServer-Side•受网络影响严重•无法精确定位服务端的问题仅部署客户端APM的局限•与客户端APM互补•更精确定位应用和服务的问题•被动式的应用性能数据采集服务端的APM服务端APM实现方式•旁路监听采集方式•应用内探针采集方式服务端旁路监听APM部署定位Sniffer网络报文解析NPM通过SPAN,TAP旁路应用访问流量进行Sniffer各类TCP协议分析和性能采集(NPM)•优点:–非侵入式,对生产影响最小•缺点:–报文处理能力–多协议的适配–无法定位应用代码问题应用内探针APM技术部署位置:应用服务器采集数据库等各类服务的访问时间采集应用响应时间和代码执行时间在应用代码中埋点来实现性能监控BCI(ByteCodeInstrumentation)技术•优点–代码级别的性能监控–可监控到应用相关的各类服务性能•缺点–侵入式监控,可能对应用性能和稳定性产生轻微影响听云构建的“业务级运维平台”业务级运维革新的方式,业务级运维的方法•真实用户的体验数字化1.最终用户体验视角展现2.慢交互追踪解决卡顿3.崩溃轨迹回溯解决闪退4.行业对比(竞品分析)•全网监控业务流量传输1.应用流程和传输监测2.首屏时间评估,CDN评估3.在造成用户影响前报警4.行业对比(竞品分析)•应用实时性能监控1.生产环境的性能展现2.代码级监控和慢应用追踪3.应用性能的诊断,追踪和优化依据研发网络CDN评估业务运维主机CDN虚拟计算虚拟存储虚拟网络DBAlog研发网络运维外网监控客服WebAppDB解决业务/运维/研发的问题CDN虚拟计算虚拟存储WebAppDB虚拟网络研发网络CDN评估业务运维主机业务研发运维开发团队关心的问题•视图加载•视图布局•图像处理•数据存储•JSON处理•网络访问运维团队关注的问题•2G、3G、WIFI接入不稳定•自身机房链路不佳•服务器运行不稳定•CDN加速效果不理想•当地运营商出现劫持业务关心的问题•活跃用户量•交易量和交易笔数•用户体验可量化•行业指标对比•卡顿/闪退崩溃等严重问题•起源于互联网的听云,采用极简部署,免学习风格的理念,将动辄几千万的传统APM,带给互联网应用。•将互联网的敏捷/迭代开发,开发运营的理念,通过统一的听云平台,实时监控用户/传输/应用的性能,在用户投诉前发现,定位,协助解决应用性能危机。•高度自动化的工具,降低客户自行研发带来的时间和稳定性成本,更加关注核心业务,持续提升用户体验,留住用户,保障业务。听云平台的构建标准制定行业对标听云App用户体验量化App行业参考数据听云Network首屏时间各行业参考首屏时间听云ServerApdex应用性能指数用户自定义听云App听云Network听云ServerCDN虚拟计算虚拟存储WebAppDB虚拟网络研发网络CDN评估业务运维主机互联网的数据传输•首包时间•首屏时间•总下载时间•CDN节点判断•行业竞品分析终端用户体验量化•应用交互执行性能时间标准•闪退/崩溃率的标准•错误率细化标准•综合评分体系传输服务终端总下载时间Apdex应用性能指数首屏时间1.标准制定-用户体验和应用性能标准化2.行业参考-标准化后的行业指标CDN虚拟计算虚拟存储WebAppDB虚拟网络研发网络CDN评估业务运维主机传输服务终端外部接口:响应时间应小于1.5秒。内部接口:响应时间应小于1.1秒。图片体积:平均小于50KB。主机错误率:小于1.07‰。App崩溃率:小于1‰。3.客户定制-定制业务关键交易过程 CDN虚拟计算虚拟存储WebAppDB虚拟网络研发网络CDN评估业务运维主机传输服务终端客户端定制关键交易定制关键页面服务定制关键应用过程慢应用追踪定义听云平台的日常监控展现展现用户体验组合通过采集操作系统版本信息,了解当前APP最活跃的系统版本是哪些,同时展现使用性能数据,可以有针对性的进行系统优化,保障APP在各版本上的运行效率。展现用户体验-系统版本信息听云Server会根据应用模块的关联关系自动生成应用拓扑图,让使用者通过视图查看监控的应用模块(数据库、NoSQL、外部调用等)和应用模块之间的性能数据。展现应用性能-应用拓扑图听云App-发现,定位(代码级)和解决-闪退崩溃问题新版本小范围上线后发现崩溃比例较高,排除问题后,再进行大范围分发,加快版本上线进度问题发现-闪退崩溃APP近一周崩溃率达到了387.76‰(行业标准值1‰),已严重影响用户体验。需要崩溃率与影响用户数统计闪退崩溃-需要上下文信息需要格式化的详细调用堆栈崩溃调用堆栈支持反混淆还原真实堆栈代码,准确定位代码行数。闪退崩溃-需要崩溃轨迹追踪 创新的追踪App崩溃过程,为应用迭代升级提供代码级关键信息,快速发现和解决崩溃问题,提升客户体验,留住客户。听云Server-发现,定位(代码级)和解决-PHP慢应用问题发现耗时的Web应用过程,并以图表关联响应时间和吞吐量。Web应用过程响应快慢排序Web应用过程对每个URL调用过程的性能进行分解分析,明确执行过程中性能消耗的原因。Web应用过程-分解钻取慢应用过程,摘要可以看到该过程中所有组件的访问量、耗时和响应耗时%。应用过程慢追踪-摘要应用过程追踪列表业务级运维革新的方式,业务级运维的方法•真实用户的体验数字化1.最终用户体验视角展现2.慢交互追踪解决卡顿3.崩溃轨迹回溯解决闪退4.行业对比(竞品分析)•全网监控业务流量传输1.应用流程和传输监测2.首屏时间评估,CDN评估3.在造成用户影响前报警4.行业对比(竞品分析)•应用实时性能监控1.生产环境的性能展现2.代码级监控和慢应用追踪3.应用性能的诊断,追踪和优化依据研发网络CDN评估业务运维主机CDN虚拟计算虚拟存储虚拟网络DBAlog研发网络运维外网监控客服WebAppDB听云-业务级运维的客户价值CTO/CIO业务产品/研发运维
本文标题:业务级运维利器_应用性能管理_听云吴静涛
链接地址:https://www.777doc.com/doc-1637088 .html