您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 计算机硬件与维护 > 514云时代的运维管理
云时代的运维管理云计算方案架构师高忠涛VMWARE.INC2IT运维管理遇到云计算3VMwareIT基础架构(99%虚拟化)•4000+服务器VM,9000+桌面VM•~290物理服务器•~4P数据•每年支持超过50个大型项目EnterpriseApplicationPortfolioSaaS65ITtools50Business100Total2154资源监控基础架构监控网络监控VMwareIT运维面临的难题多种监控工具,多个监控台,缺乏统一视图难以关联和分析业务快速增长的压力对控制和安全要求不断提升混合环境的管理WorkloadsWorkloads5扩展性EMCSmartsAdapterEMCSymmetrixAdapterHPBACAdapterHPOpenViewAdapterIBMTivoliMonitoringMicrosoftSCOMAdapterNetAppAdapterOracleManagerAdapterSAPAdapterVMwareHypericAdapterVMwarevCenterAdapterGenericAdapterse.g.Port/SNMP/SQL/TextFile容量规划未来趋势预测未来IT容量使用合规控制配置管理遵从性管理加快故障原因分析关键性能指标的实时趋势分析用Health指标,查看即时事件和问题深入到数据中心、集群、主机和虚拟机层次VMwareIT对运维工具的要求6vCops满足了VMwareIT运维管理需要主动观测当前、历史状态图形显示计算日常行为的范围配置变更的相关性管理热图发现系统瓶颈详细的健康度和负载观测主动智能预警优化整合系统资源使用容量分析和报告监控虚拟、云及物理环境7VMwareIT运维管理仪表盘主页相关指标应用层超级指标源数据指标图示类型深入分析8收益Phase1Phase2CycleTimeHoursperdev/testinstance17236TodayPhase1Phase2VMsTransitioned#ofNon-productionVMsPhase1Phase2AppOppsteam#ofEngineersGoal–40002,8002,200Goal-5Start-2722缩短业务交付时间95%(4周到36小时)提高开发效率20%降低IT运维成本$1.5M/year有能力对开发者的需求说“YES”减少每个VM每月成本80%($133to$20)降低基础架构成本$4.5M/yearStart–4weeksGoal–24hoursTodayToday9VMware运维管理方案概览10VMware云计算管理任务和解决方案VMware能够简化IT管理并实现其自动化,同时使IT部门能够跨多个平台和提供商管理服务云计算自动化管理以服务的形式跨多个云环境和平台自动交付个性化基础架构、应用和桌面云计算运维管理管理涉及结构化和非结构化数据的基础架构和应用的运行状况、风险、能效与合规性云计算业务管理通过让交付的所有IT服务在成本和质量上完全透明,提高业务/IT协调性并加快IT转型IT服务代理11运维管理套件VMware云运维管理平台云运维记分牌ExtensibilityAPIsSDKs3rdPartyadaptersContentPacksHelpdeskIntegratedManagementDisciplines性能遵从性配置容量成本PatentedAnalyticsAppVisibilityLogsInventoryReportingAutomation12IT运维逻辑架构vCenterOperationsManagementHypericLogInsight测试开发用户测试负载测试生产环境CollectWorkloadSNMPMetricsMonitoringAdapterLayerRepositoryServiceAggregationFrameworkRESTServices13云运维管理的目标与需求需求服务质量(QoS)降低平均解决问题时间(MTTI):基础架构和应用的可见性主动避免问题发生快速解决影响业务的问题运维效率降低投入和运维成本:优化资源使用,避免不必要的投入提高团队效率,提高VI/Admin的比率控制和遵从保持IT策略遵从:遵从的运维可见性保证IT策略在资产和架构上的遵从性目标14QoS:支持混合环境vSphere、应用、存储等层次的记分牌15LUNS管理员得到警告,Oracle数据库所在虚机运行缓慢Oracle虚拟机有性能问题LUN健康值恶化VNX|TargetHBAResetsTargetHBA‘Resets’值偏高检查LUN的详细信息(EMCVNX:LUN44)IOOUTSTANDINGDISKIO(870/1024)显示IO过高检查VNX分析页面SP-A变红(存储控制器A)(从VNX管理包获取)1234交易延迟增加QoS:全方位的可见性16QoS:通过问题警告,帮助定位问题根源Problemalerts17QoS:通过日志,解决故障诊断“最后一英里”的难题SCSIErrorsNFSErrorsvMotionFailuresHostDisconnectsDroppedPacketsFailedTasksSlowHostSyncsSlowDBQueries18云运维管理的目标与需求需求服务质量(QoS)降低平均解决问题时间(MTTI):基础架构和应用的可见性主动避免问题发生快速解决影响业务的问题运维效率降低投入和运维成本:优化资源使用,避免不必要的投入提高团队效率,提高VI/Admin的比率控制和遵从保持IT策略遵从:遵从的运维可见性保证IT策略在资产和架构上的遵从性目标19运维效率:容量使用分析分析当前状态和未来需要根据业务需要,定制容量分析策略20运维效率:为未来项目使用规划容量未来项目的场景规划21运维效率:异构环境下的容量规划扩展了容量分析场景,除了虚拟环境外,可以支持任何资源的容量规划,包括存储、网络和其他共有云、私有云资源等22运维效率:查看优化机会未使用资源的报告23运维效率:回收未使用资源资源回收工作流24云运维管理的目标与需求需求服务质量(QoS)降低平均解决问题时间(MTTI):基础架构和应用的可见性主动避免问题发生快速解决影响业务的问题运维效率降低投入和运维成本:优化资源使用,避免不必要的投入提高团队效率,提高VI/Admin的比率控制和遵从保持IT策略遵从:遵从的运维可见性保证IT策略在资产和架构上的遵从性目标25发现变更评估报告修复控制和遵从性:跨虚拟和物理环境在虚拟和物理机上建立和部署遵从性按需实施策略管理•在企业业务中,针对不同的应用角色设定连续的自动遵从管理•企业最佳实践•常规标准:SOX,HIPAA,GLBA,FISMA,BSI•行业标准:PCIDSS,NERC/FERC•厂商加固标准持续的补丁管理,应对已知风险•Windows,UNIX,Linux,MAC•评估和部署记分牌提供一览式轨迹跟踪最佳实践26控制和遵从性:异构环境跨虚拟和物理环境1000多种设置和配置,来自:•vCenter•vSphereHostsandGuests•VirtualNetworkandStorage•主机配置文件•多种操作系统27控制和遵从:合规性记录遵从指标加载vCM,对不遵从项目进行管理vSphere加固指南28云中的关键应用运维管理29不同层次上的性能指标ExampleApplicationperformance计数器•SAP–TxnResponsetimes•Exchange-messagequeues+RPCtraffic•Databasecachemetrics(minimizeI/O)GuestOS计数器•SWAP,runqueue,memoryused/freeVirtual计数器•I/Olatency(DAVG/KAVG):10-20ms•CPUusage,%readyvSphereGuestOS30vCops监控关键应用OpenVPNPostgresDBvSphereWebAppCustomWebAppAdminWebAppvCenterOperationsManagervAppUIVMRolledupcapacitydataCapacityAnalyticsFSDBPostgresDBCollectorActiveMQPerformanceAnalyticsAnalyticsVMMetricDataVMwareCloud/vCentervSphereVMwarevSphereUIvCenterCommunicationsoverSSLCustomUIvSphereAdapterBCAAdaptersDataSources31通过Adapter抓取应用指标资源–监控入口如SAPsystem,database,VM在vCOps中,指向资源•获取相应的指标从单一的控制台查看•将不同来源的指标协同分析注意不同资源间名称的转换•避免混淆•由Adapter自动生成自定义界面:Environment-EnvironmentOverviewGuestOScountersdiscoveredbyHypericvSpheremetricsforVMSAPAdapterHypericAdaptervSphereAdapter32创建自定义仪表盘FilteronresourcesSelectindividualmetric33建立SAP应用容器(ApplicationContainer)自定义界面:Environment-ApplicationsOverview-Select“SAPSystem(PRD)”TiersDouble-clicktodrill-downandseeResourceobjectsincalltheappserverVMsResourcesVirtualMachine“PRD–10.140..44.22”etc..SAPResourcenameApplicationContainername34示例:SAP仪表盘在线响应时间数据库响应时间AppSrv1AppSrv2DBCPUReadLatency35SAP故障诊断场景•收到警告后,能快速查看异常和记录AlertAnomaliesOwner36Oracle运维仪表盘Oracle数据库管理员的运维界面在一个界面内,能够图形展示Oracle数据库的健康和结构!vCOps的Oracle应用监控来源于多种解决方案包SolutionPacks(SP)DatastorefromvCenterAdapterLUNfromEMCESASPFabricfromBrocadeSPDBfromOracleOEMAdapterLinuxOSfromHypericSPClusterfromvCenterAdapterOracleHostfromOracleOEMAdapterVMfromvCenterAdapterOracleContactorOwnerLineofBusinessDataCenter37Oracle仪表盘Oracle数据库管理员深入分析了解不同Oracle组件的差异•Fabrics,OS,DB,Datastore,LUN,etc显示不同组件的异常及发生次数38Oracle仪表盘Oracle数据库管理员深入分析发现特定的组件及异常39VMwareSolutionexchangemarket40相关的实验课程HOL:HOL-SDC-1301AppliedCloudOperationsHOL-SDC-1317vCloudSuiteUseCases-BusinessCriticalApplicationsVCM4891THANKYOU
本文标题:514云时代的运维管理
链接地址:https://www.777doc.com/doc-6207163 .html