您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 水利工程 > 脱网问题前期工作整理 V1_20090525
内部资料注意保密ChinaMobileResearchInstitute脱网问题前期工作小结终端所李雯雯2009年5月内部资料注意保密ChinaMobileResearchInstitute提纲脱网概述什么是脱网脱网的主要现象脱网发生的场景脱网分类脱网影响脱网原因分析脱网解决方案及风险建议内部资料注意保密ChinaMobileResearchInstitute脱网概述Ⅰ什么是脱网脱网主要指终端作为被叫呼不通或不能发起业务(如打电话、发短信等)的状态,与终端和网络都有关。脱网的主要现象终端界面显示如下信息,提示发生脱网“限制服务”“注册未知”“无信号”“紧急呼叫”终端界面可操作,但底层与网络失去交互脱网发生的场景终端一般在室内Idle状态下容易发生脱网,尤其当终端处于2/3G切换带时,可能由于频繁的重选、切换等操作造成脱网。连接状态下的脱网情况较少。内部资料注意保密ChinaMobileResearchInstitute脱网概述Ⅱ脱网分类可恢复性脱网定义:即“假脱网”,无法进行呼入呼出,在一段时间内业务不可用,但终端随后会自动恢复的情况。场景:终端处于搜网和跨系统重选等情况,无法呼入呼出。较容易处理不可恢复性脱网定义:即“真脱网”,终端一直无法进行任何业务,必须重启终端才可以恢复正常。场景:见后文。较难处理。后面若非特殊说明,均指不可恢复性脱网。脱网影响频繁脱网会严重影响TD终端的用户体验,尤其是不可恢复性脱网。可/不可恢复性脱网可以互相转化,若终端增加冗余性保护和异常复位机制,可有效的解决不可恢复性脱网问题,或将其转化为可恢复性脱网问题。内部资料注意保密ChinaMobileResearchInstitute提纲脱网概述脱网原因分析终端侧引起脱网的原因网络侧引起脱网的原因终端与网络IOT引起脱网的原因脱网主要原因影响大小脱网解决方案及风险建议内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅰ终端侧引起脱网的原因终端CP模块由终端无线Modem稳定性和容错性方面的缺陷导致,可能表现为界面正常,但无法进行正常的主被叫服务。终端协议栈模块由DSP侧程序运行的稳定性和容错性,以及ARM侧对复杂流程或异常流程的处理导致;终端协议栈存在Bug,导致和网络失去交互,但从应用界面上看还显示正常。终端AP模块终端应用平台或APP存在Bug,导致死机,无法进行任何操作协议栈和上层应用交互异常,多见于双芯片结构终端进行大数据量业务的交互时。其它问题由于软件异常导致SIM/USIM卡检测失败或鉴权失败,属于个别SIM/USIM卡兼容性问题,不具备普遍意义。快速显示:为了提高客户感受,终端会在驻留小区但未发起注册时显示用户上次注册信息,发生“假脱网”,概率很小。内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅰ终端侧引起脱网的原因1234底层CP模块:终端无线Modem稳定性和容错性方面存在缺陷AP模块:协议栈和上层应用交互异常,多见于占用系统资源较大和线程调度频繁的应用,如视频电话、CS/PS并发业务等其它问题:个别SIM/USIM卡兼容性问题,不具备普遍意义;快速显示带来暂时性“注册未知”,发生概率很小协议栈模块:DSP侧程序运行的稳定性和容错性,以及ARM侧对复杂流程或异常流程的处理存在缺陷终端侧的主要原因在于终端稳定性不够,程序本身存在Bug,另外对异常流程的保护和复位机制欠妥。终端侧本身引起的脱网所占比率较低,一旦发现问题,解决后在后续版本中不会重复出现。内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅱ网络侧引起脱网的原因网络弱场网络信号很弱,终端处于无网络或紧急呼叫状态,难以完成小区驻留和位置区更新,同时增加了终端搜网的功耗。邻区配置强干扰小区没有配置,会导致终端测量不准;配置虚假小区,会影响终端同频信道估计的准确性及测量精度;邻小区数量太多,终端测量间隔变长,导致终端不能对信号强度的变化做出及时响应。网路参数设置重选切换门限配置太低,导致终端在发起切换之前就已经脱网;重选切换门限配置太高,形成2/3G互操作乒乓区,导致终端重选/切换频繁,增加脱网机率。传输环境复杂当传输环境存在严重的多径干扰和损耗时,导致到达网络侧的功率可能低于其解调门限,造成终端上行接入失败。网络坏点基站侧存在Bug,不响应终端的信令交互。内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅱ网络侧引起脱网的原因1234网络弱场:终端处于无网络或紧急呼叫状态,难以完成小区驻留和位置区更新,同时增加搜网功耗网路参数设置:重选切换门限配置太低或太高,均会影响终端重选、切换过程,增加脱网机率其它问题:传输环境复杂,存在严重的多径干扰和路径损耗;存在网络坏点,不响应终端的信令交互邻区配置:邻小区配置不正确或不完备,影响终端测量的准确性和响应时间。网络侧的主要原因在于网络覆盖不足、网规网优不完善。需加强信号覆盖,减少乒乓切换区域,配置合适的邻区以及重选切换参数等。网络侧本身引起的脱网所占比率较高,部分问题可归入终端与网络IOT异常。较难解决,需网络侧配合。内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅲ终端与网络IOT引起脱网的原因现象LU/RAU过程失步:跨系统重选时,LU/RAU过程中失败,未能正常完成注册,导致终端进入限制服务。终端与网络IOT异常多数引起掉话,较少引起脱网。主要原因终端和接入网交互失败空口信号质量太弱,导致终端系统消息读取失败、随机接入请求过程失败等;位置更新有鉴权或加密过程。终端和核心网交互失败终端在和核心网网元进行交互过程中,信令交互失败导致LU/RAU未完成。终端与网络IOT出现异常一般可归结为前述任何终端侧或网络侧的异常,有时是多个异常原因的组合。内部资料注意保密ChinaMobileResearchInstitute脱网原因分析Ⅳ脱网主要原因影响大小常见问题问题的可能原因T3G发生概率联芯发生概率展讯发生概率终端协议栈存在bug,导致和网络失去交互,但从应用界面上看还显示正常10%50%较低终端应用平台或APP存在bug,导致死机,无法进行任何操作30%10%较低由于软件异常导致SIM/USIM卡检测失败,认为掉卡40%0%在使用有些种类的卡时偶发网络自身原因或终端和网络IOT问题模式切换后LU/RAU过程中失败,导致终端进入限制服务20%40%卡内参数THRESHOLD=0时lu有一定几率失败,具体问题已反映终端自身原因总体说来,脱网原因复杂多样。可能由于终端或基站自身软件或设计上的Bug,也有可能由于网规网优工作不完善,引起终端与网络交互方面出现了异常,从而导致脱网。一般来说,终端自身原因引起的脱网多为偶发事件,影响较小;而与网络有关的原因多为频繁发生事件,影响较大。内部资料注意保密ChinaMobileResearchInstitute提纲脱网概述脱网原因分析脱网解决方案及风险复现脱网场景测试验证手段预防脱网的措施建议内部资料注意保密ChinaMobileResearchInstitute脱网解决方案Ⅰ复现脱网场景解决脱网的最大困难在于问题的复现和场景的提取目前暂无有效的方法,主要通过经验积累,对于出现问题的区域,增加嵌入式异常记录功能的测试代码,以保留终端异常信息。复现要求终端的测试步骤和测试方法与暴露问题时一致;终端和网络的版本不变;终端和网络的Log完备:终端侧需要知道发生该现象时终端接收到的网络配置、终端的处理流程和测量信息、以及上下行数据情况。网络侧需提供当时网络的配置参数、该地点网络的实际布网情况、网络的处理流程和数据接收/发送情况的日志等。风险网络侧相关信息的获取方面存在困难,终端无法自动获得网络的Log,尤其是对突发、偶发性问题;另外,让网络实时监控也不现实。内部资料注意保密ChinaMobileResearchInstitute脱网解决方案Ⅱ测试验证手段脱网问题的一般解决过程Step1:一旦问题被复现,首先需要终端分析流程和处理是否异常,以排除是否网络问题。若排除不了,转入Step2;Step2:其次需要网络侧配合抓取网络的Log,用来分析空口交互是否异常,和网络一起进行确认和联调;Step3:在同等的条件下,会采用对比终端进行对比测试,以排除是否个别终端的问题。风险一个脱网问题的排查根据难度大约需要1周~1个月,需要专门的测试车、测试设备和测试人员进行定点定位;如果是与网络相关的偶发或低概率问题,跟踪时间会更长,投入成本会更大;有些问题受特定条件的限制,难以复现,即使捕捉到异常原因并改进了方案,也很难进行验证整改成效,同时测试验证方案本身也存在风险。内部资料注意保密ChinaMobileResearchInstitute脱网解决方案Ⅲ预防脱网的措施开发新的针对脱网问题的定位方法和工具,以及内嵌式Log记录工具,通过友好用户试用、内部测试等方式发现或暴露问题现有2/3G测试用例也较简单,需要总结前期测试问题,开发异常流程测试和压力测试用例集,提高终端在出厂前的底层稳定性指标要求终端在设计实现上增加冗余性保护和异常复位机制,尽量使不可恢复性脱网转化为可恢复性脱网。举例如下:针对终端CP与AP交互异常:1)短时间脱网,终端可一直处于主动搜网状态,以选择更好的小区驻留;2)长时间脱网,自动触发终端重启,但不会影响用户体验。构建异常机制完备性检测验证环境,加入各种异常机制的自动化测试脚本,模拟并预防终端可能出现的各种脱网现象。内部资料注意保密ChinaMobileResearchInstitute提纲脱网概述脱网原因分析脱网解决方案及风险建议内部资料注意保密ChinaMobileResearchInstitute建议终端侧终端自身改进主要在实现的稳定性和健壮性方面加强测试力度,尽量减少软件上的Bug;终端同时可考虑在设计上增强稳定性的冗余保护和异常复位机制,尽量将不可恢复性脱网转化为可恢复性脱网;加强双芯片之间数据交互的稳定性,尤其是大数据量的交互和一些临界状态的保护等等。网络侧优化布网策略,尽量减少TD弱场及乒乓区域的存在;优化网络侧重选迟滞门限和重选时延策略;对于强同频干扰,终端侧尽量优化干扰消除算法;网络侧需要考虑配置正确且完善的邻区关系;加强各个系统厂商网络升级前的兼容性测试,以避免大规模升级后出现的一系列问题。收集各省公司出现的脱网异常现象,提供给芯片平台及终端厂家分析。要求省公司同时提供发生脱网场景时的网络设备商。
本文标题:脱网问题前期工作整理 V1_20090525
链接地址:https://www.777doc.com/doc-3266327 .html