您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > 一卡通系统现场常见故障处理培训文档
一卡通系统现场常见故障处理新中新集团第一产业群事业部客户服务部目录•现场技术问题处理•制度管理问题处理•宣传推广问题处理现场技术问题处理第一部分一卡通数据中心一卡通系统数据中心数据中心的系统检查数据中心的常见问题处理数据中心的系统检查查看一卡通服务查看一卡通系统日志文件查看数据中心系统状态查看数据中心一卡通服务程序(1)钱包服务(1):nserve网络服务dbserve接收联机交易的流水dserve同步信息b_actl控制连接通信的进程b_atra自动转帐b_detra冲正b_trade主交易进程查看数据中心一卡通服务程序(1)钱包服务(2):sdb2与查询同步msr交易接收mss交易发送dsqlserv查询服务dbproc接收脱机的流水userve脱机交易ftpserv文件传输mserve监控各个服务的运行情况查看数据中心一卡通服务程序(2)身份服务:nserve网络服务idserve身份服务msr交易接收mss交易发送ftpserv文件传输mserve监控各个服务的运行情况典型业务处理流程:•查询交易处理流程•联机交易处理流程•脱机交易处理流程典型业务后台处理流程-查询类nservemsrdsqlservemss访问数据库综合业务/第三方系统ftpserve通过内部dll或者标准第三方dll数据量较小,采用交易包数据量较大,形成文件,并返回文件名称查询结果文件典型业务后台处理流程-联机交易类nservemsrdbservemss访问数据库综合业务/第三方系统/网关/以太网POS通过内部交易或者dll或者标准第三方dll成功/失败同时形成到web的同步文件典型业务后台处理流程-脱机交易脱机交易是指对网关、以太网pos的消费流水进行处理:新处理:正确流水插入trjn表上传流水插入utrjn表DbprocUserveData目录中流水文件流水查看一卡通系统日志文件日志文件TransLog:日期时间事件代码系统代码流水号操作员号提示信息2004101411:07:558200010000000083000delete/histrjn2004101411:07:558200010000000083000insert/histrjn2004101411:07:558200010000000083000delete/trjn2004101411:07:558200010000000083000delete/utrjn2004101411:07:558200010000000083000开工完成2004101411:08:008200010000000083000连接数据库成功!2004101113:12:092300430000000108000插入流水表重复!2004101113:26:312300010000000369000商户余额不足!查看数据中心系统状态检查查看系统状态查看网络状态查看数据库连接状态查看操作系统状态(1)一、主要查看系统运行的状态,用rtpm命令观察cpu和内存使用状态如图:一定注意cpu用在等待I/O的时间不应该超过10%,高的I/O等待时间通常表示cpu正在等待磁盘。查看操作系统状态(2)如果只能检测cpu的饱和情况可以不用rtpm命令查看系统状态,使用sar这个命令也可以,一般使用-u、-q参数,常用的是-u这个参数。-u:选项所显示的队列报告了cpu的用户进程,系统进程,等待I/O和空闲时间上的百分比。(和rtpm所显示的内容一致)-q:选项指示在运行队列中当前有多少进程正在竞争cpu的资源。举例说明:附加Sar例题说明#sar-u15UnixWareuw71357.1.3i38603/26/0316:39:30%usr%sys%wio%idle%intr16:39:31424511116:39:32354202316:39:33263903516:39:34174503816:39:35945046Average2643031Sar例题说明%usr:CPU处在用户模式下的时间百分比。%sys:CPU处在系统模式下的时间百分比。%wio:CPU等待输入输出完成时间的百分比。%idle:CPU空闲时间百分比在所有的显示中,我们应主要注意%wio和%idle,%wio的值过高,表示硬盘存在I/O瓶颈,%idle值高,表示CPU较空闲,如果%idle值高但系统响应慢时,有可能是CPU等待分配内存,此时应加大内存容量。%idle值如果持续低于10,那么系统的CPU处理能力相对较低查看操作系统状态(3)二、查看系统队列的状态:用ipcs命令观察如果不正确则执行ipcr删除队列再查看是否被清除如果清除重启服务,如果还有则手动清除如图:查看系统网络状态查看网络状态:如果端口为9999的网络连接数小于50基本正常,如果大于50个并且系统不能正常工作则要停止服务程序后再观察连接是否变化,如果减少则重启服务再作观察,没有变化则重启机器再作观察。见图查看数据库连接状态查看数据库连接状态:在sqlplus中查询,正常情况school用户不超过15个,idmanage用户不超过30个;如果超出范围并且系统不能正常运行则停止后台服务程序再重启数据库。(selectusernamefromV$session;)附加数据中心的常见问题处理一、服务器经常宕机有以下几种情况二、访问数据库速度慢有以下几种情况三、服务不能正常启动四、后台服务接收不到前置机请求问题五、数据库密码文件损坏如何处理六、数据库数据文件损坏问题系统宕机问题A、RAID卡驱动不正确,解决办法重装驱动。B、网络连接过多造成服务器宕机,解决办法重启机器后检查网络状态。C、硬件问题:如内存条有问题等一、服务器经常宕机有以下几种情况:访问数据库速度慢问题A、共享池问题,调整initsyntong.ora或initiddbsvr.ora两个文件中的参数:db_block_buffers=20480缓冲区块数shared_pool_size=256000000共享池大小(字节)B、网络连接过多,解决办法重启机器。C、数据库本身处理慢就要更改etc/config.dat中两个参数:USERVE_DCOUNT50;处理的笔数USERVE_GAP3;每次处理间隔的时间D、有大量的查询,解决办法停止查询。E、由于数据库长时间使用碎块比较多所以速度会慢些,解决办法把备份的数据文件导回数据库中。F、给oracle分配的表空间过小,比如temp表空间很小,具体大小可以参考中心安装说明书二、访问数据库速度慢有以下几种情况:服务不能正常启动问题处理方法:首先可以查看日志文件TransLog,确认登录数据库不正常后,检查.profile文件配置是否正确,尤其是.profile中的路径是否和实际oracle安装的路径一致。没有发现问题就再查看数据库是否正常启动,都确定无误后再在school或idmanage用户下连接数据库,连接正常后重启服务。三、服务不能正常启动现象:与数据库相关的进程无法启动原因:1、.profile文件中配置有问题2、oracle没有正常启动后台服务接收不到前置机请求?四、后台服务接收不到前置机请求问题现象:后台接不到前置机的开工命令原因:1、网络问题:检查服务器与前置机是否连通,双方接发数据都正常。2、配置问题:etc目录下的config.dat文件中配置是否与实际情况一致。3、密钥问题:由于动态密钥不一致造成后台不能正确接收前置机的请求;解决办法,删除db目录下dserve.wk,重启dserve。数据库密码文件损坏问题(1)五、数据库密码文件损坏如何处理现象:用户显示屏幕上提示如下提示:1、ora-01991:invalidpasswordfile:’/home/oracle/app/oracle/product/8.1.7/dbs/orapwsyntong‘2、ora-01990:erroropeningpasswordfile'/home2/oracle/product/8.1.7/dbs/orapw'原因:数据库中的密码文件损坏造成的数据库密码文件损坏问题(2)处理方法:第一种:把对机oracle用户下的db文件夹全部导入到本机;第二种:执行orapwd命令生成一个新的密码文件;用法:orapwdfile=fnamepassword=passwordentries=usersFilename:密码文件名;Password:设置sys/system帐号的口令change_on_install;Entries:密码文件中可以存放的最大用户数,对应于允许以SYSDBA/SYSOPER权限登录数据库的最大用户数。由于在以后的维护中,若用户数超出了此限制,则需要重建密码文件,所以此参数可以根据需要设置得大一些数据库数据文件损坏问题(1)六、数据库数据文件损坏问题:原因:关闭机器时,没有正常关闭数据库,造成数据文件损坏。现象:用户显示屏幕上提示如下提示:(1)、ora-01122:databasefile25failedverificationcheck(2)、ora-01110:datafile25:'/oracledata/oradata/syntong/idmanage_data5.dbf‘(3)、ora-01251:unknownfileheaderversionreadforfilenumber25数据库数据文件损坏问题(2)数据库数据文件损坏问题:解决办法://exportORACLE_SID=syntongsvrmgrlconnectinternalstartupmountalterdatabasedatafile‘损坏的文件名'offlinedrop---此时如果提示statementprocessed则表处理成功alterdatabaseopen如果此时数据库启动正常,则马上备份数据,并重建损坏的数据文件数据库其他错误分析问题分析:ORA-01652:unabletoextendtempsegmentbynumintablespacename产生原因:ORACLE临时段表空间不足,因为ORACLE总是尽量分配连续空间,一但没有足够的可分配空间或者分配不连续就会出现上述的现象。解决办法加大对临时表空间的扩展。-------------------------------ORA-01688:unabletoextendtablename.namepartitionNAMEbyNUMintablespaceNAME产生原因:指定的tablespace空间已经被占用满,无法扩展。解决办法:这两个问题都需要增加表空间的数据文件(大小、个数)第二部分应用系统常见问题处理各子系统使用的端口一卡通系统后台:99999998888888878812综合前置机:8000800185006666银行转账前置机:99998000身份前置机:85009000900290041521门禁考勤子系统:8003850080网站使用中出现的问题问题:圈存机查询不到流水产生原因及解决方法:检查transcreen\WEB-INF\config\applicationContext-schoolInfo.xml文件里面配置的是电子支付还是非电子支付,根据后台配置设相应值圈存机使用中出现的问题问题:圈存机白屏产生原因及解决方法:1、网络和系统是否有问题。2、是否配置“刷新时间间隔”,没有则配置。3、tomcat是否宕掉,如宕掉重启服务。4、tomcat是否内存溢出,如溢出则需更改tomcat配置参数等并重启服务。5、如果单台机器出现白屏则有可能是203机器本身网络接口问题。网站使用中出现的问题问题:用户无法登陆网站产生原因:syntong库与iddbsvr库中的account表没有及时同步。解决方法:iddbsvr库中account需要删除重建,并重启school用户的sdb2服务卡片使用中出现的问题问
本文标题:一卡通系统现场常见故障处理培训文档
链接地址:https://www.777doc.com/doc-963131 .html