您好,欢迎访问三七文档
1OracleGoldenGate日常运维手册2OracleGoldenGate日常运维手册2.4OGG日常监控2.4.1OGG常用监控命令.4.1.1启动GoldenGate进程1)首先以启动GoldenGate进程的系统用户(一般为oracle)登录源系统。2)进入GoldenGate安装目录,执行./ggsci进入命令行模式。3)启动源端管理进程GGSCIstartmgr4)同样登陆到目标端GoldenGate安装目录,执行./ggsci,然后执行GGSCIstartmgr启动管理进程。5)在源端执行GGSCIstarter*启动所有进程6)同样登录到备份端执行GGSCIstarter*启动所有进程7)使用GGSCIinfoer*或者GGSCIinfo进程名察看进程状态是否为Running(表示已经启动)。注意有的进程需要几分钟起来,请重复命令观察其启动状态。说明:无论源还是目标,启动各extract/replicat进程前需要启动mgr进程。8)start命令的一般用法是:?start进程名称如:GGSCIstartextdm启动一个名叫extdm的进程;?也可以使用通配符,如:GGSCIstarter*启动所有的extract和replicat进程;GGSCIstartextract*d*启动所有的包含字符‘d’extract进程;?GGSCIstartreplicatrep*启动所有以“rep“开头的replicat进程2.4.1.2停止GoldenGate进程依照以下步骤停止GoldenGate进程:31)以启动GoldenGate进程的系统用户(一般为oracle)登录源主机,进入GoldenGate安装目录执行./ggsci进入命令行管理界面2)(**注:本步骤仅针对抽取日志的主extract进程,datapump进程和replicat进程不需要本步骤)验证GoldenGate的抽取进程重起所需的日志存在,对各个主extXX进程,执行如下命令:ggsciinfoextXX,showch„..ReadCheckpoint#1„.RecoveryCheckpoint(positionofoldestunprocessedtransactioninthedatasource):Thread#:1Sequence#:9671RBA:239077904Timestamp:2008-05-2011:39:07.000000SCN:2195.1048654191RedoFile:NotavailableCurrentCheckpoint(positionoflastrecordreadinthedatasource):Thread#:1Sequence#:9671RBA:239377476Timestamp:2008-05-2011:39:10.000000SCN:2195.1048654339RedoFile:NotAvailableReadCheckpoint#2„..RecoveryCheckpoint(positionofoldestunprocessedtransactioninthedatasource):Thread#:2Sequence#:5287RBA:131154160Timestamp:2008-05-2011:37:42.000000SCN:2195.1048640151RedoFile:/dev/rredo07CurrentCheckpoint(positionoflastrecordreadinthedatasource):Thread#:2Sequence#:5287RBA:138594492Timestamp:2008-05-2011:39:14.0000004SCN:2195.1048654739RedoFile:/dev/rredo07„..首先察看RecoveryCheckpoint所需要读取的最古老日志序列号,如举例中的实例1需要日志9671及其以后所有归档日志,实例2需要序列号为5287及以后所有归档日志,确认这些归档日志存在于归档日志目录后才可以执行下一步重起。如果这些日志已经被删除,则下次重新启动需要先恢复归档日志。注意:对于OGG11及以后版本新增了自动缓存长交易的功能,缺省每隔4小时自动对未提交交易缓存到本地硬盘,这样只需要最多8个小时归档日志即可。但是缓存长交易操作只在extract运行时有效,停止后不会再缓存,此时所需归档日志最少为8个小时加上停机时间,一般为了保险起见建议确保重启时要保留有12个小时加上停机时间的归档日志。1)执行GGSCIstoper*停止所有源进程,或者分别对各个进程执行stop进程名单独停止。2)以oracle用户登录目标系统,进入安装目录/oraclelog1/goldengate,执行./ggsci进入命令行。3)在目标系统执行stoper*停止复制4)在两端进程都已停止的情况下,如需要可通过stopmgr停止各系统内的管理进程。类似的,stop命令具有跟start命令一样的用法。这里不再赘述。注意,如果是只修改抽取或者复制进程参数,则不需要停止MGR。不要轻易停止MGR进程,并且慎重使用通配符er*,以免对其他复制进程造成不利影响。2.4.1.4查看参数设置5使用viewparams进程名可以查看进程的参数设置。该命令同样支持通配符*。2.4.1.5查看进程状态使用info进程名称命令可以查看进程信息。可以查看到的信息包括进程状态、checkpoint信息、延时等。如:还可以使用info进程名称detail命令查看更详细的信息。包括所使用的trail文件,参数文件、报告文件、警告日志的位置等。如:使用info进程名称showch命令可以查看到详细的关于checkpoint的信息,用于查看GoldenGate进程处理过的事务记录。其中比较重要的是extract进程的recoverycheckpoint,它表示源数据中最早的未被处理的事务;通过recoverycheckpoint可以查看到该事务的redolog位于哪个日志文件以及该日志文件的序列号。所有序列号比它大的日志文件,均需要保留。2.4.1.6查看延时GGSCIlag进程名称可以查看详细的延时信息。如:2.4.1.7查看统计信息GGSCIstats进程名称,时间频度,tableownername.tablename可以查看进程处理的记录数。该报告会详细的列出处理的类型和记录数。如:GGSCIstatsedr,total列出自进程启动以来处理的所有记录数。GGSCIstatsedr,daily,tablegg.test列出当天以来处理的有关gg.test表的所有记录数。2.4.1.8查看运行报告GGSCIviewreport进程名称可以查看运行报告。如:6也可以进入到GoldenGate安装目录/dirrpt/目录下,查看对应的报告文件。2.4.2Logdump使用指引1)在GGSCI中使用如下命令查看当前处理的队列文件和RBA号,例如:GGSCIinfoREPYXA2)在GoldenGate安装目录执行logdump命令3)打开要查看的队列文件Logdumpopen./dirdat/p1000556CurrentLogTrailis./dirdat/p1000556LogdumpghdronLogdumpdetailonLogdumpdetaildataLogdumpusertokenonLogdumppos59193235上面INFO命令看到的RBA号码Logdumpn输入n显示当前处理的表及相关操作再次输入n,显示下一条记录,如果要跳过当前记录,方法如下:GGSCIalterREPYXAextseqno556,extrba上面再次输入n看到的下一个RBA号,其中556为上面INFO看到的队列文件,0之后的数字4)打开下一个队列文件LogdumpNEXTTRAIL5)使用logdump查看SCN号Logdumpggstokendetail只有在事务开始的RBA号,才记录对应的SCN号和TransactionID,示例如下:上图显示SCN号:4024322,TRANID:6.38.16007如果进程出现问题,可以找到在处理那个事务时出现问题,修改进程提前到该事务之前的时间点进行重新抽取,然后从找到的SCN号启动replicat进程,例如:GGSCIstartrep_xxxATCSN40243326)使用COUNT统计队列文件中包含的记录条数按时间点统计LogdumpCOUNTSTART2006-01-1112:00:00,END2006-01-1212:00:00统计ls开头的每个队列文件包含的条数LogdumpCOUNTLOGls*LogdumpCOUNTDETAILLogdump7)使用FilterLogdumpFILTERINCLUDEFILENAMESchema.table_nameLogdumpCOUNT查看队列文件中,包含该表的记录条数LogdumpFILTERINCLUDETRANSIND10=startoftransaction1=middleoftransaction2=endoftransaction3=onlyrecordintransaction可以统计队列文件中的事务,可以利用该命令查找事务开始点,如果没有开始的事务,直接找上一个文件即可。2.5OGG日常运维任务2.5.1配置自动删除队列1)进入安装目录执行./ggsci;2)执行editparammgr编辑管理进程参数,加入或修改以下行8purgeoldextracts/goldengate安装目录/dirdat/*,usecheckpoint,minkeepdays7其中,第一个参数为队列位置,*可匹配备份中心所有队列文件;第二个参数表示是首先要保证满足检查点需要,不能删除未处理队列;第三个参数表示最小保留多少天,后面的数字为天数。例如,如果希望只保留队列/ggs/dirdat/xm文件3天,可以配置如下:purgeoldextracts/ggs/dirdat/xm,usecheckpoint,minkeepdays33)停止MGR进程,修改好参数后重启该进程GGSCIstopmgrGGSCIstartmgr注:临时停止mgr进程并不影响数据复制。2.5.2配置启动MGR时自动启动Extract和Replicat进程1)进入安装目录执行./ggsci;2)执行editparammgr编辑管理进程参数,加入以下行AUTOSTARTER*3)停止MGR进程,修改好参数后重启该进程GGSCIstopmgrGGSCIstartmgr注意:一般建议不用自动启动,而是手工启动,便于观察状态验证启动是否成功,同时也便于手工修改参数。2.5.3配置MGR自动重新启动Extract和Replicat进程GoldenGate具有自动重起extract或者replicat进程的功能,能够自动恢复如网络中断、数据库临时挂起等引起的错误,在系统恢复后自动重起相关进程,无需人工介入。1)进入安装目录执行ggsci进入命令行界面;92)执行editparammgr编辑管理进程参数,加入以下行AUTORESTARTER*,RETRIES3,WAITMINUTES5,RESETMINUTES60以上参数表示每5分钟尝试重新启动所有进程,共尝试三次。以后每60分钟清零,再按照每5分钟尝试一次共试3次。3)停止MGR进程,修改好参数后重启该进程,使修改后的参数文件生效GGSCIstopmgrGGSCIstartmgr2.5.4长事务管理在停止抽取进程前需要通过命令检查是否存在长交易,以防止下次启动无法找到归档日志:ggsciinfoextXX,showch2.5.4.1查看长交
本文标题:ogg运维文档
链接地址:https://www.777doc.com/doc-6884195 .html