Informix地监控和管理命令
监控ONLINE系统后动情况的工具主要有以下三类:系统监控接口(SMI)、tbstat和tbcheck。 一、 系统监控接口(SMI) 我们主要通过SQL命令操作online的内部数据库sysmaster中的内部表/结构,来获取有关的维护信息。Sysmaster是在online初次初始化时,系统自动创建的。它实际主要存储了一些数据结构,而不是真正的表。使用SMI有如下限制:
不能对SMI中的表加锁或使用隔离级别。
不允许使用insert,delete,update等语句(只读)
不能使用dbschema,dbexport等命令
使用select rowid语句将会产生不可预料的结果 主要的SMI表有:
sysdatabases:online中的数据库信息
systabnames:某数据库中所有表的信息
syslogs:逻辑日志信息
sysdbspaces:数据库信息
syschunks,syslocks等
例1:显示处于脱机(offline)状态的chunk的序号和所在数据库空间
Select chknum,dbsnum from syschunks where is_offline=1 or misline=!
例二:显示满chunk的信息
Select chknum,dbsnum from syschunks where nfree=0 二、 TBSTAT 列出当前时刻的信息(实际也是读取SMI表)
不需要磁盘I/O
不需要锁等系统资源,因此不会影响系统性能 用法: tbstat [-abcdklmpstuzBDFPRX] [-r seconds] [-o file] [infile] -a print all info (options: bcdklmpstu)
-b print buffers(缓冲区)
-c print configuration file(配置文件)
-d print dbspaces and chunks(dbspace和chunk)
-k print locks(锁)
-l print logging(日志)
-m print message log(消息日志)
-p print profile(profile文件)
-s print latches(门闸)
-t print tblspaces(表空间)
-u print users(用户)
-z zero profile counts
-B print all buffers
-D print dbspaces and detailed chunk stats
-F print page flushers(页刷新进程)
-P print profile, including BIGreads
-R print LRU queues(LRU队列)
-X print entire list of sharers and waiters for buffers
-r repeat options every n seconds (default: 5)
-o put shared memory into specified file (default: tbstat.out)
infile use infile to obtain shared memory information
三、 几个常用的tbstat选项 tbstat -m :显示消息日志的最后20行. 消息日志的内容包括:
1)、检查点信息
2)、读写错误信息
3)、ONLINE模式转换信息
4)、长事务
5)、日志文件满(LOG FILE FULL )
若想显示完整信息,可直接编译消息日志文件.
Tbstat -d:磁盘空间的使用情况,包括DBSPACE和CHUNK的信息
例:RSAM Version 5.03.UC1 -- On-Line -- Up 09:45:41 -- 816 Kbytes Dbspaces
address number flagsfchunk nchunks flags ownername
8040a244 1111 N informix rootdbs
1 active, 8 total Chunks
address chk/dbs offset size free bpages flags pathname
80409d84 1 1 0 300000 231871PO- /dev/rdata 1 active, 8 total
其中的FREE项,显示了该CHUNK的空闲空间大小(Kbytes).
Tbstat -l :日志文件情况
Physical Logging
Buffer bufused bufsize numpages numwrits pages/io
P-2 016 000.00
phybegin physize phypos phyused %used
101782 15000960 00.00 Logical Logging
Buffer bufused bufsize numrecs numpages numwrits recs/pages pages/io
L-2 016 1111.01.0 address number flagsuniqid beginsize used%used
8042de94 1U---C-L 110521a 7500 630 8.40
8042deb0 2F------ 0106f66 75000 0.00
8042decc 3F------ 0108cb2 75000 0.00
8042dee8 4F------ 010a9fe 75000 0.00
8042df04 5F------ 010c74a 75000 0.00
8042df20 6F------ 010e496 75000 0.00
其中:%USED: 使用百分比
FLAGS字段的含义:
F: 空闲 B:已备份 C: 正在接收事物记录
U: 正在使用 A: 新增日志 L: 包含最后一个检查点
Tbstat - u:ONLINE的用户情况
Users
address flags pid user tty waittout locks nreads nwrites
804019f4 ------D 329 root console 0 00 179 2
80401a64 ------D 0 root console 0 00 00
80401ad4 ------F 330 root 0 00 00
3 active, 20 total Transactions
address flags user locks log begin isolation retrys coordinator
804022b4 A---- 804019f4 0 0 NOTRANS 0
804028d8 A---- 80401a64 0 0 NOTRANS 0 2 active, 20 total
其中:flages字段的含义:
第一列:(S:等待mutex;Y:等待条件;L:等待锁;B:等待缓冲区;
C:等待检查点;X:长事务清理;G:等待长缓冲写;T:等待事务)
第二列:(*:事务执行时,发生I/O错误)
第三列:(A:正在备份;B:操作已被记录在日志中;P:分布处理已准备好;
C:正在提交;R:正在回滚)
第四列:(P:会话的主线索)
第五列:(R:在read rsam 调用中;X:进程在关键分区)
第七列:(M:特殊监控;D:特殊线索;C:清理线索;F:特殊清页进程;
B:特殊B 树清页线索) Tbstat -k :用户持有锁的情况
锁按照粒度分为6种: 库锁、表锁、页锁、行锁、字节锁、键锁
字节锁:更新包含有VARCHAR类型的行时,加在该行上的锁。
键锁:用于索引树上的锁。一般在相应字节上加删除标志。 这几种锁的识别如下:
TYPETBLSNUM ROWID SIZE
库锁 HDR X 1000002 205 0
表锁 100000e 00
页锁 100 0
行锁 101
字节锁HDR B 909
键锁 很大的16进制数
锁的生命期:1、不使用事务时,操作完成即会释放对应的锁;
2、 若使用事务,锁将伴随整个事务。(即随这COMMIT WORK或ROLLBACK WORK而释放)
(**锁的几种类型:共享锁(SHARE),排它锁(EXCLUSIVE),可升级锁**)
tbstat -p : 显示系统资源状况(是否充分)
Profile
dskreads pagreads bufreads 蔯hed dskwrits pagwrits bufwrits 蔯hed
181199 358 49.44 7 8 20.00 isamtot open start read write rewrite delete commit rollbk
3 1 1 0 0 0 010 ovtbls ovlock ovuser ovbuff usercpu syscpu numckpts flushes
0 0 00 0.00 0.00 2 239 bufwaits lokwaits lockreqs deadlks dltouts lchwaits ckpwaits compress
0 00 0 0 0 0 0
OVTBLS:指示TBLSPACE值不够 ,TBLSPACES值应增大
OVLOCK:锁溢出LOCKS应增大
OVUSER:用户表资源不够USERS
OVBUF:缓冲区资源不够 BUFFERS
以上数字若持续增加,表明相应参数值应调整
DEADLOCKS:检测到的死锁数
DLTOUTS:网络超时死锁
DEADLOCK_TIMEOUT:一般为60秒,若增大此数字,可以减少死锁数,但会增加响应时间,用户看来性能更差;若减少此数字,死锁数可能会增大,但会减少响应时间,在用户看来,响应时间变快了。 四、 ONCHECK 定位并修复数据与索引的不一致
检查磁盘上的数据结构
显示不同数据结构的报告
某些选项可能回在它所涉及的表上家一个共享锁 用法: tbcheck [-clist] [-plist] [-qny]
[ { database[:[owner.]table] | TBLSpace number | Chunk number }
{ rowid | page number } ] -c - check(检查)
r - reserved pages(保留页)
e - TBLSpace extents and chunk extents
c - database catalogs(目录)
i - table indexes(表的索引)
I - table indexes and rowids in index(表的索引和索引的rowid)
d - TBLSpace data rows including bitmaps(表空间的数据行包括位图)
D - TBLSpace data rows including bitmaps, remainder pages and blobs
-p - print(显示)
r - reserved pages (-cr) (保留页)
e - extents report (-ce)(extent)
c - catalog report (-cc)(目录)
k - keys in index (-ci)(索引的键值)
K - keys and rowids in index (-cI)
l - leaf node keys only (-ci)
L - leaf node keys and rowids (-cI)
d - TBLSpace data rows (-cd)
D - TBLSpace data rows including bitmaps, remainder pages and blobs (-cD)
t - TBLSpace report
T - TBLSpace disk utilization report
p - dump page for the given [table and rowid | TBLSpace and page number]
P - dump page for the given chunk number and page number
B - BLOBSpace utilization for given table(s) [database:[owner.]]table -q - quiet mode - print only error messages
-n - answer NO to all questions
-y - answer YES to all questions
五、 几个主要的tbcheck选项 TBCHECK -PTDATABASE:TABLE
产生有关TBLSPACE的报告。包括EXTENT和空间使用信息。信息的输出来自TBLSPACE TBLSPACE,这是一个特殊的TBLSPACE,用来跟踪ONLINE创建的数据库,是根DBSPACE中的第二个TBLSPACE,其TBLSNUM为1000002。这个TBLSPACE中的每行保存一个数据库的信息。 TBCHECK -Cd DATABASE:TABLE
测试一个表空间的数据。它从表空间中读取所有页做一致性检查,并检测位图也以确认该页被正确映射。它所做的工作包括:确认数据的有效性,对特殊数据做相应标志(如BLOB页,剩余页等)。 TBCHECK -Ci DATABASE:TABLE
测试表上的索引,比如是否所有的ROWID都指向表中的有效行,必要时,重建SYSINDEXES信息。它所做的工作包括:验证索引是否有效,重建被损坏的索引,并对索引树重新做相应调整。
索引策略:
应加索引的字段:用于连接(JOIN)的字段,用来过滤的字段(在WHERE条件中使用的字段,称为过滤器),用于排序的字段(ORDER BY)。
不应加索引的字段:有高重复值的字段 另外,可以用主键限制索引个数,加复合索引来避免重复,用聚簇索引加快索引速度。 六、其它重要的工具 UPDATE STATISTICS [LOW | MEDIUM | HIGH]
此语句的三个主要作用:更新内部表;产生数据分布;优化存储过程 应定期使用 tbinit
用于初始化数据库共享内存。每次开机后都必须执行此命令。一般将它放在/etc/rc2.d目录下的一个自引导文件中。 例如:当以应用软件注册时,系统提示:DBERR –529/C-ISAM –123 [Open Database]
使用finderr查529错误,提示: -529 Cannot attach to shared memory. {不能使用共享内存}
此时,使用tbinit命令将数据库共享内存进行初始化后,系统恢复正常。 tbmode -sy| tbmode -ky
用于关闭数据库共享内存。为了数据的安全,每次关机前都必须执行此命令。为了简化操作,我们经常将它放在/etc/rc0.d目录下的一个自引导文件中,让系统进入多用户时自动来执行此文件。 finderr
用来查询数据库的错误。当系统出现数据库错误时,系统处了给你简单的出错提示外,还给出一个错误号。你可以使用此命令对这种错误进行深入的分析,然后针对不同的错误进行相应的处理。 例如:当你在超级用户root下对储蓄数据库bankstar进行操作时,系统提示:
387: No connect permission.
111: ISAM error: no record found.
意思是:系统出现387错误,错误的原因是:没有connect权限。
原因分析:
操作数据库至少需要CONNECT权限。解决如下:informix用户注册,执行如下SQL语句:grant connect to root