全面解析DB2性能调优方面的二十个疑难问题

来源:岁月联盟 编辑:zhuzhu 时间:2008-06-23
1、逻辑设计应该总是能和物理设计完全映射

实际:DB2数据库设计中物理设计应该尽可能的和逻辑结构相近,但是为性能做出的物理设计改变不能被忽略,因为它们并不来自于逻辑设计。

2、将所有东西放在一个缓冲池(BP0)中让DB2管理

实际:就像在DB2手册和其他地方说明的一样,你只能在你的内存非常受限的情况下(10000 4k pages或者更少),你没有时间去管理它,你也没有考虑到性能的条件下,去这样做。最好这样说:不要放置除了DB2 catalog和目录以外的东西进入BP0。

3、DSNDB07是100%顺序的

实际:DSNDB07从来就不是100%顺序的,因为有工作文件中的对页面进行的随机活动。随即活动可能高达45%,但是通常范围是3%到10%。

4、VARCHAR应该总是被放置在行末

实际:这就是总是引发问题的话。如果表总是被读,并且非常少的更新,那么可以,这将会减少CPU负载,但是在其它情况下这样做就是最坏的,甚至如果表是被压缩的。只有在频繁更新的情况下它应该被放置在末尾,但是并不通常这样。

5、程序应该以遵循逻辑过程的方式编码

实际:伪代码或者一个逻辑过程图并不需要考虑性能相关的编码方式。在OLTP交易代码中这非常具有戏剧性。

6、大多数过程不在SQL中进行

实际:事实上,问题的反面往往是正确的。SQL是一个非常丰富的语言,能够处理大多数过程。实际上最大的困难是SQL经常被用来作为I/O处理器而不是一个集合处理器。

7、代码和引用表应该和DB2声明的referential integrity(RI)一起使用

实际:RI不应该作为一个编辑有效性的快捷方式而使用,这通常属于别的什么,但是应该在真父子关系中使用。

8、表至多有一到两个索引

实际:表应该按照性能需求拥有多个索引。

9、非分割索引(NPI)不应该被使用,尤其是不应该在大的表中使用

实际:这关系到数不清的问题,总体上这些都能被克服,但是NPI是对适当的访问和性能非常必要的。

10、大表应该被分割

实际:因为一个表中有太多数据就意味着有性能下降,这是一个遗留的担心。当一些表中有超过60亿行数据时,这个理解已经被消除了。

11、DB2缺省就是好的

实际:缺省的一般不是最好的,他们因版本不同而改变。比如考虑绑定参数CURRENTDATA。

12、不要在SQL WHERE谓词里使用否定

实际:另外一个这种规则并没有被解释清楚。只有谓词是一个否定时,SQL访问路径可能使用一个不必要的表空间扫描。但是在其它的多数情况下,多余的过滤应该在DB2引擎里完成,这会较好。

13、我可以只依靠EXPLAIN来决定是否访问路径是好的

实际:EXPLAIN不显示执行的查询块的顺序,不会告诉你1或者2阶段的谓词,不会告诉你一个块会多长时间执行一次。基本的,EXPLAIN只是导出一些数据到一个表里,然后结合其他一些信息来进行更多的一些解释。有一些工具来帮助处理此过程(如Visual Explain),但是如果所有的事实都没有被考虑的话,这样的方式只会带来坏处。

14、不要做EDM池太大以避免其分页

实际:EDM池通常通过分页来提升性能(这里分页是指扩展存储,而不是磁盘)而不是变得更小并且因为页面置换和其他因素持续重建内部结构。

15、扩展不会关系其他任何东西

实际:什么时候开始的?未来如果世界上充满了SAN或者ESS,那差不多。扩展的影响已经因为新的磁盘缓存控制器而变得很小了,但是仍然有一些额外的检查和处理需要来管理它们。

16、关系的划分不会在DB2中使用

实际:关系的划分已经在过去的许多系统中被使用了,可以有效的通过数据库设计者和程序开发者来实现。在目前的商业智能(BI)和市场系统中,它可以被数次用在每个单个程序中。

17、将所有的包绑定到两个计划中:一个批处理和一个在线的

实际:在介绍DB2包的时候,这是一个不好的陈述。有许多理由可以说这个理解是错误的。

18、未授权的读是不好的

实际:未授权的读并不是一个四字单词但是是一个非常好的性能增强,可以被用在比经常理解的更多的地方。

19、在没有超时和死锁的情况下不会有锁问题

实际:事实上没有一个问题发生并不意味着没有需要关注的的性能问题。经常锁定不被认为是一个问题,因为注意力主要放在反应的调节测量(统计死锁或者超时的数量),而不是后发式的调节(监控锁等待时间)。

20、ESA数据压缩总是好的

实际:当压缩能被在很多地方起作用时,有一些情况它能带来问题。每种情况都要在压缩使用前决定是否使用它。这不是可选的,而是必须要在高层决定是否使用还是不使用。