天方夜谭VCL:多态

来源:岁月联盟 编辑:exp 时间:2009-06-08

天方夜谭VCL: 多态

虫虫

我们中国人崇拜龙,所谓“龙生九种,九种各别”。哪九种?《西游记》里西海龙王对孙悟空说:“第一个小黄龙,见居淮渎;第二个小骊龙,见住济渎;第三个青背龙,占了江渎;第四个赤髯龙,镇守河渎;第五个徒劳龙,与佛祖司钟;第六个稳兽龙,与神官镇脊;第七个敬仲龙,与玉帝守擎天华表;第八个蜃龙,在大家兄处砥据太岳。此乃第九个鼍龙,因年幼无甚执事,自旧年才着他居黑水河养性,待成名,别迁调用,谁知他不遵吾旨,冲撞大圣也。”(注:鼍龙是文雅的说法,民间叫法是猪婆龙,也就是扬子鳄。)如果您冲着这九位说一声“Let’s go”,那场面可壮观了,有天上飞的,有水里游的,也有地上爬的。同样是“go”,“go”的具体形式却各不相同,这正是多态“一个接口,多种实现”的典型例子。

多态的实现方法很多,其中C++直接支持的方式有:通过关键字virtual提供虚函数进行迟后联编,以及通过模板(template)实现静态多态性,它们都各有用武之地。我们比较熟悉的是虚函数,这是建构类层次的重要手段,我们也已经分析过虚函数的原理[1]。然而在有些情况下,虚函数的性能并不是最优,故VCL还提供了一种动态(dynamic)函数,用法和虚函数一模一样,只要把virtual换成DYNAMIC就可以了。VCL的帮助文件里说,动态函数跟虚拟函数相比,空间效率占优,时间效率不行,真的吗?其实现原理又是如何呢?我们又应该如何权衡这两者的使用呢?我们将从一个相当一般的角度来讨论这些问题。

虚函数的苦恼

如下类层次来自一个图形绘制程序的一部分。为了方便管理,界面与具体的图形设计分离。各种图形以动态连接库的方式提供,作为插件的形式。这样可以在不重新编译主程序的情况,增加或减少各种图形。


图1 Shape类层次

最初Shape的声明是

class Shape {private:	int x0, y0;protected:        Shape();        virtual ~Shape();public:	int x() const;	int y() const;        virtual void draw(void *) = 0;        virtual int move(int, int);};
后来因为功能扩充,添加了两个虚函数。
class Shape {private:	int x0, y0;protected:        Shape();        virtual ~Shape();public:	int x() const;	int y() const;	virtual int move(int, int);        virtual void draw(void *) = 0;        virtual void save(void *) const = 0;        virtual void load(void *) = 0;};
后来又作过一些修改,又添加了若干虚函数。问题就在于,虚函数一但增加,虚拟函数表VFT就会发生变化,这时候,主程序就必须重新编译。更糟糕的是,一旦版本升级,派生自不同版本Shape的图形绝对不可以混用[2]。所以我们可以看到硬盘里充斥着mfc20.dll、mfc40.dll、mfc42.dll……却一个也不能删除,这就是MFC升级所带来的DLL垃圾。怎么办?
初步解决

我在网上问过这样的问题,得到的答复主要有:

  • 用COM;
  • 预先多写一些无用的虚函数,留出扩充空间。

其实上面的方法都能很好地解决这个问题。但是推广看来,也有一定局限性。COM不适合解决类层次过深的情况,预留的空间则是不折不扣的“鸡肋”。

追根究底,这个局限性是因为父类和子类的虚拟函数表VFT之间过强的关联性:子类的VFT的前面一部分必须与父类相同。而当父类和子类不在同一个DLL或EXE中的时候,这个要求是很难满足的。父类一旦改变,子类如果不重新编译,就将导致错误。解决的方法,当然就是取消父类和子类VFT之间的关联性。我设计了一个很笨的解决办法,但可以取消这个关联性,使虚函数保证始终只有2个。

#define Dynamic // Dynamic什么都不是,只是好看一点struct point{	int x, y;};class dispatch_error{};class Shape {private:	int x0, y0;protected:        Shape();        virtual ~Shape();	virtual void dispatch(int id, void* in, void* out);	// in和out是函数的输入输出参数,id是每个函数唯一的标记符号,即代号	// 实际运用中,id不一定是整数,也可以是128位UUID,或者字符串等等public:	int x() const;	int y() const;	Dynamic int move(int dx, int dy)	{		int r;		point p = {dx, dy};		dispatch(-1, &p, &r);		return r;	}        Dynamic void draw(void *hdc)		{dispatch(-2, hdc, 0);}        Dynamic void save(void* o) const	{dispatch(-3, o, 0);}        Dynamic void load(void* i)		{dispatch(-4, i, 0);}};void Shape::dispatch(int id, void* in, void* out){        switch(id)        {                case -1:                        ...                case -2:                        ...		...                default:                        throw(dispatch_error()); // 若函数不存在则抛出异常        }}
如果子类Triangle要改写Shape::draw,那么只需要
void Triangle::dispatch(int id, void* in, void* out){        switch(id)        {                ...                case -2:	// 改写Shape::draw                        ...		...                default:                        Shape::dispatch(id, in, out); //函数不存在则向父类找        }}
这样的“Dynamic函数”就解决了前面的问题,只有析构和dispatch这两个虚函数。父类和子类的VFT之间没有关联性,可以自由改动而不会互相影响。
评头论足

我们来对这种解决方案作了评价:的确解决了虚函数的问题,但是也付出了不小的代价:时间效率和可读性,由此也决定了该方案的应用面不广,一般用于

  • 虚函数很少或几乎不需改写的情况。这样有助于减少VFT的大小。至于运行速度则没有什么提高,毕竟VFT的访问速度是常数级[3];
  • 父类需要经常更新而子类不方便同步更新,对效率要求又不高的情况。一般的应用程序都可以使用。

从模式(Patterns)的角度来看,这种方法是典型的职责链(Chain of Responsibility)模式[4]:调用请求从最低层子类开始一层层往上传递,直到被处理或者最后抛出异常。这种模式运用非常广泛,比如VCL消息映射[5]和COM中IDispatch接口[6],与上述解决方案的形式都非常相似。

这个解决方案还可以作进一步的完善,以更好地适用于单根结构的框架。比如单根结构的类库,如MFC和VCL,通过RTTI可以找到唯一的父类,那么可以分离数据(函数代号和指针)和代码(调配部分),以简化结构。解决的方法就是典型的表格驱动,有不少书[7,8]都用此来优化COM中IUnkown接口的QueryInterface。我们引入类DMT来储存函数的代号和指针。

#include using namespace std;class DMT {        char* const ptr;        const DMT* const parent;public:        DMT(const DMT* const, const int, ...);        ~DMT() {delete []ptr;}        short size() const  {return *(short*)ptr;}        const void* find(int) const;};


图2 类DMT图解

需要特别注意的是DMT::ptr所分配的空间。在32位系统上,对于n个“Dynamic函数”,需要sizeof(short)字节储存n(红色部分),sizeof(void*)*n字节储存函数代号(黄色部分),以及sizeof(void*)*n字节储存函数指针(蓝色部分),一共是sizeof(short) + 2*n*sizeof(void*)字节。子类和父类的DMT可以通过链表形式连接起来。下面我们看看DMT::find和DMT::DMT的实现。

const void* DMT::find(int i) const{	const int* begin = (int*)(ptr + sizeof(short)), *p;	for(p = begin; p < begin + size(); ++p)		if(*(int*)p == i)			return *(void**)(p+ size());			// 找到对应的函数代号后,向前跳DMT::size()则是相应的函数指针	return (parent)? parent->find(i): 0;}DMT::DMT(const DMT* const p, const int n, ...)	: parent(p), ptr(new char[sizeof(short)+2*n*sizeof(void*)])					// ptr分配的空间大小如前所述{	int* i = (int*)(ptr + 2), c;	*(short*)ptr = n;		// 往头sizeof(short)字节写入n(红色部分)	va_list ap;	va_start(ap, n);	for(c = 0; c < n; ++c)		// 往黄色部分写入函数代号		*(i++) = va_arg(ap, int);	typedef void (DMT::*temp_type)();	temp_type temp;	for(c = 0; c < n; ++c)		// 往蓝色部分写入函数指针	{		temp = va_arg(ap, temp_type);		*(i++) = *(int*)&temp;	}	va_end(ap);}
下面我们在Shape类层次中应用DMT类。
class Shape {private:						

             

图片内容