原文:http://www.codeproject.com/Articles/901/Introduction-to-COM-Part-II-Behind-the-Scenes-of-a
本文为刚刚接触COM的程序员提供编程指南,解释COM服务器内幕以及如何用C++编写自己的接口(前一篇博文主要是COM编程的入门:COM编程入门不得不看的文章 :第一部分 什么是COM,如何使用COM)
继上一篇COM编程入门之后,本文将讨论有关COM服务器的内容,解释编写自己的COM接口和COM服务器所需要的步骤和知识,以及详细讨论当COM库对COM服务器进行调用时,COM服务器运行的内部机制。
如果你读过上一篇文章。应该很熟悉COM客户端是怎么会事了。本文将讨论COM的另一端——COM服务器。内容包括如何用C++编写一个简单的不涉及类库的COM服务器。深入到创建COM服务器的内部过程,毫无遮掩地研究那些库代码是充分理解COM服务器内部机制的最好方法。
本文假设你精通C++并掌握了上一篇文章所讨论的概念和术语。在这一部分将包括如下内容:
本文我们将讨论最简单的一种COM服务器,进程内服务器(in-process)。“进程内”意思是服务器被加载到客户端程序的进程空间。进程内服务器都是DLLs,并且与客户端程序同在一台计算机上。进程内服务器在被COM库使用之前必须满足两个条件或标准:
1.必须正确在注册表的HKEY_CLASSES_ROOT\CLSID 键值下注册;
2.必须输出DllGetClassObject()函数;
这是进程内服务器运行的最小需求。在注册表的HKEY_CLASSES_ROOT\CLSID 键值下必须创建一个键值,用服务器的GUID作为键名字,这个键值必须包含两个键值清单,一是服务器的位置,二是服务器的线程模型。 COM库对 DllGetClassObject() 函数进行调用是在CoCreateInstance() API中完成的。
还有三个函数通常也要输出:
另外,只输出正确的函数是不够的——还必须遵循COM规范,这样COM库和客户端程序才能使用服务器。
DLL服务器的一个与众不同的方面是控制它们被加载的时间。“标准的”DLLs被动的并且是在应用程序使用它们时被随机加载/或卸载。从技术上讲,DLL服务器也是被动的,因为不管怎样它们毕尽还是DLL,但COM库提供了一种机制,它允许某个服务器通过指令让COM库卸载这个服务器。这是通过输出函数DllCanUnloadNow()实现的。这个函数的原型如下:
HRESULT DllCanUnloadNow();
当客户应用程序调用COM API CoFreeUnusedLibraries()时,通常处于其空闲处理期间,COM库遍历这个客户端应用已加载所有的DLL服务器并通过调用它的DllCanUnloadNow()函数查询每一个服务器。另一方面,如果某个服务器确定它不再需要驻留内存,它可以返回S_OK让COM将它卸载。服务器通过简单的引用计数来确定它是否能被卸载。下面是DllCanUnloadNow()的实现:
extern UINT g_uDllRefCount; // 服务器的引用计数 HRESULT DllCanUnloadNow() { return (g_uDllRefCount > 0) ? S_FALSE : S_OK; }
如何处理引用计数将在下一节涉及到具体代码时讨论。
有必要回想一下IUnknown派生的每一个接口。因为IUnknown包含了两个COM对象的基本特性——引用计数和接口查询。当你编写组件对象类时(coclass),还要写一个满足自己需要的IUnknown实现。以实现IUnknown接口的组件对象类为例——下面这个例子可能是你编写的最简单的一个组件对象类。我们将在一个叫做CUnknownImpl的C++类中实现IUnknown。下面是这个类的声明:
class CUnknownImpl : public IUnknown { public: //构造函数和析构函数 CUnknownImpl(); virtual ~CUnknownImpl(); //IUnknown方法 ULONG AddRef(); ULONG Release(); HRESULT QueryInterface(REFIID riid, void** ppv); protected: UINT m_uRefCount; //组件对象的引用计数器 }
构造器和析构器管理服务器的引用计数:
CUnknownImpl::CUnknownImpl() { //该coclass的引用计数器 m_uRefCount = 0; //服务器的引用计数器 g_uDllRefCount++; } CUnknownImpl::~CUnknownImpl() { g_uDllRefCount--; }
当创建新的COM对象时,构造器被调用,它增加服务器的引用计数以保持这个服务器驻留内存。同时它还将对象的引用计数初始化为零。当这个COM对象被摧毁时,它减少服务器的引用计数。
这两个方法控制 COM 对象的生命期。AddRef()很简单:
ULONG CUnknownImpl::AddRef() { //该coclass的引用计数器增加1 return ++m_uRefCount; }
AddRef()只增加对象的引用计数并返回更新的计数。 Release()更简单:
ULONG CUnknownImpl::Release() { ULONG uRet = --m_uRefCount; if(0 == m_uRefCount) delete this; return uRet; }
除了减少对象的引用计数外,如果没有另外的明确引用,Release()将摧毁对象。Release()也返回更新的引用计数。注意Release()的实现假设COM对象在堆中创建。如果你在全局栈上创建某个对象,当对象试图删除自己时就会出问题。
现在应该明白了为什么在客户端应用程序中正确调用AddRef()和 Release()是如此重要!如果在这点做得不对,你使用的对象会被很快摧毁,这样的话在整个服务器中内存会很快溢出,导致应用程序下次存取服务器代码时崩溃。
如果你编写多线程应用,可能会想到使用++&替代InterlockedIncrement()和InterlockedDecrement()的线程安全问题。++&——用于单线程服务器很保险,因为即使客户端应用是多线程的并从不同的线程中进行方法调用,COM库都会按顺序进行服务器的方法调用。也就是说,一旦一个方法调用开始,所有其它试图调用方法的线程都将阻塞,直到第一个方法返回。COM库本身确保服务器一次不会被一个以上的线程闯入。
QueryInterface()简称QI(),由客户端程序调用这个函数从COM对象请求不同的接口。我们在例子代码中因为只实现一个接口,QI()会很容易使用。QI()有两个参数:一个是所请求的接口IID,一个是指针的缓冲大小,如果查询成功,QI()将接口指针地址存储在这个缓冲指针中。
HRESULT CUnknownImpl::QueryInterface(REFIID riid, void** ppv) { HRESULT hrRet = S_OK; //标准QI初始化-置*ppv为NULL *ppv = NULL; //如果客户端请求提供的是接口,给*ppv赋值 if(IsEqualIID(riid, IID_IUnknown)) { *ppv = (IUnknown*)this; } else { //不提供客户端请求的接口 hrRet = E_NOINTERFACE; } //如果返回一个接口指针,调用AddRef()增加引用计数 if(S_OK == hrRet) { ((IUnknown*)*ppv)->AddRef(); } return hrRet; }
在QI()中做了三件不同的事情:
1.初始化传入的指针为NULL
*ppv =NULL;
2.检查riid,确定组件对象类(coclass)实现了客户端所请求接口
if (IsEqualIID ( riid, IID_IUnknown ))
3.如果确实实现了所请求的接口,则增加COM对象的引用计数
((IUnknown*) *ppv)->AddRef();
可以看到AddRef很重要。
*ppv = (IUnknown*) this;
这句话创建新的COM对象引用,所以就必须调用AddRef这个函数通知COM对象这个新引用成立。
在AddRef()调用中的强制转换IUnknown*看起来好像多余,但是在QI()中初始化的*ppv有可能不是IUnknown*类型,所以最好是养成习惯对之进行强行转换。
上面我们已经讨论了一些DLL服务器的内部细节,接下来让我们回头看一看当客户端调用CoCreateInstance()时是如何处理服务器的。
在本文的第一部分中,我们见过CoCreateInstance()API,其作用是当客户端请求对象时,用它来创建对象。从客户端的立场看,它是一个黑盒子。只要用正确的参数调用它即可得到一个COM对象。它并没有什么魔法,只是在一个定义良好的过程中加载COM服务器,创建请求的COM对象并返回所要的指针。就这些。
下面让我们来浏览一下这个过程。这里要涉及到几个不太熟悉的术语,但不用着急,后面会对它们作详细讨论。
1.客户端程序调用CoCreateInstance(),传递组件对象类的CLSID以及所要接口的IID;
2.COM库在HKEY_CLASSES_ROOT\CLSID.键值下查找服务器的CLSID键值,这个键值包含服务器的注册信息;
3.COM库读取服务器DLL的全路径并将DLL加载到客户端的进程空间;
4.COM库调用在服务器中DllGetClassObject()函数为所请求的组件对象类请求类工厂;
5.服务器创建一个类工厂并将它从DllGetClassObject()返回;
6.COM库在类工厂中调用CreateInstance()方法创建客户端程序请求的COM对象;
7.CreateInstance()返回一个接口指针到客户端程序;
COM 服务器必须在 Windows 注册表中正确注册以后才能正常工作。如果你看一下注册表中的HKEY_CLASSES_ROOT\CLSID 键,就会发现大把大把子键,它们就是在这个计算机上注册的COM服务器。当某个COM服务器注册后(通常是用DllRegisterServer()进行注册),就会以标准的注册表格式在CLSID键下创建一个键,它名字为服务器的GUID。下面是一个这样的例子:
{067DF822-EAB6-11cf-B56E-00A0244D5087}
大括弧和连字符是必不可少的,字母大小写均可。
这个键的默认值是人可识别的组件对象类名,使用VC所带的OLE/COM对象浏览器可以察看到它们。在GUID键的子键中还可以存储其它信息。需要创建什么子键依赖于COM服务器的类型以及COM服务器的使用方法。对于本文例子中这个简单的进程内服务器,我们值需要一个子键:InProcServer32。
InProcServer32键包含两个串:这两个串的缺省值是服务器DLL的全路径和线程模型值(ThreadingModel)。线程模型超出了本文所涉及的范围,我们先接受这个概念,这里我们指的是单线程服务器,用的模式为Apartment(即单线程公寓)。
回首看一看客户端的COM,它是如何以自己独立于语言的方式创建和销毁COM对象。客户端调用CoCreateInstance()创建新的COM对象。现在我们来看看它在服务器端是如何工作的。
你每次实现组件对象类的时候,都要写一个旁类负责创建第一个组件对象类的实例。这个旁类就叫这个组件对象类的类工厂(class factory),其唯一目的是创建COM对象。之所以要一个类工厂,是因为语言无关的缘故。COM本身并不创建对象,因为它不是独立于语言的也不是独立于实现的。
当某个客户端想要创建一个COM对象时,COM库就从COM服务器请求类工厂。然后类工厂创建COM对象并将它返回客户端。它们的通讯机制由函数DllGetClassObject()来提供。
术语 “类工厂”和“类对象”实际上是一回事。没有哪个单词能精确描述类工厂的作用和义,但正是这个工厂创建了COM对象,而不是COM类所为。将“类工厂”理解成“对象工厂”可能会更有助于理解(实际上MFC就是这样理解的——它的类工厂实现就叫做COleObjectFactory)。但“类工厂”是正式术语,所以本文也这样用。
当COM库调用DllGetClassObject()时,它传递客户端请求的CLSID。服务器负责为所请求的CLSID创建各类工厂并将它返回。类工厂本身就是一个组件对象类,并且实现IClassFactory接口。如果DllGetClassObject()调用成功,它返回一个IClassFactory指针给COM库,然后COM库用IClassFactory接口方法创建客户端所请求的COM对象实例。以下是IClassFactory接口:
struct IClassFactory : public IUnknown { HRESULT CreateInstance( IUnknown* pUnkOuter, REFIID riid, void** ppvObject ); HRESULT LockServer( BOOL fLock ); };
其中,CreateInstance()是创建COM对象的方法。LockServer()在必要时让COM库增加或减少服务器的引用计数。
这个工程是一个能运行的DLL服务器例子,对象由类工厂创建,此DLL服务器在 CSimpleMsgBoxImpl组件对象类中实现了一个接口:ISimpleMsgBox。
接口定义
我们的新接口是ISimpleMsgBox。所有的接口多必须从IUnknown派生。这个接口只有一个方法:DoSimpleMsgBox()。注意它返回标准类型HRESULT。所有的方法都应该返回HRESULT类型,并且所有返回到调用者的其它数据都应该通过指针参数操作。
struct ISimpleMsgBox : public IUnknown { //IUnknown 方法 ULONG AddRef(); ULONG Release(); HRESULT QueryInterface(REFIID riid, void** ppv); //ISimpleMsgBox Method HRESULT DoSimpleMsgBox(HWND hwndParent, BSTR bsMessageText); }; struct __declspec(uuid("{7D51904D-1645-4a8c-BDE0-0F4A44FC38C4}")) ISimpleMsgBox;
有__declspec的一行将一个GUID赋值给ISimpleMsgBox,并且以后可以用__uuidof操作符来获取GUID。这两个东西都是微软的C++的扩展。
DoSimpleMsgBox()的第二个参数是BSTR类型。意思是二进制串——即定长序列位的COM表示。BSTRs主要用于Visual Basic 和 Windows Scripting Host之类的脚本客户端。接下来这个接口由CSimpleMsgBoxImpl C++类来实现。其定义如下:
class CSimpleMsgBoxImpl : public ISimpleMsgBox { public: CSimpleMsgBoxImpl(); virtual ~CSimpleMsgBoxImpl(); // IUnknown 方法 ULONG AddRef(); ULONG Release(); HRESULT QueryInterface( REFIID riid, void** ppv ); // ISimpleMsgBox 方法 HRESULT DoSimpleMsgBox( HWND hwndParent, BSTR bsMessageText ); protected: ULONG m_uRefCount; }; class __declspec(uuid("{7D51904E-1645-4a8c-BDE0-0F4A44FC38C4}")) CSimpleMsgBoxImpl;
当某一客户端想要创建一个SimpleMsgBox COM对象时,它应该用下面这样的代码:
ISimpleMsgBox* pIMsgBox; HRESULT hr; //组件对象类的CLSID hr = CoCreateInstance(__uuidof(CSimpleMsgBoxImpl), NULL, CLSCTX_INPROC_SERVER, __uuidof(ISimpleMsgBox), (void**)&pIMsgBox);
我们的类工厂SimpleMsgBox是在一个叫做CSimpleMsgBoxClassFactory的C++类中实现的:
class CSimpleMsgBoxClassFactory : public IClassFactory { public: CSimpleMsgBoxClassFactory(); virtual ~CSimpleMsgBoxClassFactory(); // IUnknown方法 ULONG AddRef(); ULONG Release(); HRESULT QueryInterface( REFIID riid, void** ppv ); // IClassFactory方法 HRESULT CreateInstance( IUnknown* pUnkOuter, REFIID riid, void** ppv ); HRESULT LockServer( BOOL fLock ); protected: ULONG m_uRefCount; };
构造函数、析构函数和IUnknown方法都和前面例子中的一样,不同的只有IClassFactory的方法,LockServer(),看起来相当更简单:
HRESULT CSimpleMsgBoxClassFactory::LockServer(BOOL fLock) { fLock ? g_uDllLockCount++ : g_uDllLockCount--; return S_OK; }
CreateInstance()是重点。我们说过这个方法负责创建新的CSimpleMsgBoxImpl对象。让我们进一步探讨一下它的原型和参数:
HRESULT CSimpleMsgBoxClassFactory::CreateInstance ( IUnknown* pUnkOuter, REFIID riid, void** ppv );
第一个参数pUnkOuter只用于聚合的新对象,指向“外部的”COM对象,也就是说,这个“外部”对象将包含此新对象。对象的聚合超出了本文的讨论范围,本文的例子对象也不支持聚合。riid 和 ppv 与在 QueryInterface() 中的用法一样——它们是客户端所请求的接口IID和存储接口指针的指针缓冲。
下面是CreateInstance()的实现。它从参数的有效性检查和参数的初始化开始。
HRESULT CSimpleMsgBoxClassFactory::CreateInstance ( IUnknown* pUnkOuter, REFIID riid, void** ppv ) { // 因为不支持聚合,所以这个参数pUnkOuter必须为NULL. if ( NULL != pUnkOuter ) return CLASS_E_NOAGGREGATION; //检查指针ppv是不是void*类型 if ( IsBadWritePtr ( ppv, sizeof(void*) )) return E_POINTER; *ppv = NULL;
检查完参数的有效性后,就可以创建一个新的对象了。
CSimpleMsgBoxImpl* pMsgbox; // 创建一个新的COM对象 pMsgbox = new CSimpleMsgBoxImpl; if ( NULL == pMsgbox ) return E_OUTOFMEMORY;
最后,用QI()来查询客户端所请求的新对象的接口。如果QI()失败,则这个对象不可用,必须删除它。
HRESULT hrRet; // 用QI查询客户端所请求的对象接口 hrRet = pMsgbox->QueryInterface ( riid, ppv ); // 如果QI失败,则删除这个COM对象,因为客户端不能使用它(客户端没有 //这个对象的任何接口) if ( FAILED(hrRet) ) delete pMsgbox; return hrRet; }
现在让我们深入DllGetClassObject()内部。它的原型是:
HRESULT DllGetClassObject( REFCLSID rclsid, REFIID riid, void** ppv );
rclsid是客户端所请求的组件对象类的CLSID。这个函数必须返回指定组件对象类的类工厂。这里的两个参数: riid 和 ppv 类似QI()的参数。不过在这个函数中,riid指的是COM库所请求的类工厂接口的IID。通常就是IID_IClassFactory。
因为DllGetClassObject()也创建一个新的COM对象(类工厂),所以代码与IClassFactory::CreateInstance()十分相似。开始也是进行一些有效性检查以及初始化。
HRESULT DllGetClassObject ( REFCLSID rclsid, REFIID riid, void** ppv ) { // 检查客户端所要的CSimpleMsgBoxImpl类工厂 if ( !InlineIsEqualGUID ( rclsid, __uuidof(CSimpleMsgBoxImpl) )) return CLASS_E_CLASSNOTAVAILABLE; //检查指针ppv是不是void*类型 if ( IsBadWritePtr ( ppv, sizeof(void*) )) return E_POINTER; *ppv = NULL;
第一个if语句检查rclsid参数。我们的服务器只有一个组件对象类,所以rclsid必须是CSimpleMsgBoxImpl类的CLSID。__uuidof操作符获取先前在__declspec(uuid())声明中指定的CsimpleMsgBoxImpl类的GUID。下一步是创建一个类工厂对象。
CSimpleMsgBoxClassFactory* pFactory; // 构造一个新的类工厂对象 pFactory = new CSimpleMsgBoxClassFactory; if ( NULL == pFactory ) return E_OUTOFMEMORY;
这里的处理与CreateInstance()中所做的有所不同。在CreateInstance()中是调用了QI(),并且如果调用失败,则删除COM对象。我们可以把自己假设成一个所创建的COM对象的客户端,调用AddRef()进行一次引用计数(COUNT = 1)。然后调用QI()。如果QI()调用成功,它将再一次用AddRef()进行引用计数(COUNT = 2)。如果QI()调用失败。引用计数将保持为原来的值(COUNT = 1)。在QI()调用之后,类工厂对象就使用完了,因此要调用Release()来释放它。如果QI()调用失败,这个对象将自我删除(因为引用计数将为零),所以最终结果是一样的。
// 调用AddRef()增加一个类工厂引用计数,因为我们正在使用它 pFactory->AddRef(); HRESULT hrRet; // 调用QI()查询客户端所要的类工厂接口 hrRet = pFactory->QueryInterface ( riid, ppv ); // 使用完类工厂后调用Release()释放它 pFactory->Release(); return hrRet; }
前面讨论过QI()的实现,但还是有必要再看一看类工厂的QI(),因为它是一个很现实的例子,其中COM对象实现的不光是IUnknown。首先进行的是对ppv缓冲的有效性检查以及初始化。
HRESULT CSimpleMsgBoxClassFactory::QueryInterface( REFIID riid, void** ppv ) { HRESULT hrRet = S_OK; //检查指针ppv是不是void*类型 if ( IsBadWritePtr ( ppv, sizeof(void*) )) return E_POINTER; //标准的QI初始化,将赋值为NULL. *ppv = NULL;
接下来检查riid,看看它是不是类工厂实现的接口之一:IUnknown 或 IclassFactory。
// 如果客户端请求一个有效接口,则扶植给 *ppv. if ( InlineIsEqualGUID ( riid, IID_IUnknown )) { *ppv = (IUnknown*) this; } else if ( InlineIsEqualGUID ( riid, IID_IClassFactory )) { *ppv = (IClassFactory*) this; } else { hrRet = E_NOINTERFACE; }
最后,如果riid是有效接口,则调用接口的AddRef(),然后返回。
//如果返回有效接口指针,则调用AddRef() if ( S_OK == hrRet ) { ((IUnknown*) *ppv)->AddRef(); } return hrRet; }
ISimpleMsgBox实现
最后的也是必不可少的一关是ISimpleMsgBox实现,我们的代码只实现ISimpleMsgBox的方法DoSimpleMsgBox()。首先用微软的扩展类_bstr_t将bsMessageText转换成TCHAR串。
HRESULT CSimpleMsgBoxImpl::DoSimpleMsgBox ( HWND hwndParent, BSTR bsMessageText ) { _bstr_t bsMsg = bsMessageText; LPCTSTR szMsg = (TCHAR*) bsMsg; // 如果需要的话,用_bstr_t将串转换为ANSI
做完转换的工作后,显示信息框,然后返回。
MessageBox ( hwndParent, szMsg, _T("Simple Message Box"), MB_OK ); return S_OK; }
我们已经完成了一个超级棒的COM服务器,如何使用它呢? 我们的接口是一个定制接口,也就是说它只能被C或C++客户端使用。(如果在组件对象类中同时实现IDispatch接口,那我们几乎就可以在任何客户端环境中——Visual Basic,Windows Scripting Host,Web页面,PerlScript等使用COM对象。有关这方面的内容我们留待另外的文章讨论)。本文提供了一个使用ISimpleMsgBox的例子程序。这个程序基于用Win32应用程序向导建立的Hello World例子。文件菜单包含两个测试服务器的命令:如图所示:
Test MsgBox COM Server菜单命令创建CSimpleMsgBoxImpl对象并调用DoSimpleMsgBox()。因为这是个简单的方法,要写的代码不长。 我们先用CoCreateInstance()创建一个COM对象。
void DoMsgBoxTest(HWND hMainWnd) { ISimpleMsgBox* pIMsgBox; HRESULT hr; hr = CoCreateInstance ( __uuidof(CSimpleMsgBoxImpl), // 组件对象类的CLSID NULL, // 非聚合 CLSCTX_INPROC_SERVER, // 只使用进程内服务器 __uuidof(ISimpleMsgBox), // 所请求接口的IID (void**) &pIMsgBox ); // 容纳接口指针的缓冲 if ( FAILED(hr) ) return; // 然后调用DoSimpleMsgBox()方法并释放接口。 pIMsgBox->DoSimpleMsgBox ( hMainWnd, _bstr_t("Hello COM!") ); pIMsgBox->Release(); }
就这么简单。代码中从头到尾都有TRACE语句,这样在调试器中运行测试程序就可以看到服务器的每一个方法是如何被调用的。另外一个菜单命令是调用CoFreeUnusedLibraries()函数,从中你能看到服务器DllCanUnloadNow()函数的运行。
COM代码中有些宏隐藏了实现细节,并允许在C和C++客户端使用相同的声明。本文中没有使用宏,但在例子代码中用到了这些宏,所以必须掌握它们的用法。下面是ISimpleMsgBox的声明: