COM多线程一直是个不容易弄清的问题,我也被困扰了很久,特别是COM在线程方面的术语总是不能统一。本文是为了将我所学所用得做一个总结,本文不保证一定正确,但是会随着时间的推移逐渐完善改正。
我个人认为<<COM技术内幕>>中关于套间的定义是错误的,应采用<<COM本质论>>中的定义。
<<COM技术内幕>>中-----
套间(Apartment),一个由用户界面线程(套间线程)和一个消息循环构成的概念性实体。
<<COM本质论>>中------
套间定义了一组对象的逻辑组合,这些对象共享同一组并发性和重入限制。一个线程要想使用COM,必须先进入一个套间。COM规定,只有运行在对象套间中的线程才能访问该对象。
COM定义了两种类型的套间,STA(单线程套间)和MTA(多线程套间)。
STA的特点是套间内永远只有一个线程运行,并且一定是创建该套间的初始线程。因而开发只运行在STA中的组件不需要考虑线程同步等问题。
STA中包含了一个不可见的窗口,所以透过窗口的消息循环机制对消息队列的处理,保证了同一时刻只有一个调用请求被执行,这就是组件不需要处理同步的原因。
MTA的特点是套间内可以有多个线程运行,并且还可以创建新的线程。在MTA中运行的组件必须自己实现线程的同步。
线程通过CoInitializeEx函数进入套间,该函数的第二个参数通过传递COINIT_APARTMENTTHREADED和COINIT_MULTITHREADED标志了套间类型。如果传递COINIT_APARTMENTTHREADED,该线程将创建自己私有的套间,别人不能进入。如果传递COINIT_MULTITHREADED,该线程将进入当前进程范围内的MTA。
线程调用CoUninitialize函数用于退出所在的套间。只有退出后才可以进入其它类型的套间。
根据是否支持多线程同步,组件对象可以分为单线程对象和多线程对象。
每个COM对象都可以决定自己将运行在什么样的套间内,这称为COM对象的线程模型。
组件将运行在什么样的套间里面,这是由组件开发者决定的,调用组件的客户程序不需要关心。但是如果调用线程所在的套间和组件运行的套间不是同一套间,COM将插入代理/存根机制,调用线程在自身的套间内调用代理上的方法使用对象方法,而对象将运行在它需要的套间内。
线程模型的种类取决于注册表中ThreadingModel的值----------
1) Both 表示组件可以运行在STA和MTA中
2) Free 表示组件只能运行在MTA中
3) Apartment表示组件只能运行在STA中
4) 为空表示组件只能运行在进程第一个创建的STA(主STA中)中。
如果调用线程的套间能够满足进程内组件的线程模型的要求,则直接创建组件对象,并不需要代理。
如果调用线程的套间不能满足进程内组件的线程模型的要求,则COM会在另一个合适的套间内(如果没有合适的套间,COM会创建一个)创建对象,然后给调用线程返回代理。
如果组件和客户程序不在同一个进程或者不在同一台机器,那必然是在两个套间中,COM会创建代理/存根。
如果组件对象的线程模型是Both或者Free,组件必须是多线程对象。
如果组件对象的线程模型是空,则组件可以是单线程对象或者多线程对象。这时候多线程对象内部的同步机制其实没有意义,因为不会有多个线程同时访问对象。
如果组件对象的线程模型是Apartment,情况将分两种:
a) 组件内部没有全局变量和静态变量,组件可以是单线程对象
b) 组件内部有全局变量和静态变量,组件应该是多线程对象,并对全局变量和静态变量进
行访问保护。
ATL中对COM对象中同步的支持有自己的考虑:如果COM对象本身就是不考虑同步的单线程对象,ATL就不应该对该对象的任何数据成员包括对象引用变量m_cRef进行同步保护。因为同步保护是需要额外的耗费资源的。ATL中的原则是只在应该需要保护的场合进行同步保护。这样做是符合ATL的设计目的----一切为了效率。
CComSingleThreadModel、CComMultiThreadModel、CComMultiThreadModelNoCS类里面都定义了静态成员函数Increment和Decrement。CComObjectRootEx类的模板参数接受以上三个类并使用他们的静态成员函数,而我们的组件实现类从CComObjectRootEx类派生,从而获得了根据我们组件是否支持多线程而对对象引用进行同步的功能。一句话,我们只要派生具有合适的模板参数的CComObjectRootEx类就可以了。如下面我们的类:
class ATL_NO_VTABLE CMIS :
public CComObjectRootEx<CComSingleThreadModel>,
CMIS类不需要考虑对象引用的同步保护,因为我们的组件对象是单线程对象,线程模型为空或者为Apartment。
但是请注意ATL工程的组件类脚本中默认线程模型是both,这就会带来问题,所以我们手动修改它。
如果我们改动代码如下:
class ATL_NO_VTABLE CMIS :
public CComObjectRootEx< CComMultiThreadModel >,那么我们的组件对象引用计数就受到同步保护,而且我们的组件对象自己负责同步保护。这样如果CMIS类里有成员变量,那么我们要对成员变量进行同步保护。
采用临界区方式进行同步保护我们要利用类CComMultiThreadModel。我们的组件实现类派生自CComObjectRootEx< CComMultiThreadModel >类。使用的方法极其简单,我们只要在需要防止多个线程同时执行的函数内部开始处加上如下代码:
ObjectLock Lock(this);
如果想使用多个临界区的话使用方法就没这么简单了,但是除非必须,否则我不建议这样做,因为很容易引起死锁。一定要用的话必须先阅读<<Windows核心编程>>和<<Win32多线程程序设计>>这两本书。
COM+对于套间的概念进一步的扩展,要求每个对象都必须运行在上下文中。通过上下文来控制对象的线程同步。
套间被细分为一个或者若干个上下文。一个上下文只能在一个套间中。一个套间至少包含一个默认上下文。
位于同一个套间中的不同上下文之间的对象调用必须经过轻量级代理的列集。轻量级代理不同于套间之间的代理,因为性能损失较小。
一个没有被COM+托管的传统COM组件不使用轻量级代理。但是该COM组件将被认为是放到了它所生存的套间的默认上下文内部,该套件的其他上下文(如果有的话)访问默认上下文不需要轻量级代理,默认上下文的引入只是为了和COM+上下文的概念一致。
上下文对象具体代表了每个上下文。CoGetObjectContext用来获取当前对象所在的上下文对象。
上下文对象暴露了IObjectContextInfo、IContextState、IObjectContext、IObjectContextActivity四个接口。后面两个接口是向后兼容MTS,可以忽略。
IObjectContextInfo::GetContextId方法可以获得上下文ID,调试时使用很方便。但是注意,只有COM组件被COM+管理后才能获得上下文对象,否则CoGetObjectContext将返回E_NOINTERFACE并返回NULL接口指针。所以如果我们开发的组件要同时适用于COM+和传统COM两种情况,就必须对CoGetObjectContext返回值进行查询并且作区分处理。
当客户通过COM+服务调用COM对象时,COM+将创建名为“调用对象”的临时对象代表客户对COM对象的调用。调用对象将在方法返回后被销毁。
调用对象暴露了两个与安全性设置相关的接口。
CoGetCallContext函数可以让对象获取自己的调用对象,如果返回RPC_E_CALL_COMPLETE,则说明目前没有客户调用自己。