PCI 设备中在WINDOWS下编写DMA的方法

    对于在PCI总线上进行高速数据传输,通常采用直接数据存储(DMA)技术。在DMA方式下数据能够达到PCI总线规范的最大数据传输速率,所以在设备驱动程序的开发过程中,实现DMA的工作方式成为驱动程序的设计的重点。而对于DMA工作方式的设备驱动程序的开发又是设备驱动程序的难点,并且国内介绍这类的书籍又相对很少,给设计者带来很大困难。
    内核(Kernel)模式的驱动程序可以应用于WINDOWS NTWINDOWS 2000的操作系统中。它区别于WDM(Win32 Driver Model)模型,主要不支持即插即用,但对于编程的思想二者基本上一致,对于本文所述的DMA编程的方法在WDM模式的驱动程序中一样适合。
本文通过现有最常见的AMCC公司生产的AMCC S5933 PCI 控制芯片为例说明在WINDOWS NT平台下如何编写设备驱动程序以实现DMA传输方式。本文对基本的驱动程序设计技术不作详细的说明,重点介绍基于包的总线主控DMA方式的原理和对常见驱动程序例程的要求。并介绍这种模式下驱动程序的实现方法。文章从几个不同的方面进行全面的阐述。

1
AMCC S59333控制芯片PCI主控DMA功能概述
AMCC S5933
控制芯片,它具有实现完整的PCI主控模块和目标模块的接口功能。将复杂的PCI总线接口转换为相对简单的用户接口,用户只需要设计转换后的总线接口即可
AMCC S5933
有两个FIFO(先入先出)存储器,一个是PCIADD-ON(附加设备)的FIFO,另一个是从ADD-ONPCIFIFOS5933通过它的FIFO接口在PCI总线上进行DMA传输(总线主控)。FIFO可以作为PCI的发起者也可以作为目标者。FIFO作为目标,PCI总线主控访问ADD-ON数据。FIFO作为发起者可以向PCI发送数据。
      PCI
发起的DMA传输:此时FIFO作为目标。PCI发起的DMA传输必须通过总线主控控制状态寄存器(MCSR)来使能,读写使能分别控制,在驱动程序适配器控制(AdapterControl)例程设定这个寄存器。另外在驱动程序的设计中必须设定AMCC S5933读写地址寄存器(MWAR/MRAR)以及读写传输数据计数器(MWTC/MRTC)的值。AMCC S5933DMA中断有下列几种情况:读传输计数器计到 0,写传输计数到0,或在DMA传输过程中PCI总线上发生错误。

2
内核式驱动程序的基本结构和编程技术
    驱动程序与应用程序的最大差别之一是驱动程序的控制结构,应用程序一直用mainWinMain函数控制运行。而驱动程序没有mainWinMain函数。它是由I/O(输入输出)管理器在下列情况下调用一个程序例程:
1
驱动程序被装入时。
2
驱动程序被卸出或系统被关闭时。
3
用户程序发出I/O系统服务调用时。
4
共享硬件资源对驱动程序可用时。
5
设备操作过程中的任何时候。
任何设备驱动程序都必须拥有一个DriverEntry例程为每个驱动程序的入口点。下面简要说明驱动程序的分类。
1
)驱动程序初始化和清理例程:在任何时候开始处理I/O请求之前,它必须执行一些初始化任务。DriverEntry例程、Reinitialize例程、Unload例程、Shutdown例程和错误回调例程一般用来执行这些操作。
2) I/O
系统服务Dispatch(分发)例程:I/O管理器得到一个请求时,它使用请求的函数代码调用驱动程序中几个Dispatch例程中的一个。
3
)数据传输例程:根据设备的不同设备操作涉及到一些不同的例程,一般有Start I/O例程、中断服务(ISR)例程、延迟过程调用(DPC)例程
4
)资源同步回调:I/O管理器提供使用各种同步回调例程,使驱动程序更容易处理这些问题。当驱动程序需要访问某个共享资源时,它为该资源排队一个请求。当资源变得可用时,I/O管理器激活与该请求关联的一个驱动程序例程。驱动程序可以调用3种同步回调例程:ControllerControl回调例程、AdapterControl例程、SynchCritSection例程。
5
)其他的驱动例程:驱动程序可以包括下面的一些例程。Timer例程,在设备操作过程中跟踪时间的例程。Cancel I/O很长时间持有等待请求的任何驱动程序必须把一个Cancel I/O例程挂到该请求。如果请求被取消,I/O管理器调用Cancel I/O例程执行必要的清理操作。

3
基于包的总线控制器DMA方式对DriverEntry例程的要求
为了使设备能在WINDOWS NT操作系统下工作,我们必须编写设备驱动程序,在驱动程序中实现DMA的传输功能。我们采用基于包的总线控制器DMA方式进行数据传输。在这种工作模式下设计DriverEntry例程需要除了DriverEntry拥有通常的工作以外,DriverEntry例程还需要有下列额外的工作:
1)
找到设备使用的DMA通道,这可以来自注册表(Registry)中的自动检测硬件信息,或者是硬件驱动程序的服务键Parameters子键中的硬编码。
2) DriverEntry
例程使用他的硬件信息构造DEVICE_DECRIPTION结构,并调用HalGetAdapter,找到与设备关联的Adapter对象。
3)
保存由HalGetAdapter返回的Adapter对象的地址和映射寄存器的数目,以便在以后使用,通常把这些值放在Device Extension中。
4)
设置所创建的任何Device对象的Flags域中的DO_DIRECT_IO位。引起I/O管理器锁定内存中的用户缓冲区,并为它们创建内存描述符(MDL)。下面部分代码为设备驱动程序DriverEntry例程的子程序,主要创建DMA对象的设备描述(DeviceDescription)。
NTSTATUS
1
AmccCreateDevice (
IN PDRIVER_OBJECT DriverObject,
IN ULONG DeviceNumber,
IN AMCC_PCI_Device_Info* device,
IN PUNICODE_STRING RegistryPath
){ ••• •••
// Create a Device object for this device...
status = IoCreateDevice(DriverObject, sizeof( AMCC_DEVICE_EXTENSION ),
&deviceName, FILE_DEVICE_UNKNOWN,0,FALSE, &pDeviceObject );
if( !NT_SUCCESS( status )) {
return status;
} // end if
••• •••
// Now register the PCI DMA controller with NT
// First create a Device Description for the Busmastering capability
DeviceDescription=ExAllocatePool(PagedPool, sizeof(DEVICE_DESCRIPTION));
RtlZeroMemory(DeviceDescription,sizeof(DEVICE_DESCRIPTION));
// the description for DMA
DeviceDescription->Version=DEVICE_DESCRIPTION_VERSION;
DeviceDescription->Master=TRUE;//bus master mode
DeviceDescription->ScatterGather=TRUE;// for scatterGather mode
DeviceDescription->Dma32BitAddresses=TRUE;// 32-bit address bus transfer
DeviceDescription->IgnoreCount=FALSE;
DeviceDescription->BusNumber=device->bus_number;//get bus number
DeviceDescription->InterfaceType=PCIBus;// transfer in pci_bus
DeviceDescription->DmaWidth=Width32Bits;// 32-bit data
DeviceDescription->MaximumLength= MAX_TRANSFER_SIZE; //the max transfer 2^26
// Now pass this description to NT for both the read and the write adapters
pDeviceExt->ReadTransfer.NumberOfMapRegisters=160000;//map's register
pDeviceExt->ReadTransfer.Adapter=HalGetAdapter(DeviceDescription, &pDeviceExt->ReadTransfer.NumberOfMapRegisters);
pDeviceExt->WriteTransfer.NumberOfMapRegisters=160000;
pDeviceExt->WriteTransfer.Adapter=HalGetAdapter(DeviceDescription, &pDeviceExt->WriteTransfer.NumberOfMapRegisters);
ExFreePool(DeviceDescription);
if(pDeviceExt->WriteTransfer.Adapter==NULL||pDeviceExt->ReadTransfer.Adapter==NULL) { IoDeleteSymbolicLink( &linkName );
IoDeleteDevice( pDeviceObject );
return STATUS_ADAPTER_HARDWARE_ERROR;
}
return status;
}//end amccCreateDevice

4
基于包的总线控制器DMA方式对AdapterControl例程的要求
为了实现DMA的传输,这里不采用ReadFileWriteFile来实现,而采用在分发例程中通过IOCTL的宏定义来实现DMA的读、写功能。当传输一个(I/O请求包)IRP的请求包到达驱动程序时,分发例程首先判断IRP堆中的控制代码的信息是否为DMA读和写的功能,如果为DMA的读写功能,判断在IRP堆中的输出缓存为零或Irp->MdlAddress中描述缓冲区的MDL的指针为空,返回错误的状态信息。否则驱动程序进入StartIo例程,在StartIo例程中判断是DMA的读还是写的方式。在这两种方式下,分别通过IoAllocateAdapterChannel传递到驱动程序的AdapterControl例程的MapRegisterBase句柄。
AdapterControl
例程应做以下一些工作:
1
)调用MmGetMdlVirtualAddress,调用它以得到进入MDL的索引,被要求作为MapTransfer的一个参数,MapTransfer调用它使得返还到IRP的缓冲区的系统物理内存变得可以访问。
2
)调用MmGetMdlByteCount得到MDL请求传输数据的字节数,在DpcForIsr例程中利用这个参数与当前传输的字节相减得到当前传输的信息。
3
保存DEVICE_EXTENSION中关于MDL的信息,保存必要的上下文信息
4
调用IoMapTransfer以映射IRP缓冲区的系统物理地址范围到总线控制器适配器的逻辑地址,驱动程序能为传输操作创建适配器。
5
启动设备,开始DMA传输。
6
返回DeallocateObjectKeepRegister,当每个DMA传输操作被完成时,另一个驱动程序例程(如DpcForIsr)必须调用 FlushAdaperBuffer清仓Adapter对象的Cache中的任何剩余的数据。
通过对DEVICE_EXTENSIONPCI基地址信息和AMCC S5933中寄存器相应的偏移地址设置寄存器的值。它所包含的信息有:中断的设置,FIFO管理表、控制状态寄存器(MCSR)的设置、清写传输计数器(MWTC)和读传输计数器(MRTC)。当通过IoMapTransfer成功获取映射的物理地址,设置MWTCMRTC,以及相应的映射的物理地址的起始地址,这样将成功启动DMA的传输。驱动程序运行Isr例程,
Isr
执行在高于DISPATCH_LEVELIRQL上。因此ISR中使用的所有代码和数据必须存在于非分页内存中,此外,ISR能调用的内核模式函数十分有限。
因为ISR执行在提升的IRQL上,所以它冻结了其CPU上所有低于或等于该IRQL的其它活动。为了提高系统性能,你的ISR应该尽可能快地执行。基本上,只做服务硬件所需的最小量的工作,然后立即返回。如果有额外的工作需要做(例如完成一个IRP),应该交给DPC来完成。
尽管ISR的代码应该尽可能地短,但你不要把这个想法运用到极端。例如,如果某设备的中断是表明它已经为接收下一个字节而准备就绪,你就应该在ISR中直接发出这个字节。为了传输一个字节而调用DPC是愚蠢的。在DMA传输时必须调用DPC例程。读者可以阅读参考文献1225页有关的例程。

5
驱动程序以及I/O管理器的后处理
内核的DPC分发器最终调用DPC例程,执行驱动程序的后处理。在DMA的操作中,有更多的数据需要传输,它设置DMA硬件传输下一块数据,启动设备。如果有错误或超时,在系统的日志中看到它。释放驱动程序占用的任何DMA和控制资源,把传输的大小和最后的信息放进IRP中,最后告诉I/O管理器完成当前的请求。
一旦驱动程序的DPC例程释放了一个IRPI/O执行各种设备无关的清理工作:在缓冲I/O操作时,释放在传输过程中使用的非分页池缓冲区;在直接I/O操作中,它解开用户缓冲区的页的锁。

以上是本人发表的一遍文章的节选,希望给大家一点帮助

你可能感兴趣的:(硬件设计)