在《PCI Express Technology 3.0.pdf》一书的figure 4-2展示了PCIe 设备和switch(or bridge)的配置空间图示;
使用PCI/PCIe的目的,就是为了简单地访问它:像读写内存一样读写PCI/PCIe设备。
提问:
每个PCI/PCIe设备都有配置空间,就是一系列的寄存器,对于普通的设备,它的配置空间包括:
Vendor ID:厂家ID,PCI SIG组织给每个厂家都分配了一个独一的ID
Device ID:厂家给自己的某类产品分配一个Device ID
Revision ID:厂家自定义的版本号,可以认为是Device ID的延伸
Header Type:
Class Code:这是只读的寄存器,它含有3个字节,用来表明设备的功能,它分为3部分
普通的PCI/PCIe设备有6个基地址寄存器,简称为BAR:
BAR用于:
地址空间可以分为两类:内存(Memory)、IO:
BAR的格式如下:
BAR怎么表示它想申请多大的空间?以32位地址为例:
u32 l = 0, sz = 0, mask;
...
mask = type ? PCI_ROM_ADDRESS_MASK : ~0;
...
pci_read_config_dword(dev, pos, &l);
pci_write_config_dword(dev, pos, l | mask);
pci_read_config_dword(dev, pos, &sz);
pci_write_config_dword(dev, pos, l);
如果BAR表示它使用32位的地址,那么BAR0~BAR5可以分别表示6个地址空间。
如果BAR表示它使用64位的地址,那么BAR0和BAR1、BAR2和BAR3、BAR4和BAR5分别表示3个地址空间:
扫描PCIe总线,对每一个PCIe桥、PCIe设备,都构造出对应的pci_dev:
pci_dev结构体如下:
对应pci_dev结构体里的设备信息:读取PCI设备的配置空间即可获得。
对应pci_dev结构体里的资源,本节课程先不分析irq。对于resource结构体,每个成员对应一个BAR。
resource结构体如下,要注意的是:里面记录的start、end等,是基于CPU角度看待的。也就是说,如果记录的是内存地址、IO地址,那么是CPU地址,不是PCI地址。并且这些地址是物理地址,要在软件中使用它们要先执行ioremap。
我们要找到这4个核心代码:
关键代码分为两部分:
读信息、得知PCIe设备想申请多大的空间
rockchip_pcie_probe
bus = pci_scan_root_bus(&pdev->dev, 0, &rockchip_pcie_ops, rockchip, &res);
pci_scan_root_bus_msi
pci_scan_child_bus
pci_scan_slot
dev = pci_scan_single_device(bus, devfn);
dev = pci_scan_device(bus, devfn);
struct pci_dev *dev;
dev = pci_alloc_dev(bus);
pci_setup_device
pci_read_bases(dev, 6, PCI_ROM_ADDRESS);
struct resource *res = &dev->resource[pos];
__pci_read_base
pci_read_config_dword(dev, pos, &l);
pci_write_config_dword(dev, pos, l | mask);
pci_read_config_dword(dev, pos, &sz);
pci_write_config_dword(dev, pos, l);
pci_device_add(dev, bus);
分配空间
rockchip_pcie_probe
pci_bus_size_bridges(bus);
pci_bus_assign_resources(bus);
__pci_bus_assign_resources
pbus_assign_resources_sorted
/* pci_dev->resource[]里记录有想申请的资源的大小,
* 把这些资源按对齐的要求排序
* 比如资源A要求1K地址对齐,资源B要求32地址对齐
* 那么资源A排在资源B前面, 优先分配资源A
*/
list_for_each_entry(dev, &bus->devices, bus_list)
__dev_sort_resources(dev, &head);
// 分配资源
__assign_resources_sorted
assign_requested_resources_sorted(head, &local_fail_head);
在pci_scan_device
函数中,会先尝试读取VID、PID,成功的话才会继续调用pci_setup_device
:
在pci_setup_device
内部,会继续读取其他信息:
pci_read_bases
函数代码分析:
pci_read_bases
函数又会调用__pci_read_base
,__pci_read_base
只是读BAR,算出想申请的空间的大小:
把前面讲过的贴出来,有助于理解代码:
BAR怎么表示它想申请多大的空间?以32位地址为例:
以下是__pci_read_bases
函数的代码分析。
这部分代码的函数调用非常深,我们抓住2个问题即可:
代码调用关系如下:
把要申请的资源, 按照对齐要求排序,然后调用assign_requested_resources_sorted,代码如下:
/* 把要申请的资源, 按照对齐要求排序
* 然后调用assign_requested_resources_sorted
*/
rockchip_pcie_probe
pci_bus_size_bridges(bus);
pci_bus_assign_resources(bus);
__pci_bus_assign_resources
pbus_assign_resources_sorted
/* pci_dev->resource[]里记录有想申请的资源的大小,
* 把这些资源按对齐的要求排序
* 比如资源A要求1K地址对齐,资源B要求32地址对齐
* 那么资源A排在资源B前面, 优先分配资源A
*/
list_for_each_entry(dev, &bus->devices, bus_list)
__dev_sort_resources(dev, &head);
// 分配资源
__assign_resources_sorted
assign_requested_resources_sorted(head, &local_fail_head);
assign_requested_resources_sorted
函数做两件事
分配地址空间
把这块空间对应的PCI地址写入PCIe设备的BAR
代码如下:
assign_requested_resources_sorted(head, &local_fail_head);
pci_assign_resource
ret = _pci_assign_resource(dev, resno, size, align);
// 分配地址空间
__pci_assign_resource
pci_bus_alloc_resource
pci_bus_alloc_from_region
/* Ok, try it out.. */
ret = allocate_resource(r, res, size, ...);
err = find_resource(root, new, size,...);
__find_resource
// 从资源链表中分配地址空间
// 设置pci_dev->resource[]
new->start = alloc.start;
new->end = alloc.end;
// 把对应的PCI地址写入BAR
pci_update_resource(dev, resno);
pci_std_update_resource
/* 把CPU地址转换为PCI地址: PCI地址 = CPU地址 - offset
* 写入BAR
*/
pcibios_resource_to_bus(dev->bus, ®ion, res);
new = region.start;
reg = PCI_BASE_ADDRESS_0 + 4 * resno;
pci_write_config_dword(dev, reg, new);