Pytorch.utils.data.DataLoader中collate_fn参数的使用

来自官网的DataLoader说明:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第1张图片

翻译:合并样本列表中的样本以形成一个最小batch的张量,从映射函数样式数据集中使用批量加载时使用。

个人理解呢,就是从样本列表中过来了一个batch的数据,经过映射函数,形成一个tensor。

collate_fn这玩应就是一个映射函数,输入是一个batch的样本,输出是一个tensor。有系统默认的,当然这个位置作为一个参数被暴露出来的意思就是你可以自己定义一个映射函数来代替它。

实现功能:

以一个例子来具体的看一下collate_fn的功能:

系统默认collate_fn:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第2张图片

复现collate_fn:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第3张图片

从此图中可以看出,自定义的collate_fn函数已与系统默认的collate_fn函数输出结果相同。

无转tensor:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第4张图片

从此图中可以看出,数据输入到默认collate_fn函数中,首先被转为tensor。

无转tensordataset:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第5张图片

从此图中可以看出,数据输入到默认collate_fn函数中,被转为tensor后又被转为tensorDatasets。

未尝试部分:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第6张图片

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第7张图片

可以看出collate_fn中应该有代码来处理数据总数无法被batch整除的情况。

YOLOv3中collate_fn:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第8张图片

从代码中可以看出,自定义的函数,主要功能就是拼接。

源码:

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第9张图片

Pytorch.utils.data.DataLoader中collate_fn参数的使用_第10张图片

参考链接:https://blog.csdn.net/weixin_42028364/article/details/81675021

你可能感兴趣的:(工作经验,pytorch,pytorch,datasets,collate_fn)