tensorflow版本的DBnet

项目地址:https://github.com/zonasw/DBNet.git

作者在readme中说 tensorflow >= 2.2.0,我测试过tensorflow 2.1.0也是可以用的。

我是在win10下使用的。

1. 测试

下载完代码先是安装必要的依赖库,因为作者没有给我们生成requirements.txt,所以不能通过命令:

pip install -r requirements.txt

来安装需要的依赖库。

我们可以直接执行程序:

python inference.py

程序提示缺什么库我们就安装什么库就可以。

预训练的模型从readme的下载路径下载就可以,然后放到相应的路径下。

代码中指定的路径是这里:

tensorflow版本的DBnet_第1张图片

测试的效果跟readme中展示的一致。

tensorflow版本的DBnet_第2张图片

2. 训练

执行:

python train.py

训练数据是json格式的:

原路径如下,需要改成自己的路径

tensorflow版本的DBnet_第3张图片

比如我改成:

tensorflow版本的DBnet_第4张图片

增加自己的训练集可以直接在train.json中增加。

同时需要修改train.json和val.json中加载图像的路径,使之与自己的图像路径一致。

此外其他注意事项:

一、生成路径失败:

logs\train\plugins\profile

在logs下面这三级目录自动创建失败,具体原因还没查找,就自己手动创建了一下。

二、没有使用GPU训练

因为在train.py中有这么一句,显然是用来指定GPU的,如果找不到对应显卡就会用CPU训练。

os.environ["CUDA_VISIBLE_DEVICES"] = "1"

这一句指定的是第二张显卡,对于只有单卡的我只能指定第一张显卡。

os.environ["CUDA_VISIBLE_DEVICES"] = "0"

三、显存不够问题

程序中config.py中

BATCH_SIZE = 8

如我的电脑,batch=8时显存是不够用的,所以对我而言,将batchsize改成了4。

BATCH_SIZE = 4

如果显存不够会报错,这个报错很有误导性,其实仅仅是显存不够,改一下batchsize就可以解决:

Could not load dynamic library 'cupti64_101.dll'; dlerror: cupti64_101.dll not found

 

你可能感兴趣的:(python,文本检测,tensorflow)