作物病虫害识别数据集资源合集

朋友们,今天分享一些公开的农作物病虫害识别数据集。病虫害是病害和虫害的并称,常对农、林、牧业等造成不良影响。本文介绍分为病害数据集和虫害数据集两部分。这些数据集用于图像分类系统。

1 病害识别数据集

1.1 农业病虫害研究图库(IDADP)

1.1.1 介绍

农业病虫害研究图库(IDADP)http://www.icgroupcas.cn/website_bchtk/index.html 由中国科学院合肥智能机械研究所牵头、联合亚热带农业生态研究所、遥感与数字地球研究所建设,整合了大量的农业病虫害图像样本资源,每种病虫害具有几百到几千张高质量图像,可为病虫害图像识别研究提供机器学习建模所需的样本 。

面向农业图像理解的机器学习数据集是以农业病虫害研究图库(IDADP)为基础建设而成的综合数据库。整合了大量的农业本体和病虫害高质量图像/文本/视频样本资源,为农业本体/病虫害认知研究提供机器学习建模所需的样本数据,形成面向农业图像理解关键技术研究的基础资源。

据我所知,该数据集数量最大,作物类别、病虫害类别最齐全,数据量超过200G。囊括了水稻、小麦、玉米、大豆、棉花、黄瓜、番茄、葡萄、猕猴桃、梨树、豇豆、西瓜、甜瓜等作物。以水稻为例,提供了水稻白叶枯病、水稻稻曲病、水稻稻瘟病、水稻胡麻斑病、水稻纹枯病、水稻细菌性条斑病等病害,东方蝼蛄、盾蝽、稻飞虱、稻蝗、稻棘缘蝽、稻绿蝽、稻纵卷叶螟、二化螟、二星蝽、麻皮蝽、水稻大螟、甜菜白带野螟、中华剑角蝗等十几种虫害的数据。
作物病虫害识别数据集资源合集_第1张图片

1.1.2 论文

大田作物病害识别研究图像数据集 http://www.csdata.org/p/290/1/

1.1.3 数据获取

IDADP数据官网http://www.icgroupcas.cn/website_bchtk/index.html。
虽然该数据集发表了论文,但是我没有发现该论文的数据集的下载方式,如需获取数据,需要在IDADP官网联系作者。

另外IDADP官网提供了部分样例数据下载。
作物病虫害识别数据集资源合集_第2张图片

1.2 AI Challenger 2018 病虫害分类数据集

1.2.1 介绍

这个数据集是AI Challenger 2018竞赛的数据,是农作物叶子图像的数据集,标注图片5万张,包含10种植物(苹果、樱桃、葡萄、柑桔、桃、草莓、番茄、辣椒、玉米、马铃薯)的27种病害,合计61个分类(按“物种-病害-程度”分)。具体分类见下表。

Label ID Label Name
0 apple healthy(苹果健康)
1 Apple_Scab general(苹果黑星病一般)
2 Apple_Scab serious(苹果黑星病严重)
3 Apple Frogeye Spot(苹果灰斑病)
4 Cedar Apple Rust general(苹果雪松锈病一般)
5 Cedar Apple Rust serious(苹果雪松锈病严重)
6 Cherry healthy(樱桃健康)
7 Cherry_Powdery Mildew general(樱桃白粉病一般)
8 Cherry_Powdery Mildew serious(樱桃白粉病严重)
9 Corn healthy(玉米健康)
10 Cercospora zeaemaydis Tehon and Daniels general(玉米灰斑病一般)
11 Cercospora zeaemaydis Tehon and Daniels serious(玉米灰斑病严重)
12 Puccinia polysora general(玉米锈病一般)
13 Puccinia polysora serious(玉米锈病严重)
14 Corn Curvularia leaf spot fungus general(玉米叶斑病一般)
15 Corn Curvularia leaf spot fungus serious(玉米叶斑病严重)
16 Maize dwarf mosaic virus(玉米花叶病毒病)
17 Grape heathy(葡萄健康)
18 Grape Black Rot Fungus general(葡萄黑腐病一般)
19 Grape Black Rot Fungus serious(葡萄黑腐病严重)
20 Grape Black Measles Fungus general(葡萄轮斑病一般)
21 Grape Black Measles Fungus serious(葡萄轮斑病严重)
22 Grape Leaf Blight Fungus general(葡萄褐斑病一般)
23 Grape Leaf Blight Fungus serious(葡萄褐斑病严重)
24 Citrus healthy(柑桔健康)
25 Citrus Greening June general(柑桔黄龙病一般)
26 Citrus Greening June serious(柑桔黄龙病严重)
27 Peach healthy(桃健康)
28 Peach_Bacterial Spot general(桃疮痂病一般)
29 Peach_Bacterial Spot serious(桃疮痂病严重)
30 Pepper healthy(辣椒健康)
31 Pepper scab general(辣椒疮痂病一般)
32 Pepper scab serious(辣椒疮痂病严重)
33 Potato healthy(马铃薯健康)
34 Potato_Early Blight Fungus general(马铃薯早疫病一般)
35 Potato_Early Blight Fungus serious(马铃薯早疫病严重)
36 Potato_Late Blight Fungus general(马铃薯晚疫病一般)
37 Potato_Late Blight Fungus serious(马铃薯晚疫病严重)
38 Strawberry healthy(草莓健康)
39 Strawberry_Scorch general(草莓叶枯病一般)
40 Strawberry_Scorch serious(草莓叶枯病严重)
41 Tomato healthy(番茄健康)
42 tomato powdery mildew general(番茄白粉病一般)
43 tomato powdery mildew serious(番茄白粉病严重)
44 Tomato Bacterial Spot Bacteria general(番茄疮痂病一般)
45 Tomato Bacterial Spot Bacteria serious(番茄疮痂病严重)
46 Tomato_Early Blight Fungus general(番茄早疫病一般)
47 Tomato_Early Blight Fungus serious(番茄早疫病严重)
48 Tomato_Late Blight Water Mold general(番茄晚疫病菌一般)
49 Tomato_Late Blight Water Mold serious(番茄晚疫病菌严重)
50 Tomato_Leaf Mold Fungus general(番茄叶霉病一般)
51 Tomato_Leaf Mold Fungus serious(番茄叶霉病严重)
52 Tomato Target Spot Bacteria general(番茄斑点病一般)
53 Tomato Target Spot Bacteria serious(番茄斑点病严重)
54 Tomato_Septoria Leaf Spot Fungus general(番茄斑枯病一般)
55 Tomato_Septoria Leaf Spot Fungus serious(番茄斑枯病严重)
56 Tomato Spider Mite Damage general(番茄红蜘蛛损伤一般)
57 Tomato Spider Mite Damage serious(番茄红蜘蛛损伤严重)
58 Tomato YLCV Virus general(番茄黄化曲叶病毒病一般)
59 Tomato YLCV Virus serious(番茄黄化曲叶病毒病严重)
60 Tomato Tomv(番茄花叶病毒病)

部分数据截图如下。
作物病虫害识别数据集资源合集_第3张图片

1.2.2 数据获取

该数据可在AI Studio上直接下载,链接
https://aistudio.baidu.com/aistudio/datasetdetail/76075

1.3 Plant-Village数据集

1.3.1 介绍

PlantVillage 数据集包括 54303张健康和病害图片,分为38个类别。听说AI Challenger2018数据集是在此数据集的基础上制作的。

Label ID Label Name
1 Apple_scab
2 Apple_black_rot
3 Apple_cedar_apple_rust
4 Apple_healthy
5 Background_without_leaves
6 Blueberry_healthy
7 Cherry_powdery_mildew
8 Cherry_healthy
9 Corn_gray_leaf_spot
10 Corn_common_rust
11 Corn_northern_leaf_blight
12 Corn_healthy
13 Grape_black_rot
14 Grape_black_measles
15 Grape_leaf_blight
16 Grape_healthy
17 Orange_haunglongbing
18 Peach_bacterial_spot
19 Peach_healthy
20 Pepper_bacterial_spot
21 Pepper_healthy
22 Potato_early_blight
23 Potato_healthy
24 Potato_late_blight
25 Raspberry_healthy
26 Soybean_healthy
27 Squash_powdery_mildew
28 Strawberry_healthy
29 Strawberry_leaf_scorch
30 Tomato_bacterial_spot
31 Tomato_early_blight
32 Tomato_healthy
33 Tomato_late_blight
34 Tomato_leaf_mold
35 Tomato_septoria_leaf_spot
36 Tomato_spider_mites_two-spotted_spider_mite
37 Tomato_target_spot
38 Tomato_mosaic_virus
39 Tomato_yellow_leaf_curl_virus

作物病虫害识别数据集资源合集_第4张图片

1.3.2 论文

该数据集论文链接 https://arxiv.org/abs/1511.08060.

1.3.3 数据获取

(1)mendeley下载:https://data.mendeley.com/datasets/tywbtsjrjv/1
(2)github下载: https://github.com/spMohanty/PlantVillage-Dataset

1.4 苹果叶片病理数据集

1.4.1 介绍

此数据集只针对苹果叶片。
苹果叶片病理数据集数据集由西北农林科技大学制作,分别在西北农林科技大学白水苹果试验站、洛川苹果试验站和庆城苹果试验站进行的采集。 数据集主要在晴天光线良好的条件下获取, 部分图像在阴雨天进行采集,不同的采集条件进一步增强了数据集的多样性。 数据集包括斑点落叶病、褐斑病、花叶病、灰斑病以及锈病等五种常见的苹果叶面病理图像数据,数量分别为: 斑点落叶病 5343 张,褐斑病5655 张, 灰斑病 4810 张,花叶病 4875 张, 锈病 5694 张,共有20000余张图像。
该数据集是在经过翻转、对比度等12种数据增强的基础上建立的,所以数据量比较大,而原始图片应该是1591张,如果我没有算错的话(20683 / 13)。
作物病虫害识别数据集资源合集_第5张图片

1.4.2 论文

[1]周敏敏. 基于迁移学习的苹果叶面病害Android检测系统研究[D].西北农林科技大学,2019.

1.4.3 数据获取

该数据可在AI Studio上直接下载,链接https://aistudio.baidu.com/aistudio/datasetdetail/11591

1.5 水稻叶片病害数据集 Rice Leaf Disease Image Samples

包含 5932张图片,4类水稻叶片病害,包括白叶枯病、稻瘟病、东格鲁病、褐斑病。
作物病虫害识别数据集资源合集_第6张图片

1.5.2 论文

Sethy, P. K., Barpanda, N. K., Rath, A. K., & Behera, S. K. (2020). Deep feature based rice leaf disease identification using support vector machine. Computers and Electronics in Agriculture, 175, 105527. doi:10.1016/j.compag.2020.105527.

1.5.3 数据获取

https://data.mendeley.com/datasets/fwcj7stb8r/1

1.6 LWDCD 2020 小麦病害数据集

1.6.1 介绍

Large Wheat Disease Classification Dataset (LWDCD) 小麦病害分类数据集,包含12000张照片,其中9个病害类别和1个健康类别。

小麦病害类别 图片数量
Karnal bunt 1150
Black Chaff 1100
Crown and Root Rot 1040
Fusarium Head Blight 1270
Healthy Wheat 1280
Leaf Rust 1620
Powdery Mildew 1230
Tan Spot 1220
Wheat Loose Smut 1100
Wheat Streak Mosaic 1150

作物病虫害识别数据集资源合集_第7张图片

1.6.2 论文

名称:Leaf and spike wheat disease detection & classification using an improved deep convolutional architecture
链接:https://www.sciencedirect.com/science/article/pii/S2352914821001313

1.6.3 数据获取

论文没有直接提供数据集下载链接。但是在网上只搜到了一部分的数据集,只包含4500张照片,四个类别,分别是Healthy Wheat、Leaf Rust、Crown and Root Rot、Wheat Loose Smut。谷歌云盘下载链接:
https://drive.google.com/drive/folders/1OHKtwD1UrdmhqxrpQEeF_X_pqKotxRGD

1.7 小麦叶片数据集 Wheat Leaf Dataset

1.7.1 介绍

小麦叶片数据集,包含102张健康叶片、208张条锈病、97张Septoria Disease。这个数据不管从类别数量还是图片数量来说都比较少,可以作为其他数据的一个补充。
作物病虫害识别数据集资源合集_第8张图片

1.7.2 数据获取

mendeley下载:https://data.mendeley.com/datasets/wgd66f8n6h/1

1.8 CGIAR 小麦病害数据集

1.8.1 介绍

CGIAR Computer Vision for Crop Disease是kaggle比赛的一个数据集,只包含三类,分别是healthy, stem rust, leaf rust,共876张照片。该数据集比较小,可以作为其他数据的一个补充。

1.8.2 数据获取

kaggle链接:https://www.kaggle.com/shadabhussain/cgiar-computer-vision-for-crop-disease

2 虫害识别数据集

2.1 IDADP农业病虫害研究图库(IDADP)

农业病虫害研究图库(IDADP)http://www.icgroupcas.cn/website_bchtk/index.html。该数据在1.1章节介绍过,这里不再赘述。

2.2 IP102数据集

2.2.1 介绍

IP102 是一个用于目标分类与检测任务的农作物病虫害数据集。 102指102个虫害类别。
它包含了水稻、玉米、小麦、甜菜、苜蓿、葡萄、柑橘 、芒果共8种作物的75000 多幅图像,这些图像呈现出自然的长尾分布(long-tailed distribution)。此外,为大约19000 幅图像添加了用于对象检测的边界框。 前五种作物为大田作物(FC, field crops),后三种为经济作物(EC,economic crops)。

作物 类别数
Rice 水稻 14
Corn 玉米 13
Wheat 小麦 9
Beet 甜菜 8
Alfalfa 苜蓿 13
Vitis 葡萄 16
Citrus 柑橘 19
Mango 芒果 10

数据收集与注释分为分类系统建立、图像采集、初步数据过滤、专业数据注释四大步骤,这些介绍来自(https://blog.csdn.net/qq_43723025/article/details/115900568)

(1)分类系统建立:IP102数据集有一个层次分类系统。它们呈现出如图4所示的分层结构。根据遭受虫害的作物,给每种虫害分配一个高级别类别(在下文中称为超类)。换句话说,每种害虫都是某个超类的一个下级类(在下文中表示为子类)。比如稻秆蛆这种害虫损害了水稻这种作物,水稻属于大田作物。因此,在IP102的分类系统中,稻秆蛆亚类具有水稻和大田作物的超类。
(2)图像采集:利用互联网广泛收集数据,如:ImageNet、COCO等;第一步,依靠常见的图像搜索引擎,包括Google、Flickr、Bing等,使用每个子类的英文名称和对应的同义词作为查询关键字,每个关键字只保留2000个结果;第二步,从几个专业的农业和昆虫科学网站上搜索;除了图像形式,还收集了包含害虫内容的视频剪辑,从视频剪辑中,我们以每秒5帧的速度捕捉图像。因此,为IP102数据集收集了300,000多幅候选图像。
(3)初步数据过滤:我们组织了6名志愿者手动过滤候选图像。在数据过滤之前,他们接受三部分培训内容,即:1)农业专家对害虫的常识,2)IP102的分类系统,3)不同形式的害虫。例如,图2显示了四种形式的害虫,包括卵、幼虫、蛹和成虫。即使它们处于生命周期的不同阶段,但它们都会对农产品造成不同程度的损害。在初步数据过滤的过程中,志愿者删除不包含或包含一个以上虫害类别的图像,如图2所示。然后,我们将过滤后的图像格式转换为JPEG格式,并删除重复或损坏的图像。最后,我们有大约120,000个带有查询关键字弱标签的图像。超类的标签是根据IP102数据集的分类系统分配的。
(4)专业数据注释:数据注释:第一阶段是独立注释,每个专家注释一个超类;第二阶段是协同注释,每个专家对每一个子类都进行注释,最后协同起来,若一个图像样本得到了5个或者5个以上的专家统一注释,那么这个图像就属于某个类别,否则将会被删除。
类别代码和名称如下表。 (害虫中文由本人友情翻译,可能会不准确,建议以英文为主)

类别 作物英文 作物中文 害虫英文 害虫中文
1 Rice 水稻 rice leaf roller 稻纵卷叶螟
2 Rice 水稻 rice leaf caterpillar 稻叶毛虫
3 Rice 水稻 paddy stem maggot 稻潜叶蝇
4 Rice 水稻 asiatic rice borer 水稻二化螟
5 Rice 水稻 yellow rice borer 水稻三化螟
6 Rice 水稻 rice gall midge 稻瘿蚊
7 Rice 水稻 Rice Stemfly 稻秆蝇
8 Rice 水稻 brown plant hopper 褐稻虱
9 Rice 水稻 white backed plant 白背飞虱
10 Rice 水稻 small brown plant 灰飞虱
11 Rice 水稻 rice water weevil 稻水象甲
12 Rice 水稻 rice leafhopper 稻叶蝉
13 Rice 水稻 grain spreader thrips 谷物撒布机蓟马
14 Rice 水稻 rice shell pest 稻苞虫
15 Corn 玉米 grub 蛴螬
16 Corn 玉米 mole cricket 蝼蛄
17 Corn 玉米 wireworm 金针虫
18 Corn 玉米 white margined moth 白边蛾
19 Corn 玉米 black cutworm 小地老虎
20 Corn 玉米 large cutworm 大地老虎
21 Corn 玉米 yellow cutworm 黄地老虎
22 Corn 玉米 red spider 红蜘蛛
23 Corn 玉米 corn borer 玉米螟
24 Corn 玉米 army worm 夜蛾
25 Corn 玉米 aphids 蚜虫
26 Corn 玉米 Potosiabre vitarsis 白星花金龟
27 Corn 玉米 peach borer 桃蛀螟
28 Wheat 小麦 english grain aphid 麦长管蚜
29 Wheat 小麦 green bug 麦二叉蚜
30 Wheat 小麦 bird cherry-oataphid 燕麦蚜
31 Wheat 小麦 wheat blossom midge 麦红吸浆虫
32 Wheat 小麦 penthaleus major 小麦红蜘蛛
33 Wheat 小麦 longlegged spider mite 长腿蜘蛛螨
34 Wheat 小麦 wheat phloeothrips 小麦根皮蓟马
35 Wheat 小麦 wheat sawfly 麦叶蜂
36 Wheat 小麦 cerodonta denticornis 麦黑斑潜叶蝇
37 Beet 甜菜 beet fly 甜菜潜叶蝇
38 Beet 甜菜 flea beetle 跳甲
39 Beet 甜菜 cabbage army worm 甘蓝夜蛾
40 Beet 甜菜 beet army worm 甜菜夜蛾
41 Beet 甜菜 Beet spot flies 甜菜斑蝇
42 Beet 甜菜 meadow moth 草地螟
43 Beet 甜菜 beet weevil 甜菜象虫
44 Beet 甜菜 sericaorient alismots chulsky 东方绢金龟
45 Alfalfa 苜蓿 alfalfa weevil 苜蓿叶象甲
46 Alfalfa 苜蓿 flax budworm 苜蓿夜蛾
47 Alfalfa 苜蓿 alfalfa plant bug 苜蓿盲蝽
48 Alfalfa 苜蓿 tarnished plant bug 牧草盲蝽
49 Alfalfa 苜蓿 Locustoidea 蝗总科
50 Alfalfa 苜蓿 lytta polita 磨光东鳖甲
51 Alfalfa 苜蓿 legume blister beetle 豆科水疱甲虫
52 Alfalfa 苜蓿 blister beetle 水疱甲虫
53 Alfalfa 苜蓿 therioaphis maculata Buckton 苜蓿斑蚜
54 Alfalfa 苜蓿 odontothrips loti 牛角花齿蓟马
55 Alfalfa 苜蓿 Thrips 蓟马
56 Alfalfa 苜蓿 alfalfa seed chalcid 苜蓿广肩小蜂
57 Alfalfa 苜蓿 Pieris canidia 东方菜粉蝶
58 Vitis 葡萄 Apolygus lucorum 绿盲蝽
59 Vitis 葡萄 Limacodidae 刺蛾科
60 Vitis 葡萄 Viteus vitifoliae 葡萄根瘤蚜
61 Vitis 葡萄 Colomerus vitis 葡萄缺节瘿螨
62 Vitis 葡萄 Brevipoalpus lewisi McGregor 南天竹刘氏短须螨
63 Vitis 葡萄 oides decempunctata 十星叶甲
64 Vitis 葡萄 Polyphagotars onemus latus 侧多食附线螨
65 Vitis 葡萄 Pseudococcus comstocki Kuwana 康氏粉蚧
66 Vitis 葡萄 parathrene regalis 葡萄透翅蛾
67 Vitis 葡萄 Ampelophaga 萄葡天蛾
68 Vitis 葡萄 Lycorma delicatula 斑衣蜡蝉
69 Vitis 葡萄 Xylotrechus 四带虎天牛
70 Vitis 葡萄 Cicadella viridis 大青叶蝉
71 Vitis 葡萄 Miridae 盲蝽科
72 Vitis 葡萄 Trialeurodes vaporariorum 温室粉虱
73 Vitis 葡萄 Erythroneura apicalis 斑叶蝉
74 Citrus 柑橘 Papilio xuthus 柑橘凤蝶
75 Citrus 柑橘 Panonchus citri McGregor 柑橘红蜘蛛
76 Citrus 柑橘 Phyllocoptes oleiverus ashmead 柑橘锈螨
77 Citrus 柑橘 Icerya purchasi Maskell 吹绵蚧
78 Citrus 柑橘 Unaspis yanonensis 矢尖蚧
79 Citrus 柑橘 Ceroplastes rubens 红蜡蚧
80 Citrus 柑橘 Chrysomphalus aonidum 黑褐圆盾蚧
81 Citrus 柑橘 Parlatoria zizyphus Lucus 黑点介壳虫
82 Citrus 柑橘 Nipaecoccus vastalor 堆蜡粉蚧
83 Citrus 柑橘 Aleurocanthus spiniferus 黑刺粉虱
84 Citrus 柑橘 Tetradacus c Bactrocera 柑橘大实蝇
85 Citrus 柑橘 Dacus dorsalis(Hendel) 芒果柑桔小实蝇
86 Citrus 柑橘 Bactrocera tsuneonis 蜜柑大实蝇
87 Citrus 柑橘 Prodenia litura 斜纹夜蛾
88 Citrus 柑橘 Adristyrannus 枯叶夜蛾
89 Citrus 柑橘 Phyllocnistis citrella Stainton 柑桔潜叶蛾
90 Citrus 柑橘 Toxoptera citricidus 花椒蚜虫
91 Citrus 柑橘 Toxoptera aurantii 茶蚜
92 Citrus 柑橘 Aphis citricola Vander 绣线菊蚜
93 Mango 芒果 Scirtothrips dorsalis Hood 茶黄蓟马
94 Mango 芒果 Dasineura sp 荔枝叶瘿蚊
95 Mango 芒果 Lawana imitata Melichar 白翅蜡蝉
96 Mango 芒果 Salurnis marginella Guerr 褐缘蛾蜡蝉
97 Mango 芒果 Deporaus marginatus Pascoe 芒果切叶象甲
98 Mango 芒果 Chlumetia transversa 横线尾夜蛾
99 Mango 芒果 Mango flat beak 叶蝉
100 Mango 芒果 Rhytidodera bowrinii white 脊胸天牛
101 Mango 芒果 Sternochetus frigidus 芒果果肉象甲
102 Mango 芒果 Cicadellidae 叶蝉科

论文的数据集图片示例,由于原图可能会引起部分观众的不适,这里做了一些模糊处理。 详情参考论文。
作物病虫害识别数据集资源合集_第9张图片

2.2.2 论文

名称:IP102: A Large-Scale Benchmark Dataset for Insect Pest Recognition
链接:https://ieeexplore.ieee.org/document/8954351

2.2.3 数据获取

论文作者的github上会给出链接https://github.com/xpwu95/IP102,谷歌云盘下载地址:https://drive.google.com/drive/folders/1svFSy2Da3cVMvekBwe13mzyx38XZ9xWo

3 结束语

好朋友们,以上就是本次分享的全部内容了,更多数据集可参考一篇综述论文:https://www.researchgate.net/publication/349572585_Plant_diseases_and_pests_detection_based_on_deep_learning_a_review

您的支持使我在寒冬里倍感温暖,欢迎转载、分享、点赞。

作物病虫害识别数据集资源合集_第10张图片

你可能感兴趣的:(人工智能)