在2019年9月,在加拿大不列颠哥伦比亚省温哥华岛发现了一群(又称亚洲巨型马蜂。巢迅速被摧毁,但事件的消息迅速传遍了整个地区。自那时以来,在邻近的华盛顿州发生了几起确认的害虫目击事件,以及大量的错误目击事件。有关探测图、马蜂手表和公众视线,请参见下面的图1。
马蜂是世界上最大的马蜂种,巢的发生令人震惊。 此外,巨蜂是欧洲蜜蜂的捕食者,入侵和摧毁它们的巢穴。 少数大黄蜂能够在短时间内摧毁整个欧洲蜜蜂群。 同时,它们是其他昆虫的贪婪捕食者,被认为是农业害虫。
这种马蜂的生命周期与许多其他黄蜂相似。 受精的蜂王在春天出现,开始了一个新的殖民地。 秋天,新王后离开巢穴,将在土壤中度过冬天,等待春天。 一位新女王的范围估计为30公里,以建立她的巢穴。 关于亚洲大黄蜂的更详细信息包括在问题附件中,也可以在网上找到。
由于对当地蜜蜂种群的潜在严重影响,的存在会引起大量的焦虑。 华盛顿州建立了热线和一个网站,供人们报告看到这些大黄蜂的情况。 根据这些来自公众的报告,国家必须决定如何优先考虑其有限的资源,以跟进更多的调查。 虽然一些报道被确定为虫,但许多其他目击事件被证明是其他类型的昆虫。
这个问题的主要问题是“我们如何解释公共报告提供的数据?”和“在政府机构资源有限的情况下,我们可以使用什么策略来优先考虑这些公共报告进行额外的调查?”
你的论文应该探讨和解决以下几个方面:
处理和讨论是否可以预测这种害虫随着时间的推移而传播,以及具有什么样的精度。
大多数报道的目击事件都把其他黄蜂误认为是马蜂侠。 只使用提供的数据集文件和(可能)提供的图像文件来创建、分析和讨论预测错误分类可能性的模型。
使用您的模型来讨论您的分类分析如何导致优先调查报告最有可能是积极的发现。
解决如何更新您的模型,给定更多的新报告随着时间的推移,以及更新应该发生的频率。
使用你的模型,什么将构成证据表明害虫已经在华盛顿州被根除?
最后,你的报告应该包括一个两页的备忘录,总结你的结果给华盛顿州农业部。
盛顿州胡蜂柑橘的出现可能会对当地生态产生潜在的负面影响。鉴于政府机构资源有限,研究人员需要制定一些策略来分析这些黄蜂公众目击报告的调查重点。具体任务分为5个问题。
对于问题1,我们需要整合黄蜂的生物学特征和标题提供的数据特征,建立黄蜂种群的生长增殖模型。首先,基于物流模型,在温度和生活习性等环境因素变化的基础上,完成了黄蜂群落基本生长模型的建立。之后,我们使用高斯分布函数描述自然事件的概率来模拟每个目击事件的时空位置,并建立黄蜂群繁殖和预测模型,以便分析目击事件的概率。这是因为我们充分考虑到目击报告并不能完全代表黄蜂种群的准确位置,并且它们的发生具有一定的随机性。事件的时空位置建立了黄蜂群落繁殖和预测模型。在模型对数据集正ID数据分布的模拟中,模拟分布与实际数据点分布比较接近。基于瞄准事件最早发生点与各发生点的距离关系,建立了拟合精度分析方法。在验证中,正确证人报告的拟合准确率约为84.6%。
关于问题2,为了充分利用数据集中的各种数据,我们将数据集分为三个维度:时空数据、文本和图像。 之后,我们利用增长-扩散模型对时空数据进行分析,建立基于LDA的文本分类模型进行文本分析,建立基于CNN的图像分析模型。各独立模型的验证结果表明,分析预测数据集分类的可能性需要综合数据集中提供的各类数据。因此,我们综合了三维模型独立给出的预测置信水平,并根据各维度的有效信息为其赋权,完成了三维综合数据分析和预测模型。 该模型在现有数据的拟合中获得了92.86%(正ID)和85.22%(负ID)的拟合优度。对于每个数据点,模型的预测结果也可以很好地解释。
对于问题 3,我们使用问题 2 的模型获得的预测置信度,根据置信区间将数据分为 S、A、B、C、D 和 E 六个级别。S级是最高等级。级别越高,目击报告的调查优先级越高。
对于问题4,我们提出了一种基于遗忘因子的增量模型更新方法。当更新新的黄蜂目击报告时,模型会计算定义的遗忘因子并更新原始训练数据。检验表明,该更新方法使模型的拟合优度提高了10.68%(负ID),并能对预测结果进行一定的自修正。
关于问题5,我们提出了三个条件,可以基于各种因素证明黄蜂已被消灭。我们使用2019-2020年的数据进行分析和论证,证明了评价标准的正确性。最后,我们预测了2021年事件的发展趋势。
本文建立的模型具有较高的综合性和准确性。此外,它还可以赋予每个数据点的预测信心,优化研究人员分析调查报告的策略。同时,我们向华盛顿州农业部提供了两页的备忘录。
为了简化我们的模型并消除复杂性,我们在本文中进行了以下主要假设。假设.1 蜂巢分布在阳性证人位置周围的某个区域。 由于提供的数据仅报告了目击事件的发生,因此根据胡蜂柑橘的习性,我们认为正确目击的黄蜂来自事件周围的某个区域网站。此假设使模型更好地拟合数据点的分布。
假设2 所提供的数据包括人为因素对殖民地的影响。从这个问题的分析可以看出,数据中胡蜂柑橘的见证事件数据并不能完全代表胡蜂柑橘的自然生长和扩散。由于胡蜂柑属群体具有入侵物种的优势,华盛顿州消灭胡蜂柑橘也需要人为因素的干预,不可能完全自然生长。
假设3 在一定时期内,气候变化不会对胡蜂殖民地产生巨大影响。此假设是为了简化模型的计算并消除未知因素对模型的影响。
假设4 专题提供的数据在一定程度上是真实可靠的。因为我们构建的模型是基于题主提供的数据,只有数据的高有效性才能保证模型的高可靠性。
2019年9月,在加拿大不列颠哥伦比亚省的温哥华岛发现了胡蜂(又称亚洲大黄蜂)的殖民地。该事件的消息迅速传遍了整个地区。从那时起,在邻近的华盛顿州发生了几次确认的害虫目击事件,以及许多错误的目击事件。胡蜂是世界上最大的大黄蜂种类,巢穴的出现令人震惊。它们是其他昆虫的贪婪捕食者,被认为是农业害虫。同时,有关亚洲大黄蜂的更多详细信息包含在问题附件中,也可以在网上找到。
由于胡蜂柑橘可能造成的严重影响,华盛顿州已经创建了帮助热线和一个网站,供人们报告这些大黄蜂的目击事件,并且必须决定如何优先考虑其有限的资源,以跟进额外的调查。
建立一个数学模型来解决和讨论这种害虫随时间推移的传播,并评估精度水平。
仅使用提供的数据集文件和(可能)提供的图像文件,构建一个模型来分析、讨论和预测错误分类的可能性。
使用该模型讨论分类分析如何导致对最有可能是阳性目击事件的报告的优先调查。
构建一种方法来更新模型,并随着时间的推移提供其他新报表,并讨论更新频率。
解决一种证据,证明这种害虫已经在华盛顿州被根除。
import torch
import torch . nn as nn
class AutoEncoder ( nn . Module ):
def __init__ ( self ):
super ( AutoEncoder , self ) . __init__ ()
self . DownSampling = nn . Sequential (
nn . Conv2d (3 , 6 , 3 , 1 , 1 ) , nn . ReLU () ,
nn . BatchNorm2d ( 6) , nn . MaxPool2d ( 2) ,
nn . Conv2d (6 , 12 , 3 , 1 , 1 ) , nn . ReLU () ,
nn . BatchNorm2d ( 12 ) , nn . MaxPool2d (2 ) ,
nn . Conv2d ( 12 , 24 , 3 , 1 , 1 ) , nn . ReLU () ,
nn . BatchNorm2d ( 24 ) , nn . MaxPool2d (2 ) ,
nn . Conv2d ( 24 , 48 , 3 , 1 , 1 ) , nn . ReLU () ,
nn . BatchNorm2d ( 48 ) , nn . MaxPool2d (2 ) ,
)
self . UpSampling = nn . Sequential (
nn . Conv2d ( 48 , 24 , 3 , 1 , 1 ) ,
nn . ConvTranspose2d ( 24 , 24 , 3 , 2 , 1 , 1 ) , nn . ReLU () ,
nn . Conv2d ( 24 , 12 , 3 , 1 , 1 ) ,
nn . ConvTranspose2d ( 12 , 12 , 3 , 2 , 1 , 1 ) , nn . ReLU () ,
nn . Conv2d ( 12 , 6 , 3 , 1 , 1 ) ,
nn . ConvTranspose2d (6 , 6 , 3 , 2 , 1 , 1) , nn . ReLU () ,
nn . Conv2d (6 , 3 , 3 , 1 , 1 ) ,
nn . ConvTranspose2d (3 , 3 , 3 , 2 , 1 , 1) ,
)
def forward ( self , x ):
return self . DownSampling ( x ) , self . UpSampling ( self . DownSampling ( x) )
import torch
import torch . nn as nn
class CNN ( nn . Module ):
def __init__ ( self ):
super ( CNN , self ) . __init__ ()
self . conv = nn . Sequential (
nn . Conv2d ( 48 , 96 , 3 , 1 , 1 ) , nn . ReLU () ,
nn . BatchNorm2d ( 96 ) , nn . MaxPool2d (2 ) ,
nn . Conv2d ( 96 , 192 , 3 , 1 , 1) , nn . ReLU () ,
nn . BatchNorm2d ( 192 ) , nn . MaxPool2d ( 2 ) ,
)
self . out = nn . Sequential (
nn . Linear ( 3072 , 128 ) , nn . Dropout ( 0 . 25 ) , nn . ReLU () ,
nn . Linear ( 128 , 2 ) , nn . Softmax ( dim =1 ) ,
)
def forward ( self , x ):
return self . out ( self . conv ( x ). view ( x. shape [0], -1 )