HheeFish

遥感影像云检测-云检测数据集信息及下载

常用云检测数据集信息及下载

1.LandSat7云量评估数据集
2.LandSat8-Biome生物群落云量评估数据集
3.LandSat8-38Cloud数据集
4.高分系列-GF1-WHU遥感影像云数据集
5.Sentinel-2 Cloud Mask Catalogue
- 5.1.数据介绍
- 5.2.数据集目录编排
- 5.3.统计数据
- 5.4.错误和不确定性
6.CESBIO数据集(Sentinel-2)
- 6.1.数据介绍
- 6.2.数据集目录编排
- 6.3.数据描述
7.GSFC(LanSat8, Sentinel2)
8.Hollstein dataset (Sentinel-2)
- 8.1.数据介绍
- 8.2.数据描述
9.Pixbox(LanSat8, Sentinel2)
- 9.1.PixBox Sentinel-2
- - 9.1.1.数据介绍
  - 9.1.2.数据集目录编排
  - 9.1.3.数据描述
- 9.2.PixBox Landsat 8
- - 9.2.1.数据介绍
  - 9.2.2.数据集目录编排
  - 9.2.3.数据描述

1.LandSat7云量评估数据集

数据下载
该集合包含206 个Landsat 7增强型主题映射器（ETM +）1G级场景，显示在以下生物群系中。手动生成的云遮罩用于训练和验证云覆盖评估算法，该算法又用于计算每个场景中云覆盖的百分比。最初报告为207个Mask，但错误地计算了一个。
来自此数据集的102个场景用于Foga，Scaramuzza等人中描述的云验证研究中
[Foga, S., Scaramuzza, P.L., Guo, S., Zhu, Z., Dilley, R.D., Beckmann, T., Schmidt, G.L., Dwyer, J.L., Hughes, M.J. & Laue, B. (2017). Cloud detection algorithm comparison and validation for operational Landsat data products. Remote Sensing of Environment, 194, 379-390. ](doi: 10.1016/j.rse.2017.03.026.)
每个文件包含.TIF格式的1级数据带文件、元数据文件（MTL.txt）和.TIF格式的手动掩码。
每个手动掩码中的位解释如下：

Value	Interpretation
0	Fill
64	Cloud Shadow
128	Clear
192	Thin Cloud
255	Cloud

2.LandSat8-Biome生物群落云量评估数据集

数据下载
该集合包含96个Landsat 8操作性陆地成像仪（OLI）热红外传感器（TIRS）地形校正（Level-1T）场景，显示在以下生物群系中。手动生成的云遮罩用于验证云覆盖评估算法，该算法又用于计算每个场景中云覆盖的百分比。
每个文件都包含.TIF格式的Landsat 8 Level-1数据带文件，质量带.TIF文件，元数据文件（MTL.txt）和.img（ENVI）格式的手动掩码。
CCA：cloud cover assessment (CCA)
近似云状态列使用以下指南表示每个场景的估计云百分比：

场景云量等级	条件
Clear	低于35%
Mid Cloud	35%-65%
Cloudy	高于65%
每个手动掩码中的位解释如下：
Value	Interpretation
–	–
0	Fill
64	Cloud Shadow
128	Clear
192	Thin Cloud
255	Cloud

3.LandSat8-38Cloud数据集

数据下载
这些场景的整个图像被裁剪成多个384 384碎片，适用于基于深度学习的语义分割算法。每个碎片具有4个相应的光谱通道，其为红色（带4），绿色（带3），蓝色（带2）和近红外（带5）。与其他计算机视觉图像不同，这些通道不会组合在一起。相反，它们对应于目录中。
该数据集包含38个Landsat 8场景图像及其手动提取的像素级地面真相，用于进行云检测。
这些场景的整个图像被裁剪为多个384384个补丁，以适合于基于深度学习的语义分割算法。有用于训练的8400补丁和用于测试的9201补丁。每个贴片具有4个对应的光谱通道，分别是红色（波段4），绿色（波段3），蓝色（波段2）和近红外（波段5）。与其他计算机视觉图像不同，这些通道不会合并在一起。相反，它们位于其对应目录中。

薄云（薄雾）也被视为云（以及厚云）。
自然彩色图像是用于进一步可视化目的的伪彩色图像。在[1]和[2]的训练和测试阶段尚未使用它们。
一些补丁中没有有用的信息（0像素值）。这是因为Landsat 8图像周围的黑色空白。为方便起见，可以在数据集文件夹或此处，找到csv文件（training_patches_38-cloud_nonempty.csv）中的列表，其中包括信息性补丁的名称（信息性像素/非零像素超过80％的补丁）
training_patches_38-Cloud.csv文件存了每个patch的后缀，因此同一个patch，主要是前缀green、blue、red、nir、gt的不同

4.高分系列-GF1-WHU遥感影像云数据集

下载地址：
百度网盘-密码rbwb
Google Drive
其中包括108个GF-1宽视野（WFV）2A级场景及其参考云和云阴影遮罩。利用这些数据集对MFC算法在GF-1wfv云和云影检测中的性能进行了评价。全球分布的验证图像采集于2013年5月至2016年8月。参考遮罩是由经验丰富的用户目测后手工绘制云/云影边界得到的。
场景在中提供。焦油.gz格式，以及.tif fromat中的掩码，其中每个像素值表示：

Value	Interpretation
0	Fill
1	Clear
128	Cloud Shadow
255	Cloud

5.Sentinel-2 Cloud Mask Catalogue

数据下载

5.1.数据介绍

该数据集包含513个1022 × 1022像素子场景的云遮罩，分辨率为20米，随机采样自2018年1c级Sentinel-2存档。这个数据集的设计遵循了一些关于云遮蔽的观察

整个产品的性能是高度相关的，因此子场景比全场景提供更多的像素值，
当前的云掩蔽数据集往往集中在特定的区域，或手动选择使用的产品，这引入了数据集的偏差，不能代表真实世界的数据，
云遮罩性能似乎与表面类型和云结构高度相关，因此测试应包括与这些变量相关的失效模式分析。使用IRIS工具包对数据进行半自动注释，该工具包允许用户动态训练Random Forest(使用LightGBM实现)，通过迭代改进预测来加快注释速度，但保留了注释器在需要时进行最终手工更改的能力。这种混合方法使我们能够处理比手动更多的遮罩，我们认为这对于创建一个足够大的数据集来近似整个Sentinel-2存档的统计数据至关重要。
除了像素级3类(CLEAR, CLOUD, CLOUD_SHADOW)分割遮罩，我们还为用户提供了每个子场景的二进制分类“标签”，可以用于测试，以确定在特定情况下的性能。这些包括:
表面类型:11类
云类型:7类
相对云高度:低，高
云厚度:薄，厚
云范围:孤立，延伸
在实际应用中，云的阴影也被注释，然而这有时是不可能的，因为高地形，或大的歧义。总共有424个阴影被标记(如果存在)，89个阴影由于非常模糊的阴影边界或地形投射显著的阴影而无法标注。如果用户希望训练一个算法专门为云阴影的淹掩模，我们建议他们清除那些影子89图像是不可能的,但是,记住,这将系统地减少阴影类相比,实际使用的难度,因为这些例子包含最困难的影子。除了采样的20m的子场景和蒙版，我们还为用户提供了定义蒙版在原始Sentinel-2场景上的边界的shapefile。如果用户希望以原来的分辨率检索L1C频带，他们可以使用这些。

5.2.数据集目录编排

classification_tags.csv
csv文件包含几个对用户有帮助的参数。所有的分类标签都是非排他的，仅仅意味着给定的子场景包含了该特征的一部分。例如，被雪覆盖的山顶在较低的山谷中有森林，将被标记为森林/丛林、雪/冰和小山/山脉。类似地，同一映像中可以存在多个云类型。所有标签都是通过对图像和SURFACE TYPE的其他高分辨率图像(如BingMaps和谷歌Earth)的目视检查确定的。这种客观的分类是不可能的，我们这里所有的分类都是用主观判断来进行的。我们将每一列(分为多个大类)描述如下
- 一般信息
  - Scene:字符串，Sentinel-2产品ID。
  - difficulty:int，从1->5为标注难度的主观度量。
    - 1. 近乎完美的
    - 1. 非常好的
    - 1. 大多好
    - 1. 可能是一些小错误。
  - annotator：两个注释器中，A还是B，创建了mask /中使用的掩码(注意，alt_masks/可能包含其他注释器的掩码，如果两者都标记了该子场景)。
  - Shadows_marked: boolean，如果为0则没有阴影标记。如果1，阴影被标记在存在的地方。
  - clear_percent: float, 0 -> 100 for percentage of pixels marked clear
  - cloud_percent: float, 0 -> 100 for percentage of pixels marked cloud
  - CLOUD shadow_percent: float, 0 -> 100 for percentage of pixels marked CLOUD_SHADOW
  - dataset:字符串，表示子场景是否属于校准、主要或验证标签阶段的一部分(在“注释策略”章节中描述)
subscenes
每个子场景都是一个1022 × 1022 × 13 numpy数组，大气顶反射值作为float32数字。这些数据直接取自与它们同名的Sentinel-2 L1C产品，随机裁剪(但重新取样，直到找到一个没有任何无数据值的区域)。不在20m的波段使用双线性插值重新采样到20m。希望在原始分辨率使用波段的用户需要下载L1C产品，并使用提供的shapefile提取口罩区域。numpy数组的第三维Sentinel-2波段的顺序是按数字顺序排列的，8A波段位于8和9波段之间。根据Sentinel-2 L1C产品规范中的建议，所有值都是通过将原始L1C整数值除以10’000来检索反射率。请注意，许多值大于1，因为如果表面在一个角度接收到的光比表面在观察角度上可能的更多，表观反射率可能大于1。
masks
每个掩码都是一个1022 × 1022 × 3的numpy数组，使用布尔热编码(每个像素在最后一个维度上都有一个True值)。最后一个维度中的类顺序是:CLEAR、CLOUD、CLOUD_SHADOW。即使阴影标记不可能为一个给定的子场景，第三通道仍然包括在内。掩码使用场景的相应产品id来命名。
shapefiles
每个场景的Esri形状文件，描述所提取的子场景的多边形。如果用户需要，这些数据可以用于从Sentinel-2 L1C场景中提取原始频带数据。
thumbnails
一组下采样的png图像，显示子场景，加上它们周围的一小块区域。不用于任何处理，包含它们是为了提供一种简单的方式来浏览数据
alt_masks
对于两个注释器都进行了注释的场景(校准中10个注释器，验证中50个注释器——关于这个过程的更多细节，请参阅附录B)，其他注释器掩码提供了完整性。这可用于验证我们使用它们执行的统计测试，或作为备份掩码，如果您发现了出于任何原因希望使用的掩码。选择是随机的，所以它们和那些在面具折叠中发现的一样有效

5.3.统计数据

5.4.错误和不确定性

不幸的是，云屏蔽是一项固有的模糊任务。当被构建为一个二元分割任务时，一个注释者必须决定如何区分云和清晰，他们的定义和另一个注释者的定义之间的差异是不可避免的。我们使用我们的校准流程来确保两个注释器尽可能相似，并且我们的决定尽可能一致。然而，错误仍然存在于整个数据集。其中一些是可以估计的，而另一些是已知的，但不一定可以解释。在本节中，我们首先概述一些不容易量化的已知问题，然后，我们使用一些统计指标来量化注释者之间的协议级别。

6.CESBIO数据集(Sentinel-2)

数据下载
论文出处

6.1.数据介绍

数据集为 38 个 Sentinel-2 场景提供了参考云掩码数据集。这些参考掩模是使用ALCD工具创建的，该工具由Louis Baetens开发，在CESBIO / CNES的Olivier Hagolle的指导下。它们的创建是为了验证MAJA软件生成的云掩码.
空间分辨率为60m

6.2.数据集目录编排

说明每个场景目录的名称是相应 Sentinel-2 L1C 产品的名称。
在场景目录中，可以找到三个子目录。

“分类Classification”
“样本Samples`
“统计Statistics”

6.3.数据描述

Classification/classification_map.tif
主产品，即分类场景。有7个类型可供选择。每个都用不同的整数表示。

0：no_data。
1：未使用。
2：低云。
3：高云。
4：云影。
5：土地。
6：水。
7：雪。

Classification/confidence_enhanced.tif
增强的分类置信度图。这些值介于 0 和 255 之间（以 1 位编码）。
对于每个像素，原始置信度图是多数类的投票比例，因为分类图是通过随机森林算法创建的。
中位数过滤器已应用于此置信度图。最后，该值保存在 1 位上，导致值介于 0 和 255 之间。
Classification/contours.png
分类地图中类的等值线，叠加在场景中。颜色代码取决于每个类别。
绿色：低云和高云。黄色：云影。蓝色：水。紫色：雪。
Classification/used_parameters.json
用于对场景进行分类的参数。它包括磁贴代码、模糊和清晰的日期，以及他们的产品参考。
Samples/
此目录包含所有 shapefile，每个类一个
Statistics/k_fold_summary.json
现场10倍交叉验证的结果。
按“metrics_names”中给出的顺序计算 5 个指标。“all_metrics”是 10 个折叠的列表，每个折叠的 5 个指标按正确的顺序排列。“均值”和“stds”是 10 倍的均值和标准差。

7.GSFC(LanSat8, Sentinel2)

数据下载
论文出处
GSFC云参考数据是通过NASA戈达德航天飞行中心（GSFC）收集的（Skakun等人，2021）。该地区非常不均匀，主要土地覆盖类别为森林（约52%）和不透水表面（31%），其中有自然植被斑块和耕地（总计17%）（图3）。NASA GSFC还有一个AERONET站（Holben等人，1998年），提供气溶胶光学厚度（AOT）和水蒸汽。2017年至2019年间，使用带有鱼眼镜头的智能手机摄像头采集了地面天空图像。这些数据是在陆地卫星8号和哨兵2号天桥期间手动收集的。收集了6个陆地卫星8和28个哨兵-2场景的参考数据。目的是捕捉各种云层条件和季节变化。将卫星图像标记为云、薄云（半透明）、阴影和透明类（图3）。由于云的确切边界存在很大的不确定性，尤其是在Sentinel-2图像上，云边界内的区域被排除在参考数据之外（Skakun等人，2021）。为了便于标记过程，Sentinel-2和Landsat 8图像以各种光谱组合呈现，包括真彩色（红-绿-蓝）和假彩色（近红外-红-绿，SWIR1-近红外-红），并使用卷云带（1.38μm）。Skakun等人（2021）对GSFC数据集进行了详细描述。

8.Hollstein dataset (Sentinel-2)

数据下载
论文出处

8.1.数据介绍

“S2 Hollstein数据集”是一个人工标记的哨兵2A云光谱数据库（Hollstein等人，2016）。通过不同的光谱工具，选择像素并将其分为以下六类之一（图4）：云（不透明云）、卷云（卷云、半透明云和蒸汽轨迹）、雪（雪和冰）、阴影（来自云、卷云、山脉、建筑物等的阴影）、水（湖泊、河流、海洋）和晴空（其他剩余区域）。光谱工具包括Sentinel-2图像的假彩色合成、图像增强和光谱的图形可视化。其目的是创建具有均衡像素数的高度异构类。共有59个Sentinel-2场景和1593911个参考（标记）像素。
空间分辨率为20m

8.2.数据描述

我们的数据集总共由N = 5647725像素组成。像素信息保存在 HDF5 文件的不同表中。相对于 Sentinel-2 的空间和光谱分辨率：

band 将band位置与其标签相关联
进一步的波段描述可以在bandwidth_nm，central_wavelength_nm和spatial_sampling_m相对于类中找到：
classes （1xN 表）包括与数据集中的每个像素关联的类 ID
class_ids描述了与class_names相对于光谱“中显示的每个类相关联的 id：
spectra（13xN表）收集每个像素的光谱值。Sentinel-2仪器采样13个光谱波段。相对于图像元数据：
纬度和经度收集像素坐标
每个像素都位于一个granule_id中，其中几个颗粒对应于与product_id关联的图像。
同一产品将共享感应日期-日期-，四种不同的采样角度-sun_azimuth_angle，sun_zenith_angle，viewing_azimuth_angle，viewing_zenith_angle-和地理位置-大陆和国家。

9.Pixbox(LanSat8, Sentinel2)

PixBox的总体思想是对像素分类质量的定量评估，这是自动化算法/程序的结果。像素分类定义为为图像像素分配一定数量的属性，例如云，晴朗的天空，水，土地，内陆水，洪水，雪等。此类像素分类属性通常用于进一步指导更高级别的处理。

9.1.PixBox Sentinel-2

数据下载

9.1.1.数据介绍

PixBox-S2-CMIX数据集被用作2019年在委员会地球观测卫星（CEOS）校准与验证工作组（WGCV）内进行的第一个云掩码相互比较eXercise（CMIX）中的验证参考。PixBox-S2-CMIX像素集合在CMIX之前就已经存在，并且已经在2018年进行了。
PixBox-S2-CMIX 数据集是一个像素集合，包含从 29 个 Sentinel-2 A & B Level 1C 产品中手动收集的 17，351 个像素。数据集在空间、时间和主题上分布良好。

9.1.2.数据集目录编排

PixBox-S2-CMIX 数据集由两个主要的 ZIP 文件组成，一个保存像素集合和描述，另一个包含所有使用的 Sentinel-2 L1C 数据。数据集的结构如下：

PixBox-S2-CMIX.zip
收集的要素（CSV 文件）。
所有类别和类别的描述，包括与使用的Sentinel-2 L1C产品的链接。
哨兵-2_L1C.zip
29 个压缩的哨兵-2 级 L1C 产品[1]，用于生成数据集。

9.1.3.数据描述

pixbox_sentinel2_cmix_20180425.csv

此文件包含所有收集的 CSV 格式的像素信息。所有收集的类都存储为整数值。类别的描述和类名的整数的定义在附加描述文件中给出。

pixbox_sentinel2_cmix_20180425_description.txt

此文件提供了类别和类的清晰描述。它可用于将存储在 CSV 中的类 ID 号转换为类字符串。此外，它还将 CSV 中给出的卫星产品 ID 链接到 Sentinel-2 L1C 产品名称。

9.2.PixBox Landsat 8

数据下载

9.2.1.数据介绍

PixBox-L8-CMIX数据集被用作2019年在委员会地球观测卫星（CEOS）校准与验证工作组（WGCV）内进行的第一个云掩码相互比较eXercise（CMIX）中的验证参考。PixBox-L8-CMIX像素集合在CMIX之前就已经存在，并且已经在2015年进行了。
PixBox-L8-CMIX 数据集是一个像素集合，包含从 11 个 Landsat 8 Level 1 产品中手动收集的 18，830 个像素。数据集在时间上分布良好。在空间上，它主要集中在沿海地区，主要是在欧洲。从主题上讲，它侧重于沿海地区，但仍然代表陆地和水面。

9.2.2.数据集目录编排

PixBox-L8-CMIX 数据集由两个主要的 ZIP 文件组成，一个包含像素集合和描述，另一个包含所有使用的 Landsat 8 L1 数据。数据集的结构如下：

PixBox-L8-CMIX.zip

收集的要素（CSV 文件）。
所有类别和类的说明，包括与所使用的Landsat 8 L1产品的链接。

Landsat8_L1.zip

11 个压缩 Landsat 8 1 级产品[1]，用于生成数据集。

9.2.3.数据描述

pixbox_landsat8_cmix_20150527.csv

此文件包含所有收集的 CSV 格式的像素信息。所有收集的类都存储为整数值。类别的描述和类名的整数的定义在附加描述文件中给出。

pixbox_landsat8_cmix_20150527_description.txt

此文件提供了类别和类的清晰描述。它可用于将存储在 CSV 中的类 ID 号转换为类字符串。此外，它还将 CSV 中给出的卫星产品 ID 链接到 Sentinel-2 L1C 产品名称。11 个采用 ZIP 格式的 Landsat 8 L1 产品。

为什么会出现“与此站点的连接不安全”警告？
当浏览器弹出“与此站点的连接不安全”的红色警告时，不仅会让访客感到不安，还可能直接导致用户流失、品牌信誉受损，甚至引发数据泄露风险。作为网站运营者，如何快速解决这一问题？一、为什么会出现“与此站点的连接不安全”警告？浏览器提示“不安全连接”，本质上是检测到当前网站与用户之间的数据传输未经过加密保护。以下是触发警告的常见原因：1.未安装SSL证书SSL（SecureSocketsLayer）证书是网
Android 开源组件和第三方库汇总 gyyzzr Android Android 开源框架
转载1、github排名https://github.com/trending,github搜索：https://github.com/search2、https://github.com/wasabeef/awesome-android-ui目录UIUI卫星菜单节选器下拉刷新模糊效果HUD与Toast进度条UI其它动画网络相关响应式编程地图数据库图像浏览及处理视频音频处理测试及调试动态更新热更新
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
CentOS7环境卸载MySQL5.7 Hadoop_Liang mysql 数据库 mysql
备份重要数据切记，卸载之前先备份mysql重要的数据。备份一个数据库例如：备份名为mydatabase的数据库到backup.sql的文件中mysqldump-uroot-ppassword123mydatabase>backup.sql备份所有数据库mysqldump-uroot-ppassword123--all-databases>all_databases_backup.sql注意：-p后
php SPOF 贵哥的编程之路(热爱分享为后来者) PHP语言经典程序100题 php 开发语言
1.什么是单点故障（SPOF）？单点故障指的是系统中某个组件一旦失效，整个系统或服务就会不可用。常见的单点有：数据库、缓存、Web服务器、负载均衡、网络设备等。2.常见单点故障场景只有一台数据库服务器，宕机后所有业务不可用只有一台Redis缓存，挂掉后缓存全部失效只有一台Web服务器，挂掉后网站无法访问只有一个负载均衡节点，挂掉后流量无法分发只有一条网络链路，断开后所有服务失联3.消除单点故障的主
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
centos7安装 mysql5.7(安装包) heiPony linux mysql mariadb centos mysql
一.卸载centos7自带数据库查看系统自带的Mariadbrpm-qa|grepmariadbmariadb-libs-5.5.44-2.el7.centos.x86_64卸载rpm-e--nodepsmariadb-libs-5.5.44-2.el7.centos.x86_64删除etc目录下的my.cnfrm/etc/my.cnf二.检查mysql是否存在(有就卸载,删除相关文件)rpm-q
MySQL Explain 详解：从入门到精通，让你的 SQL 飞起来
引言：为什么Explain是SQL优化的“照妖镜”？在Java开发中，我们常常会遇到数据库性能瓶颈的问题。一条看似简单的SQL语句，在数据量增长到一定规模后，可能会从毫秒级响应变成秒级甚至分钟级响应，直接拖慢整个应用的性能。此时，你是否曾困惑于：为什么这条SQL突然变慢了？索引明明建了，为什么没生效？到底是哪里出了问题？答案就藏在MySQL的EXPLAIN命令里。EXPLAIN就像一面“照妖镜”，
OpenWebUI(12)源码学习-后端constants.py常量定义文件青苔猿猿 AI大模型 openwebui constants常量定义
目录文件名：`constants.py`功能概述：主要功能点详解1.**MESSAGES枚举类**2.**WEBHOOK_MESSAGES枚举类**3.**ERROR_MESSAGES枚举类**✅默认错误模板✅认证与用户相关错误✅资源冲突与重复错误✅验证失败类错误✅权限限制类错误✅文件上传与格式错误✅模型与API错误✅请求频率与安全限制✅数据库与配置错误4.**TASKS枚举类**✅总结实际应用场
【目标检测】机场内部目标检测数据集4106张YOLO+VOC格式
数据集格式：VOC格式+YOLO格式压缩包内含：3个文件夹，分别存储图片、xml、txt文件JPEGImages文件夹中jpg图片总计：4106Annotations文件夹中xml文件总计：4106labels文件夹中txt文件总计：4106标签种类数：7标签名称:["Ground_vehicles","Horizontal_sign","Runaway_limit","Taxiway","Ver
[特殊字符] 实时数据洪流突围战：Flink+Paimon实现毫秒级分析的架构革命（附压测报告）——日均百亿级数据处理成本降低60%的工业级方案 Lucas55555555 flink 大数据
引言：流批一体的时代拐点据阿里云2025白皮书显示，实时数据处理需求年增速达240%，但传统Lambda架构资源消耗占比超运维成本的70%。某电商平台借助Flink+Paimon重构实时数仓后，端到端延迟从分钟级压缩至800ms，计算资源节省5.6万核/月。技术红利窗口期：2025年ApachePaimon1.0正式发布，支持秒级快照与湖仓一体，成为替代Iceberg的新范式一、痛点深挖：实时数仓
传统检测响应慢？陌讯多模态引擎提速90+FPS实战 2501_92473147 算法计算机视觉目标检测
开篇痛点：实时目标检测在安防监控中的核心挑战在安防监控领域，实时目标检测是保障公共安全的关键技术。然而，传统算法如YOLOv5或开源框架MMDetection常面临两大痛点：误报率高（复杂光照或遮挡场景下检测不稳定）和响应延迟（高分辨率视频流处理FPS低于30）。实测数据显示，城市交通监控系统误报率达15%，导致安保资源浪费；客户反馈表明，延迟超100ms时，目标跟踪可能失效。这些问题源于算法泛化
Omics精进03|一文彻底搞明白Germline Mutation和Somatic Mutation qq_21478261 #生物信息生物学生物信息学
胚系突变（GermlineMutation）和体细胞突变（SomaticMutation）在WES、WGS、GenePanel检测时常常遇到，二者最大的区别是胚系突变可以遗传给后代，而体细胞突变不能够遗传给后代。本文将从形成原因、遗传性、功能、发生时期、变异检测几个方面介绍二者的区别。上图，直观理解二者区别形成原因Germlinemutations主要是由于生殖细胞（germcells）突变导致，
系统迁移从CentOS7.9到Rocky8.9
我有两台阿里云上的服务器是CentOS7.9，由于CentOS7已经停止支持，后续使用的话会有安全漏洞，所以需要尽快迁移，个人使用的话目前兼容性好的还是RockyLinux8，很多脚本改改就能用了。一、盘点系统和迁移应用查看当前系统发行版版本cat/etc/os-release盘点迁移清单服务器应用部署方式docker镜像来源v1wordpressdockerdockerhubv1zdirdock
自动化运维工程师面试题解析【真题】
ZabbixAgent默认监听的端口是A.10050。以下是关键分析：选项排除：C.80是HTTP默认端口，与ZabbixAgent无关。D.5432是PostgreSQL数据库的默认端口，不涉及ZabbixAgent。B.10051是ZabbixServer的默认监听端口，用于接收Agent发送的数据，而非Agent自身的监听端口。ZabbixAgent的配置：根据官方文档，ZabbixAgen
什么是OA系统？使用OA系统对企业有哪些好处？
OA系统（OfficeAutomationSystem），即办公自动化系统，是将现代化办公和计算机网络功能结合起来的一种新型的办公方式。是现代企业管理中一种重要的信息化工具，它通过计算机技术、网络技术和数据库技术等手段，实现企业内部办公流程的自动化和信息化管理。使企业的信息交流更加顺畅，办公流程更加高效，从而提高企业的运营效率和管理水平。一、主要功能1.文档管理文档存储与检索：OA系统可以集中存储
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
Flutter——数据库Drift开发详细教程(七) 怀君 flutter flutter 数据库
目录入门设置漂移文件入门变量数组定义表支持的列类型漂移特有的功能导入嵌套结果LIST子查询Dart互操作SQL中的Dart组件类型转换器现有的行类Dart文档注释结果类名称支持的语句自定义SQL类型定义类型使用自定义类型在Dart中在SQL中方言意识支持的SQLite扩展json1fts5地缘垄断自定义查询带有生成的api的语句自定义选择语句自定义更新语句入门Drift提供了一个dart_api来
android中百度定位、城市选择列表，右侧字母展示
好久好久没光顾过自己空空的博客了，做项目的时候都是逛着别人的博客急着把功能实现，近来闲下来了总结总结。这个城市选择功能也是当时做项目急着实现从哪找来的框架不记得了，然后改改用到项目中来的。非常感谢提供最初源码的博主，主要的区别是添加了搜索功能、定位功能，把以前的操作本地数据库sqlite的部分，改为操作对assest文件的操作，封装的有百度地图定位方法、可删除的edittext。百度地图的key需
.NET 一款基于BGInfo的红队内网渗透工具 dot.Net安全矩阵网络 .net 安全 .netcore web安全矩阵
01阅读须知此文所提供的信息只为网络安全人员对自己所负责的网站、服务器等（包括但不限于）进行检测或维护参考，未经授权请勿利用文章中的技术资料对任何计算机系统进行入侵操作。利用此文所提供的信息而造成的直接或间接后果和损失，均由使用者本人负责。本文所提供的工具仅用于学习，禁止用于其他方面02基本介绍在内网渗透过程中，白名单绕过是红队常见的技术需求。Sharp4Bginfo.exe是一款基于微软签名工具
JVM与Spring Boot核心解析 AIHacksCash Java场景面试宝典 Java JVM Spring Boot
我是廖志伟，一名Java开发工程师、《Java项目实战——深入理解大型互联网企业通用技术》（基础篇）、（进阶篇）、（架构篇）清华大学出版社签约作家、Java领域优质创作者、CSDN博客专家、阿里云专家博主、51CTO专家博主、产品软文专业写手、技术文章评审老师、技术类问卷调查设计师、幕后大佬社区创始人、开源项目贡献者。拥有多年一线研发和团队管理经验，研究过主流框架的底层源码(Spring、Spri
Flutter——数据库Drift开发详细教程之迁移(九) 怀君 flutter flutter 数据库
迁移入门引导式迁移配置用法例子切换到make-migrations开发过程中手动迁移迁移后回调导出模式导出架构下一步是什么？调试导出架构的问题修复这个问题架构迁移助手自定义分步迁移转向逐步迁移手动生成测试迁移编写测试验证数据完整性在运行时验证数据库模式迁移器API一般提示迁移视图、触发器和索引复杂的迁移更改列的类型更改列约束删除列重命名列合并列添加新列入门Drift通过严格的架构确保查询类型安全。
2025年渗透测试面试题总结-2025年HW(护网面试) 43（题目+回答）独行soc 2025年护网面试职场和发展 linux 科技渗透测试安全护网
安全领域各种资源，学习文档，以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各种好玩的项目及好用的工具，欢迎关注。目录2025年HW(护网面试)431.自我介绍与职业规划2.Webshell源码级检测方案3.2025年新型Web漏洞TOP54.渗透中的高价值攻击点5.智能Fuzz平台架构设计6.堆栈溢出攻防演进7.插桩技术实战应用8.二进制安全能力矩阵9.C语言内存管理精要10.Pyth
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
《Python星球日记》第35天：全栈开发（综合项目） Code_流苏 Python星球日记编程项目实战 Python全栈开发 Django Flask 后端开发博客系统
名人说：路漫漫其修远兮，吾将上下而求索。——屈原《离骚》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）专栏：《Python星球日记》，限时特价订阅中ing目录一、全栈开发概述1.全栈开发的优势2.全栈开发技能组合二、博客系统项目需求分析1.功能需求2.技术栈选择3.项目结构规划三、数据库设计1.实体关系分析2.Django模型设计四、后端开发1.Django项目创建2.视图
【Freertos实战】零基础制作基于stm32的物联网温湿度检测(教程非常简易)持续更新中......... 熬夜的猪仔 stm32 物联网嵌入式硬件
本次记录采用Freertos的第二个DIY作品，基于Onenet的物联网温湿度检测系统，此次代码依然是全部开源。通过网盘分享的文件：物联网温湿度检测.rar链接:https://pan.baidu.com/s/1uj9UURVtGE6ZB6OsL2W8lw?pwd=qm2e提取码:qm2e大家也可以看看我上个的开源项目【Freertos实战】零基础制作基于stm32智能小车(教程非常简易)实物演示
ETL可视化工具 DataX -- 简介( 一) dazhong2012 软件工具数据仓库 datax ETL
引言DataX系列文章：ETL可视化工具DataX–安装部署(二)ETL可视化工具DataX–DataX-Web安装(三)1.1DataX1.1.1DataX概览DataX是阿里云DataWorks数据集成的开源版本，在阿里巴巴集团内被广泛使用的离线数据同步工具/平台。DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、
Spring 声明式事务：从原理到实现的完整解析 Code季风 Spring详解 spring 数据库后端开发语言 java spring boot
在后端开发中，事务管理是保证数据一致性的核心机制。尤其是在复杂业务场景下，一个操作可能涉及多步数据库操作，任何一步失败都需要回滚到初始状态。Spring的声明式事务通过AOP思想，将事务管理从业务逻辑中剥离，让开发者更专注于核心业务。本文将结合实际实现，详解声明式事务的核心机制和设计思路。一、为什么需要声明式事务？在讨论实现之前，我们先明确一个问题：为什么要用声明式事务，而不是手动编写事务代码？假
【Android】安卓四大组件之内容提供者（ContentProvider）：从基础到进阶 m0_59734531 Android android Java ContentProvider 安卓四大组件
你手机里的通讯录，存储了所有联系人的信息。如果你想把这些联系人信息分享给其他App，就可以通过ContentProvider来实现。。一、什么是ContentProvider‌ContentProvider‌是Android四大组件之一，负责实现‌跨应用程序的数据共享与访问‌，通过统一接口封装数据存储细节，提供标准化操作方式。其中主要功能包括：数据抽象层：将应用内部的数据（如SQLite数据库、文
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

遥感影像云检测-云检测数据集信息及下载

常用云检测数据集信息及下载

1.LandSat7云量评估数据集

2.LandSat8-Biome生物群落云量评估数据集

3.LandSat8-38Cloud数据集

4.高分系列-GF1-WHU遥感影像云数据集

5.Sentinel-2 Cloud Mask Catalogue

5.1.数据介绍

5.2.数据集目录编排

5.3.统计数据

5.4.错误和不确定性

6.CESBIO数据集(Sentinel-2)

6.1.数据介绍

6.2.数据集目录编排

6.3.数据描述

7.GSFC(LanSat8, Sentinel2)

8.Hollstein dataset (Sentinel-2)

8.1.数据介绍

8.2.数据描述

9.Pixbox(LanSat8, Sentinel2)

9.1.PixBox Sentinel-2

9.1.1.数据介绍

9.1.2.数据集目录编排

9.1.3.数据描述

9.2.PixBox Landsat 8

9.2.1.数据介绍

9.2.2.数据集目录编排

9.2.3.数据描述

你可能感兴趣的:(遥感影像云检测,遥感,数据库)