qq_42894217

一个全自动病理处理分析工具——CLAM

文章目录

1. 简介
2. 环境配置
- 2.1 环境创建
- 2.2 安装依赖
- 2.3 安装预训练编码器
3. 数据集准备
4. 数据处理
- 4.1 全自动数据预处理
- 4.2 半自动数据预处理
- - step1：设置分割参数
  - step2：执行预分割
  - step3：调整分割参数
  - step4：批量分割
5. 特征提取
6. 模型训练
- 6.1 数据集划分
- 6.2 模型训练
- 6.3 模型验证
- 6.4 热图可视化

1. 简介

CLAM是一种基于深度学习的数据高效、弱监督的全幻灯片（WSI）级的全自动分析工具，是一种高通量且可解释的方法，使用WSI级标签对整个WSI图像进行数据高效分类，可自动识别WSI中的组织区域，并提取patch坐标，并自动提取patch级别的特征，但并不真正对patch进行提取和保存，减少计算资源的消耗和内存的占用，可在无需进行ROI标注或者patch级别标签的情况下，基于注意力机制和多示例学习自动识别具有高诊断价值的patch，进而实现整个WSI的实例级别分类。

2. 环境配置

2.1 环境创建

创建环境

conda create -n clam python==3.10

添加清华镜像

conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

2.2 安装依赖

安装必要的库

conda install openslide

pip install timm==0.9.8 torch torchvision h5py pandas PyYAML opencv-python matplotlib scikit-learn scipy tqdm openslide-python tensorboardX

pip install git+https://github.com/oval-group/smooth-topk.git

2.3 安装预训练编码器

安装UNI

git clone https://github.com/mahmoodlab/UNI.git
cd UNI
pip install -e .

安装CONCH

git clone https://github.com/mahmoodlab/CONCH.git
cd CONCH
pip install -e .

下载模型权重

从 Huggingface 模型页面请求访问模型权重：

https://huggingface.co/Mahmoodlab/UNI
https://huggingface.co/MahmoodLab/CONCH

克隆repo并cd进入目录

git clone https://github.com/mahmoodlab/CLAM.git

cd CLAM

3. 数据集准备

CLAM可以处理多种标准格式的WSI影像（.svs、.ndpi、.tiff 等），要求WSI存放在同一个路径（DATA_DIRECTORY）下。

DATA_DIRECTORY/
	├── slide_1.svs
	├── slide_2.svs
	└── ...

4. 数据处理

4.1 全自动数据预处理

python create_patches_fp.py --source DATA_DIRECTORY --save_dir RESULTS_DIRECTORY  --seg --patch --stitch

其中参数含义如下：

source：包含原始WSI文件的文件夹地址
save_dir：预处理后数据保存的地址
seg：一个标志，如果设置，保存组织分割mask的缩略图
patch：一个标志，如果设置，执行patch切分，保存ROI内patch 的坐标
stitch：一个标志，如果设置，生成图像拼接操作（将patch还原到原始WSI尺寸上，其余部分为黑色背景）

除此之外，还可以设置一些可选参数：

step_size：在WSI上切分patch的步长，默认值256
patch_size：patch切分的尺寸，默认值256
no_auto_skip: 一个标志，用于控制是否自动跳过已经处理过的图像，默认为True，即不自动跳过
preset: 指定一个预定义的分割和过滤参数配置文件的路径（CSV格式），这些参数用于分割、过滤等步骤，默认为空
patch_level: 指定生成图像块时使用的下采样级别，默认为0，即在原始尺寸裁剪
process_list: 指定一个包含要处理的图像列表及其参数的CSV文件的路径，可以为每张WSI指定不同的参数，与preset不同，是为了进行个性化处理，默认为空

上述命令将使用默认参数对 DATA_DIRECTORY 中的每个WSI进行分割，提取分割组织区域内的所有patch，使用提取的patch为每个WSI创建拼接重建（可选），并在指定的 RESULTS_DIRECTORY 中生成以下文件夹结构：

RESULTS_DIRECTORY/
	├── masks
    		├── slide_1.png
    		├── slide_2.png
    		└── ...
	├── patches
    		├── slide_1.h5
    		├── slide_2.h5
    		└── ...
	├── stitches
    		├── slide_1.png
    		├── slide_2.png
    		└── ...
	└── process_list_autogen.csv

其中：

masks 文件夹包含组织的分割结果（每张WSI对应一张）
patches 文件夹包含从每张WSI中提取的patch数组（每张WSI一个 .h5文件，其中每个条目对应于patch左上角的坐标）
stitches 文件夹包含缝合patch的下采样可视化（每张WSI一张图像）（可选，不用于下游任务）
process_list_autogen.csv 是自动生成的参数文件，包含所有已处理的WSI的列表，以及它们使用的参数。

4.2 半自动数据预处理

为了确保高质量分割和提取相关组织patch，用户可以自行设置分割参数，选择执行预分割（通常每张WSI约 1 秒），检查分割结果并根据需要调整选定WSI的参数，如此反复，直至能有效分割组织区域，然后使用自定义的分割参数提取patch。具体步骤如下：

step1：设置分割参数

python build_preset.py --preset_name CSV_FILE_NAME

上述命令用来创建一个预设配置文件，该文件包含了图像分割和处理参数，可以设置的各个参数的详细解释和默认值如下：

presets_name 保存分割参数的文件名称，.csv格式，保存在/presets文件夹下
seg_level 用于分割操作的图像金字塔级别，默认值：-1（表示自动选择最适合的级别，使用 WSI 中最接近 64 倍下采样的下采样）
sthresh 分割阈值，用于确定哪些区域被认为是组织（使用较高的阈值会导致前景检测较少，背景检测较多），默认值：8（正整数）
mthresh 中值滤波器大小，用于微调组织分割，默认值：7（正数，奇数整数）
close 用于在分割后处理中进行形态学闭操作的核大小，默认值：4（正整数或-1）
use_otsu 是否使用Otsu算法自动计算分割阈值，默认值：False（表示使用简单二进制阈值）
keep_ids / exclude_ids 在生成mask过程中保留或排除特定的WSI，默认值：none
a_t 过滤参数，用于确定保留的最小ROI大小，默认值：100（表示处理检测到面积大于100512512大小的组织）
a_h 过滤参数，用于确定识别的孔洞的最大面积，默认值：16（表示处理检测到面积大于16512512大小的孔洞）
max_n_holes 过滤参数，每个前景轮廓需要考虑的最大孔洞数量，默认值：8（正整数，最大值越高，修补越准确，但计算成本也越高）
vis_level 用于分割结果可视化的图像金字塔级别，默认值：-1（使用最接近 64 倍下采样的 WSI 中的下采样）
line_thickness 绘制分割结果的线条粗细，默认值：500
white_thresh 参数设置一个饱和度阈值，用于决定是否将某个patch视为空白并排除，这有助于排除几乎没有信息的patch，默认值为5
black_thresh 参数设置一个平均RGB阈值，用于决定是否将某个patch视为黑色并排除，这有助于过滤掉可能不包含有用信息的黑色patch默认值为50
use_padding 在切patch操作中是否使用padding以保持边缘patch大小符合要求，默认值：True
contour_fn 判断怎样将patch视为前景，默认值：‘four_pt’（“four_pt”：检查patch中心周围的小网格中的所有四个点是否都在轮廓内，“center” ：检查patch的中心是否在轮廓内，“basic” - 检查patch的左上角是否在轮廓内）
patch_leve 用于提取patch的图像金字塔级别，默认值：0

step2：执行预分割

在完成分割参数设置之后，可以依据上一步保存的参数文件进行预分割，命令如下：

python create_patches_fp.py --source DATA_DIRECTORY --save_dir RESULTS_DIRECTORY --seg --presets /presets/CSV_FILE_NAME

或者，使用默认参数对 DATA_DIRECTORY 中的每个WSI进行组织识别，命令如下：

python create_patches_fp.py --source DATA_DIRECTORY --save_dir RESULTS_DIRECTORY --seg

上述命令将在mask文件夹下缩略图，并生成 process_list_autogen.csv 文件，但暂时不会进行修补（patches和stitches文件夹将为空）。

step3：调整分割参数

在RESULTS_DIRECTORY/masks文件夹下查看预分割缩略图，可以针对效果不好的特定WSI调整参数配置文件，在调整分割参数之前，用户应复制 csv 文件并为其指定一个新名称（例如 process_list_edited.csv），否则下次运行命令时会覆盖此具有默认名称的文件。然后，用户可以选择通过更改 csv 文件中的相应字段来调整特定WSI的参数，并通过 --process_list CSV_FILE_NAME 传递。

python create_patches_fp.py --source DATA_DIRECTORY --save_dir RESULTS_DIRECTORY --seg --process_list CSV_FILE_NAME

其中，process 列存储一个二进制变量（0 或 1），用于指示脚本是否应处理特定WSI，以便用户处理并观察少数几个WSI来快速确认调整后的参数是否产生令人满意的结果。

step4：批量分割

当对所有的预分割结果满意时，用户应该将所有需要处理的WSI的process列设为 1，并保存 csv格式的CSV_FILE_NAME文件，然后使用保存的 csv 文件运行create_patches_fp.py（就像在全自动预处理的运行demo中一样），具体代码如下：

python create_patches_fp.py --source DATA_DIRECTORY --save_dir RESULTS_DIRECTORY --seg --process_list CSV_FILE_NAME --patch --stitch

运行之后会分别在RESULTS_DIRECTORY/patches和RESULTS_DIRECTORY/patches路径下生成包含patch左上角坐标的.h5文件和缝合patch的.jpg可视化结果。

5. 特征提取

特征提取需要运行extract_features_fp.py脚本，可以使用命令行调用

CUDA_VISIBLE_DEVICES=0 python extract_features_fp.py --data_h5_dir DIR_TO_COORDS --data_slide_dir DATA_DIRECTORY --csv_path CSV_FILE_NAME --feat_dir FEATURES_DIRECTORY --batch_size 512 --slide_ext .svs

上述命令会读取存储在DIR_TO_COORDS下的 .h5 格式的patch坐标文件，批处理大小由 batch_size 参数传入，从原始WSI的每个patch中提取预训练特征，默认使用预训练的resnet50网络，特征维度为1024，如果使用UNI和CONCH作为预训练编码器提取特征，需要提前指定模型目录所在的环境变量，并设置model_name为uni_v1或者conch_v1，UNI的特征维度为10024，CONCH的特征维度为512，环境变量设置方法如下：

export CONCH_CKPT_PATH=checkpoints/conch/pytorch_model.bin
export UNI_CKPT_PATH=checkpoints/uni/pytorch_model.bin

命令执行后将生成以下文件夹结构：

FEATURES_DIRECTORY/
    ├── h5_files
            ├── slide_1.h5
            ├── slide_2.h5
            └── ...
    └── pt_files
            ├── slide_1.pt
            ├── slide_2.pt
            └── ...

其中每个 .h5 文件包含提取的特征数组及其patch坐标（请注意，为了加快训练速度，还会为每张WSI创建一个 .pt 文件，其中仅包含patch的特征），提取命令的其他超参数如下：

data_h5_dir 数据集的HDF5文件目录，用于指定存储图像patches的HDF5文件的位置，默认值：None（必须由用户指定）
data_slide_dir WSI图像文件的目录，用于指定WSI文件的存储位置，默认值：None（必须由用户指定）
slide_extWSI文件的扩展名，默认值：.svs（常见的WSI格式之一）
csv_pathcsv 文件应包含要处理的WSI文件名列表（不带文件扩展名）（可以指定上一个自动生成的 csv 文件，然后删除文件扩展名）
feat_dir 特征保存目录，用于指定提取的特征保存的位置，默认值：None（必须由用户指定）
model_name 用于特征提取的预训练模型，默认值：resnet50_trunc，可选值包括 resnet50_trunc、 uni_v1、 conch_v1
batch_size 批处理大小，默认值：256
no_auto_skip 是否自动跳过已处理的WSI，默认值：False（如果指定此选项，则不会自动跳过）
target_patch_size 目标patch大小，用于指定提取的patch的大小，默认值：224

6. 模型训练

6.1 数据集划分

为了评估算法的性能，可以使用多倍（例如 10 倍）训练、验证、测试划分（80:10:10）。可以使用 create_splits_seq.py 脚本自动生成这些分割，只需进行少量修改，就像使用main.py一样。例如，可以通过调用以下命令创建是否有肿瘤的分类：

python create_splits_seq.py --task task_1_tumor_vs_normal --seed 1 --k 10

其中，可传入参数如下：

label_frac: 用于指定数据集中使用的标签比例，默认值为1.0，表示使用全部标签
seed: 随机种子，用于确保数据分割的可重复性，默认值为1
k: 分割的数量，即进行k折交叉验证时的k值，默认值为10
task: 任务类型，有两个选项：task_1_tumor_vs_normal和task_2_tumor_subtyping，分别对应肿瘤与正常组织的分类任务和肿瘤亚型的分类任务
val_frac: 用于设置验证集的标签比例，默认值为0.1
test_frac: 用于设置测试集的标签比例，默认值为0.1。

目前只支持良恶性鉴别（task_1_tumor_vs_normal，二分类）和肿瘤亚型鉴别（task_2_tumor_subtyping，三分类）两种任务，如果需要自定义进行其他任务，需要按照Generic_WSI_Classification_Dataset类要求的数据格式自行编写python脚本配置，有关详细信息，请参阅datasets/dataset_generic.py中的数据集定义。数据集的划分结果会按照要求保存在splits文件夹下，具体格式如下：

splits/
    ├── {task_name}_{label_frac}
            ├── splits_0.csv
            ├── splits_0_bool.csv
            ├── splits_0_descriptor.csv
            ├── ...
            ├── splits_9.csv
            ├── splits_9_bool.csv
            └── splits_9_descriptor.csv
    ├── ...    
    ├── ...
    └── {task_name}_{label_frac}
            ├── splits_0.csv
            ├── splits_0_bool.csv
            ├── splits_0_descriptor.csv
            ├── ...
            ├── splits_9.csv
            ├── splits_9_bool.csv
            └── splits_9_descriptor.csv

6.2 模型训练

划分好数据集之后，只需要一行代码即可开始训练。

CUDA_VISIBLE_DEVICES=0 python main.py --drop_out 0.25 --early_stopping --lr 2e-4 --k 10 --exp_code task_1_tumor_vs_normal_CLAM_50 --weighted_sample --bag_loss ce --inst_loss svm --task task_1_tumor_vs_normal --model_type clam_sb --log_data --data_root_dir DATA_ROOT_DIR --embed_dim 1024

注意：--embed_dim为输入特征的维度，默认值为1024，而对于 CONCH提取的预训练特征，应设置为 512。其余具体参数如下：

data_root_dir: 数据根目录，没有默认值，用户必须指定
max_epochs: 训练的最大轮数，默认值为200
lr: 学习率，默认值为0.0001
label_frac: 训练标签的比例，默认值为1.0，表示使用全部标签
reg: 权重衰减，默认值为1e-5
seed: 随机种子，默认值为1，用于实验的可重复性
k: 折数，默认值为10，用于k折交叉验证
k_start: 开始的折数，默认值为-1，表示从第一折开始
k_end: 结束的折数，默认值为-1，表示到最后一折结束
results_dir: 结果保存目录，默认值为./results
split_dir: 数据集划分目录，默认值为None，用户可以手动指定使用的划分数据集
log_data: 是否使用tensorboard记录数据，默认为False
testing: 调试工具，默认为False
early_stopping: 是否启用早停，默认为False
opt: 优化器，默认为Adam
drop_out: Dropout值，默认值为0.25
bag_loss: 包级别的损失函数，svm（支持向量机损失）和 ce（交叉熵损失，默认值）中二选一
model_type: 模型类型，可选：clam_sb（单分支注意力MIL，默认值）、 clam_mb（多分支注意力MIL）、mil（普通MIL）
exp_code: 结果文件保存的地址，没有默认值，用户必须指定
weighted_sample: 是否启用加权采样，默认为False
model_size: 模型大小，可选'small'（默认值）或者'big'，默认为small
task: 任务类型，没有默认值，用户必须从task_1_tumor_vs_normal和task_2_tumor_subtyping中选择
no_inst_cluster: 是否禁用实例级聚类，使用后会提升模型的泛化性能，默认为False
inst_loss: 实例级聚类的损失函数，默认值为None
subtyping: 是否为肿瘤亚型分类问题，默认为False，但是如果模型选择了clam_sb或者 clam_mb，则必须设置为True
bag_weight: 包级别损失的权重系数，当no_inst_cluster为False时启用，默认值为0.7
B: 对于clam_sb和 clam_mb模型，每次从包中采样的数量，正负样本采样的数量，较小的值可能导致模型无法充分学习包内所有实例的信息，而较大的值则可能增加计算成本并导致过拟合，默认值为8

而对于不属于task_1_tumor_vs_normal和task_2_tumor_subtyping的其他任务，则需要按照main.py的形式自定义训练函数。

6.3 模型验证

用户还可以选择使用评估脚本来测试已训练模型的性能。下面提供了与上述训练模型相对应的示例：

CUDA_VISIBLE_DEVICES=0 python eval.py --k 10 --models_exp_code task_1_tumor_vs_normal_CLAM_50_s1 --save_exp_code task_1_tumor_vs_normal_CLAM_50_s1_cv --task task_1_tumor_vs_normal --model_type clam_sb --results_dir results --data_root_dir DATA_ROOT_DIR --embed_dim 1024

其中大多数参数与main.py中一致，不同的参数如下：

save_exp_code ：用于指定保存评估结果的实验代码
models_exp_code ：用于指定加载训练好的模型的实验代码
micro_average ：用于设置多类别分类任务中评价指标的平均方法。当设置为True时，使用micro-average（不平衡数据集）

6.4 热图可视化

CLAM还可以批量进行热图可视化，填写配置文件并存储在/heatmaps/configs中，然后使用 --config NAME_OF_CONFIG_FILE 标志运行create_heatmaps.py，代码如下：

CUDA_VISIBLE_DEVICES=0 python create_heatmaps.py --config config_template.yaml

具体参数如下：

save_exp_code：保存热图生成的结果。默认值为 None
overlap：生成热图生成时，补丁之间的重叠比例。默认值为 None
config_file：配置文件的路径，该文件包含热图生成过程中所有必要的参数和设置。默认值为 “heatmap_config_template.yaml”

你可能感兴趣的:(病理图像分析,python,计算机视觉,深度学习,分类)

提升异地网络性能的全面指南：QoS策略、CDN加速与WAN优化技术北极光SD-WAN组网网络
一、网络延迟与带宽优化：QoS策略与带宽聚合技术1.1QoS（服务质量）策略的核心功能QoS（QualityofService）是网络性能优化的核心技术，通过对网络流量进行分类和优先级分配，确保关键业务（如视频会议、语音通话）的低延迟和高可靠性。关键策略包括：流量分类与优先级分配：通过策略规则对不同种类的流量进行标记，将高优先级分配给实时性要求高的业务。拥塞管理：利用队列技术如CBWFQ（基于类的
Django ORM 1. 创建模型（Model）博观而约取 Python django 数据库 python
1.ORM介绍什么是ORM？ORM，全称Object-RelationalMapping（对象关系映射），一种通过对象操作数据库的技术。它的核心思想是：我们不直接写SQL，而是用Python对象（类/实例）来操作数据库表和记录。ORM就像一个“翻译官”，帮我们把Python代码翻译成数据库能听懂的SQL命令。为什么使用ORM?Django中的ORM提供了一个高层次、抽象化的接口来操作数据库，它的优
JAVA基础--异常 wzdashuaibi java 开发语言 jvm
一、异常分类基类：Throwable，Error和Exception继承Throwable一、运行时异常1.RuntimeException2.NullPointerException3.ClassCastException4.ArrayIndexOutOfBoundsException如果不对这些异常进行处理，那么默认遇到这些异常就会终止程序二、已检查异常1.Exception2.FileNot
操作系统基本概念与进程管理：从入门到精通阿贾克斯的黎明软考软考
目录操作系统基本概念与进程管理：从入门到精通一、常见操作系统与计算机系统层次结构二、操作系统的概念、功能与特征三、操作系统的发展与分类四、进程管理（一）进程的状态与状态转换（二）前驱图（三）进程同步与互斥机制（四）信号量机制与PV操作（五）PV操作实现前驱关系（六）死锁（七）银行家算法在计算机的世界里，操作系统就像是一位幕后的“大管家”，默默管理着计算机的各种资源，协调着各种程序的运行。今天，咱们
鸿蒙线程池全揭秘：让你的应用快、稳、省资源 harmonyos
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
Java-内部类 Lowjin_ java 开发语言
一、内部类的基本概念1.什么是内部类内部类（InnerClass）是定义在另一个类内部的类。它可以访问外部类的所有成员，包括私有成员。2.内部类的分类成员内部类（MemberInnerClass）静态内部类（StaticNestedClass）局部内部类（LocalInnerClass）匿名内部类（AnonymousInnerClass）二、成员内部类1.定义方式classOuter{privat
Python中np.vstack和np.hstack的应用解释
Python中np.vstack和np.hstack的应用解释用法说明对于np.vstack和np.hstack各自有两种用法•第1种：np.vstack((a,b))或np.hstack((a,b))，即常规用法，也就是两个维数相等的ndarray在对应的方向上进行合并•第2种：np.vstack(a)或np.hstack(a)，对一个ndarray在其内部对应的方向上进行合并，这种属于非常规用
python np.hstack gz153016 python语法总结
importnumpyasnparr1=np.array([1,2,3])arr2=np.array([4,5,6])#print('np.vstack((arr1,arr2)):',np.vstack((arr1,arr2)))print('np.hstack((arr1,arr2)):',np.hstack((arr1,arr2)))#np.hstack((arr1,arr2)):[12345
Python个人学习基础笔记-3.爬虫（1）孜宸润泽 python 学习笔记
一.爬虫的定义爬虫（crawler/spider）是模拟浏览器行为，按照编写规则，自动接收网页信息的工具。通常而言爬虫首先从初始URL集选择URL，向目标网页发起请求，获取网页的HTML源码，然后将获取的数据进行解析过滤，保存我们所需要的标题、内容等，最后提取新的URL加入待爬序列。爬虫常见所需要的库包括Request库、BeautifulSoup4库、Scrapy库和Selenium库等。二.R
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
Python开发AI智能体(三)———Langchain定义提示词模板【本人】 Agent智能体 python 人工智能 langchain 语言模型
前言上篇文章给大家介绍AI项目检测平台LangSmish以及开源框架Langchain的使用，并且带领大家编写了一个案例。这篇文章将介绍在Langchain框架中如何定义提示词模板一、什么是提示词模板？提示词模板（PromptTemplate）是大语言模型（LLM）应用开发中的核心概念，本质是预定义的提示结构框架。它通过将静态文本与动态变量结合，实现标准化、可复用的提示生成机制。它提示词可以是一个
python：pydub模块 face丶第三方模块音频 pydub
一、安装1、安装模块pipinstallpydub2、安装插件云盘中下载文件ffmpeg打开电脑上的控制面板-系统-高级系统设置-环境变量然后双击path,看到如下的界面：然后点新建会出现一个新建的地址栏，你需要在这个新建地址栏里输入一个文件地址：打开你下载的ffmpeg文件中的bin文件，你应该可以看到一个这样的界面，把这个界面中地址栏中的地址复制粘贴到上面图片新建的地址栏中，然后点确定，来保存
投标文件制作中多级标题自动设置 ℃-柠檬职场和发展其他
针对大型项目的投标文件制作，标书中可能会涉及到很多的内容，需要做标题分级和分类，格式调整需要耗费大量的时间和精力，近期由于投标工作需要，自己整理了一稿标书制作过程中的多级标题的自动设置及格式调整的方法，分享给需要的朋友。样式表我同步上传到我自己的博客资源中了，有需要的朋友可以直接下载使用。（PS：我自己用的是2013版的Office）一、定义新的多级列表新建一个空白Word文档，在“开始”中找到列
将Python Tkinter程序转换为手机可运行的Web应用 - 详细教程随机森林404 python 智能手机前端
前言作为一名Python开发者，你可能已经使用Tkinter创建了一些桌面GUI应用。但是如何让这些应用也能在手机上运行呢？本教程将详细介绍如何将基于Tkinter的Python程序转换为手机可访问的Web应用，让你的应用随时随地可用！一、为什么需要转换？Tkinter是Python的标准GUI库，但它主要针对桌面环境。移动设备(Android/iOS)上无法直接运行Tkinter程序，主要原因有
TS中的泛型（学习笔记）小码龙~ TS 学习笔记前端 typescript
文章目录前言一、泛型是什么？二、泛型的分类三、泛型的基本使用3.1函数中的泛型使用3.2接口中的泛型使用(运用广泛)3.2类型别名中的泛型使用(运用广泛)3.2类中的泛型使用总结前言泛型的基本使用一、泛型是什么？泛型（Generics）是指在定义函数、接⼝或类的时候，不预先指定具体的类型，⽽在使⽤的时候再指定类型的⼀种特性，简单来说泛型其实就是类型参数，在定义的时候定义形参(类型变量)，使⽤的时候
如何使用 langchain 与 openAI 连接海乐学习 langchain python langchain python
上一篇写了如何安装langchainhttps://www.cnblogs.com/hailexuexi/p/18087602这里主要说一个langchain的使用创建一个目录langchain，在这个目录下创建两个文件main.py这段python代码，用到了openAI，需要openAI及FQ。这里只做为示例#-*-coding:utf-8-*-fromlangchain.text_split
Pydub音频处理库核心API详解滕娴殉
Pydub音频处理库核心API详解pydubManipulateaudiowithasimpleandeasyhighlevelinterface项目地址:https://gitcode.com/gh_mirrors/py/pydub概述Pydub是一个功能强大的Python音频处理库，它提供了简洁直观的API来处理各种音频操作。本文将深入解析Pydub的核心功能，帮助开发者快速掌握音频处理的关键
python循环语句for BuckData python
目录1、for循环2、示例1、for循环Pythonfor循环可以遍历任何可迭代对象。通过使用for循环，我们可以为列表、元组、集合中的每个项目等执行一组语句。range()函数如需循环一组代码指定的次数，我们可以使用range()函数，range()函数返回一个数字序列，默认情况下从0开始，并递增1（默认地），并以指定的数字结束。2、示例#遍历字典d={'CNY':'人民币','USD':'美元
python循环语句
Python循环语句文章目录Python循环语句一、实验目的二、实验原理三、实验环境四、实验内容五、实验步骤1.While循环结构2.While无限循环3.For循环语法4.break语句和continue语句一、实验目的掌握循环结构的语法二、实验原理Python中的循环语句有for和while。Python循环语句的控制结构图如下所示：三、实验环境Python3.6以上PyCharm四、实验内容
基于opencv的鱼群检测和数量统计识别鱼群密度带界面
完整项目点文末名片查看获取一、项目简介本项目旨在通过计算机视觉技术，实现对视频中鱼类数量的自动检测与计数。利用OpenCV库进行图像处理，包括背景减除、形态学操作、轮廓检测等步骤，最终在视频帧中标记出鱼类并统计其数量。该系统可广泛应用于水产养殖、生态监测等领域，有助于提高工作效率和数据准确性。二、环境准备在开始项目之前，需要确保以下环境和工具已安装：Python：推荐使用Python3.6及以上版
上位机知识篇---Conda/pip install Atticus-Orion 上位机知识篇上位机操作篇深度学习篇 conda pip
在Python环境中，condainstall和pipinstall是两个常用的包安装命令，它们分别属于不同的包管理系统。下面从多个方面详细介绍它们的区别和使用场景：1.所属系统与适用范围特性condainstallpipinstall所属系统Anaconda/Miniconda生态系统Python标准包管理系统（PyPI）适用语言支持Python、R、Java等多种语言的包仅支持Python包依
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
基于均值偏移算法的动态目标跟踪研究 Zoiny_楠算法均值算法目标跟踪
摘要：目标跟踪技术是计算机视觉领域中重要研究课题之一,在人类生活、军事侦察、工业生产、医疗诊断、交通管理等多方面,都有广泛的应用,研究目标跟踪对人类生活、工程应用等具有现实的指导意义。在基于视觉的目标跟踪算法中,经典的Mean-Shift算法以其理论科学有效、操作简单易实现,跟踪性能较好等优势,一直是众多学者研究的热点。可算法也存在着许多缺陷。例如目标模型中混有背景信息的干扰,给目标定位带来了偏差
【Python从零到壹】Python中的标识符和保留字互联网老辛 #Python从零到壹 Python
保留字，也叫关键字，这些关键字是python直接提供给我们使用的，因此，我们在定义标识符的时候，不能用这些保留字。比如教育局就属于官方用的，你开个公司起名就不能叫教育局怎么查看关键字？importkeywordprint(keyword.kwlist)输出结果：E:\Python_demo\vippython\venv\Scripts\python.exeE:/Python_demo/vippyt
鸿蒙线程池全揭秘：让你的应用快、稳、省资源前端世界 harmonyos harmonyos 华为
摘要在现代应用开发中，多线程已经成为提升程序性能、优化用户体验的关键手段。尤其是在HarmonyOS（鸿蒙系统）这种强调分布式、并发处理的系统架构中，合理使用多线程不仅可以让程序运行更高效，还能帮助我们处理复杂的后台任务，比如文件下载、数据库操作、网络请求等。引言鸿蒙系统作为面向多设备融合的新一代操作系统，其支持的多线程模型与传统Android十分类似。很多Java的线程操作方法在鸿蒙中依然适用。
Python中的变量与数据类型難釋懷 python windows 开发语言
一、前言在Python编程中，变量（Variable）和数据类型（DataType）是程序开发中最基本也是最核心的概念。变量用于存储程序运行过程中的各种值，而数据类型则决定了变量可以存储什么样的数据、支持哪些操作。Python作为一门动态类型语言，无需显式声明变量的数据类型，解释器会根据赋给变量的值自动推断其类型。这种特性使得Python更加简洁易用，但也要求开发者对常见数据类型有清晰的认识。本文
Python中的count()方法溪流.ii python 数据库
文章目录Python中的count()方法基本语法在不同数据类型中的使用1.列表(List)中的count()2.元组(Tuple)中的count()3.字符串(String)中的count()高级用法1.指定搜索范围2.统计复杂元素注意事项Python中的count()方法前言：count()是Python中用于序列类型（如列表、元组、字符串等）的内置方法，用于统计某个元素在序列中出现的次数。基
Python中的标识符与保留字難釋懷 python java 数据库
一、前言在学习Python编程语言的过程中，标识符（Identifier）和保留字（Keywords）是两个非常基础但又极其重要的概念。它们是编写程序时必须遵守的语言规则之一。本文将带你深入了解：什么是标识符；标识符的命名规则与规范；Python中有哪些保留字；常见错误与注意事项；实际开发中的命名建议；掌握好这些内容，不仅能帮助你写出更规范、可读性更强的代码，还能避免因使用关键字作为变量名而导致的
MySQL 中的锁机制详解：原理、实现方式与实战解析！程序猿Mr.wu MySQL mysql 数据库
MySQL中的锁机制详解：原理、实现方式与实战解析！锁的世界，比你想象得更精彩！一、为什么要有锁？在并发环境下，多线程操作数据库的同一份数据时，如果没有锁机制，可能会出现以下问题：脏读：读取了另一个事务未提交的数据。不可重复读：同一事务中多次读取结果不一致。幻读：读取时发现记录“凭空”出现或消失。锁的存在，就是为了保证并发情况下的数据一致性与隔离性。二、MySQL中锁的分类1.按作用范围分类分类说
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f