Kun Li

[sd_scripts]之train

https://github.com/kohya-ss/sd-scripts/blob/main/docs/train_README-zh.mdhttps://github.com/kohya-ss/sd-scripts/blob/main/docs/train_README-zh.md

支持模型fine-tune，dreambooth，lora，textual inversion。

1.数据准备

在任意多个文件夹中准备好训练的图像文件，不需要预处理，勿使用极小的图像，不要使用过大的图像如3000x3000以上的。正则化图像："正则项图像"对应Dreambooth论文中的prior-preservation图像，用来防止模型过拟合。通过自己先生成一些图像，依赖论文中loss的prior-preservation term对训练过程正则化，来解决过拟合与语言漂移问题。

1.1 dreambooth、class+identifier（可使用正则化图像）

将训练目标与特定单词（identifier）相关联进行训练，无需准备caption，要学习特定的角色，但由于训练数据的所有元素斗鱼identifier相关联，因此在生成时可能出现无法更换特定服饰的情况。

1.2 dreambooth、caption（可使用正则化图像）

给每张图片写caption，存放到文本文件中，进行训练，例如，通过将图像详细信息（如穿着白色衣服的角色A、穿着红色衣服的角色B）记录在caption中，可以将角色和其他元素分离，并期望模型更准确的学习角色。

1.3 finetune（不可使用正则化）

将caption收集到元数据中。

如果要想训练lora、textual inversion而不准备caption，则建议使用dreambooth class+identifier，如果能够准备caption，则dreambooth caption更好，如果有大量训练并不使用正则化的话，则考虑fine-tuning。这里就是fine-tune/train_network/train_textual_inversion用fine-tuning，train_db主要用前两类。

2.每种方法的指定方式

2.1 dreambooth，class+identifier方法（可使用正则化图像）

在该方法中，每个图像都被视为与class identifier相同的标题进行训练（shs dog），相当于每张图片都使用shs dog进行训练。

2.1.1 确定identifier和class

class是训练目标的一般类别，例如，要学习特定品种的狗，则class是dog，对于动漫角色，根据模型不同，可能是boy或girl。identifier是用于识别训练目标并进行学习的单词。可以使用任何单词，但根据dreambooth论文，tokenizer生成的3个或更少字符的罕见单词最好。

使用identifier和class，例如 shs dog可以将模型训练为从class中识别学习所需的目标。在图像生成时，使用shs dog将生成所学习的狗的图像，

作为identifier，一些参考是“shs sts scs cpc coc cic msm usu ici lvl cic dii muk ori hru rik koo yos wny”等。

2.1.2 决定是否使用正则化图像，并在使用时生成正则化图像

正则化图像是为防止语言漂移，即整个类别被拉扯成为训练目标而生成的图像。如果不使用正则化图像，例如在 shs 1girl 中学习特定角色时，即使在简单的 1girl 提示下生成，也会越来越像该角色。这是因为 1girl 在训练时的标题中包含了该角色的信息。通过同时学习目标图像和正则化图像，类别仍然保持不变，仅在将标识符附加到提示中时才生成目标图像。

如果只想在LoRA或DreamBooth中使用特定的角色，则可以不使用正则化图像。在Textual Inversion中也不需要使用（如果要学习的token string不包含在标题中，则不会学习任何内容）。

一般情况下，使用在训练目标模型时只使用类别名称生成的图像作为正则化图像是常见的做法（例如 1girl）。但是，如果生成的图像质量不佳，可以尝试修改提示或使用从网络上另外下载的图像。由于正则化图像也被训练，因此其质量会影响模型。

通常，准备数百张图像是理想的（图像数量太少会导致类别图像无法被归纳，特征也不会被学习）。如果要使用生成的图像，生成图像的大小通常应与训练分辨率（更准确地说，是bucket的分辨率）相匹配。

2.1.3 设置文件的描述

[general]
enable_bucket = true                        # 是否使用Aspect Ratio Bucketing

[[datasets]]
resolution = 512                            # 训练分辨率
batch_size = 4                              # 批次大小

  [[datasets.subsets]]
  image_dir = 'C:\hoge'                     # 指定包含训练图像的文件夹
  class_tokens = 'hoge girl'                # 指定标识符类
  num_repeats = 10                          # 训练图像的重复次数

  # 以下仅在使用正则化图像时进行描述。不使用则删除
  [[datasets.subsets]]
  is_reg = true
  image_dir = 'C:\reg'                      # 指定包含正则化图像的文件夹
  class_tokens = 'girl'                     # 指定class
  num_repeats = 1                           # 正则化图像的重复次数，基本上1就可以了

1.训练分辨率，指定一个数字表示正方形，如果是512，则为512x512，如果使用方括号和逗号分隔的两个数字，则表示横向x纵向（[512，768]，则为512x768），在sd1.x中，原始训练分辨率为512，在sd2.x 768中，分辨率为768.

2.批量大小。同时训练多少个数据。

3.文件夹，训练和正则化图像的文件夹。

4.num_repeats。重复次数用于调整正则化图像和训练用图像的数量。由于正则化图像的数量多于训练用图像，因此需要重复使用训练用图像来达到一对一的比例，从而实现训练，重复次数指定为训练用图像的重复次数x训练用图像的数量>=正则化图像的重复次数x正则化图像的数量，一般10就可以了。1个epoch，训练数据过一遍，如果正则化数据比训练数据多，则多余的正则化数据不使用。

2.1.4 训练

#!/bin/bash
# Dreambooth train script
script_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/tools/sd_lora/sd-scripts/train_db.py"

# 设置训练用模型、数据
is_v2_model=0      # SD2.0 model | SD2.0模型 2.0模型下 clip_skip 默认无效
parameterization=0 # parameterization | 参数化 本参数需要和 V2 参数同步使用 实验性功能
dataset_config="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/tools/sd_lora/config/dreambooth.toml"
pretrained_model_name_or_path="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/stable-diffusion-webui/models/Stable-diffusion/DreamShaper_8_pruned.safetensors"

# 输出设置
output_name="sn_logo" # output model name | 模型保存名称
output_dir="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/outputs/"
save_model_as="safetensors" # model save ext | 模型保存格式 ckpt, pt, safetensors
logging_dir="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/outputs/"

# 网络设置

# 训练相关参数
resolution="512,512"         # image resolution w,h. 图片分辨率，宽,高。支持非正方形，但必须是 64 倍数。
batch_size=1                 # batch size
max_train_epochs=10         # max train epoches | 最大训练 epoch
save_every_n_epochs=2        # save every n epochs | 每 N 个 epoch 保存一次
stop_text_encoder_training=0 # stop text encoder training | 在第N步时停止训练文本编码器
noise_offset="0"             # noise offset | 在训练中添加噪声偏移来改良生成非常暗或者非常亮的图像，如果启用，推荐参数为0.1
keep_tokens=0                # keep heading N tokens when shuffling caption tokens | 在随机打乱 tokens 时，保留前 N 个不变。
min_snr_gamma=0              # minimum signal-to-noise ratio (SNR) value for gamma-ray | 伽马射线事件的最小信噪比（SNR）值  默认为 0

# 学习率
lr="1e-4"                           # learning rate | 学习率，在分别设置下方 U-Net 和 文本编码器 的学习率时，该参数失效
lr_scheduler="cosine_with_restarts" # "linear", "cosine", "cosine_with_restarts", "polynomial", "constant", "constant_with_warmup", "adafactor"
lr_warmup_steps=0                   # warmup steps | 学习率预热步数，lr_scheduler 为 constant 或 adafactor 时该值需要设为0。
lr_restart_cycles=1                 # cosine_with_restarts restart cycles | 余弦退火重启次数，仅在 lr_scheduler 为 cosine_with_restarts 时起效。

# 优化器
optimizer_type="AdamW" # Optimizer type | 优化器类型 默认为 AdamW8bit，可选：AdamW AdamW8bit Lion Lion8bit SGDNesterov SGDNesterov8bit DAdaptation AdaFactor prodigy

# 恢复训练设置
save_state=0 # save state | 保存训练状态 名称类似于 -??????-state ?????? 表示 epoch 数
resume=""    # resume from state | 从某个状态文件夹中恢复训练 需配合上方参数同时使用 由于规范文件限制 epoch 数和全局步数不会保存 即使恢复时它们也从 1 开始 与 network_weights 的具体实现操作并不一致L

# 其他设置
min_bucket_reso=256              # arb min resolution | arb 最小分辨率
max_bucket_reso=1024             # arb max resolution | arb 最大分辨率
persistent_data_loader_workers=1 # persistent dataloader workers | 保留加载训练集的worker，减少每个 epoch 之间的停顿
clip_skip=2                      # clip skip | 玄学 一般用 2
multi_gpu=2                      # multi gpu | 多显卡训练 该参数仅限在显卡数 >= 2 使用
lowram=0                         # lowram mode | 低内存模式 该模式下会将 U-net 文本编码器 VAE 转移到 GPU 显存中 启用该模式可能会对显存有一定影响

# 远程记录设置
use_wandb=0         # use_wandb | 启用wandb远程记录功能
wandb_api_key=""    # wandb_api_key | API,通过 https://wandb.ai/authorize 获取
log_tracker_name="" # log_tracker_name | wandb项目名称,留空则为"network_train"

# =======================================================================================================================
extArgs=()
launchArgs=()
if [[ $multi_gpu == 1 ]]; then launchArgs+=("--multi_gpu"); fi

if [[ $is_v2_model == 1 ]]; then
  extArgs+=("--v2")
fi
if [[ $parameterization == 1 ]]; then extArgs+=("--v_parameterization"); fi

if [[ $stop_text_encoder_training -ne 0 ]]; then extArgs+=("--stop_text_encoder_training $stop_text_encoder_training"); fi
if [[ $noise_offset != "0" ]]; then extArgs+=("--noise_offset $noise_offset"); fi
if [[ $min_snr_gamma -ne 0 ]]; then extArgs+=("--min_snr_gamma $min_snr_gamma"); fi

#if [[ $optimizer_type ]]; then extArgs+=("--optimizer_type $optimizer_type"); fi
#if [[ $optimizer_type == "DAdaptation" ]]; then extArgs+=("--optimizer_args decouple=True"); fi

if [[ $save_state == 1 ]]; then extArgs+=("--save_state"); fi
if [[ $resume ]]; then extArgs+=("--resume $resume"); fi

if [[ $persistent_data_loader_workers == 1 ]]; then extArgs+=("--persistent_data_loader_workers"); fi
if [[ $lowram ]]; then extArgs+=("--lowram"); fi

if [[ $use_wandb == 1 ]]; then
  extArgs+=("--log_with=all")
else
  extArgs+=("--log_with=tensorboard")
fi
if [[ $wandb_api_key ]]; then extArgs+=("--wandb_api_key $wandb_api_key"); fi
if [[ $log_tracker_name ]]; then extArgs+=("--log_tracker_name $log_tracker_name"); fi

# =====================================================================================================================
python -m accelerate.commands.launch "${launchArgs[@]}" --num_cpu_threads_per_process=4 "$script_name" \
  --pretrained_model_name_or_path="$pretrained_model_name_or_path" \
  --dataset_config="$dataset_config" \
  --output_dir="$output_dir" \
  --output_name="$output_name" \
  --save_model_as="$save_model_as" \
  --logging_dir="$logging_dir" \
  --log_prefix="$output_name" \
  --prior_loss_weight=1.0 \
  \
  --resolution "$resolution" \
  --max_train_epochs "$max_train_epochs" \
  --train_batch_size "$batch_size" \
  --save_every_n_epochs "$save_every_n_epochs" \
  --keep_tokens "$keep_tokens" \
  \
  --optimizer_type="$optimizer_type" \
  --clip_skip="$clip_skip" \
  \
  --learning_rate="$lr" \
  --lr_scheduler="$lr_scheduler" \
  --lr_warmup_steps="$lr_warmup_steps" \
  --lr_scheduler_num_cycles="$lr_restart_cycles" \
  \
  --min_bucket_reso="$min_bucket_reso" \
  --max_bucket_reso="$max_bucket_reso" \
  \
  --mixed_precision="fp16" \
  --cache_latents \
  --gradient_checkpointing \
  --huggingface_path_in_repo "/root/.cache" "${extArgs[@]}"

2.2 dreambooth、caption方式，可使用正则化

这个意义不大，使用dreambooth，其实就是想有具体的实体被描述。

2.3 fine-tune

fine-tune通常是指sd的全量微调，但它和lora的训练基本是一致的。

2.3.1 准备数据

将caption数据和标签整合到元数据中，.json

1.blip添加caption，也可以使用deepdanbooru、WD14Tagger

2.预处理caption和标签信息，将caption和标签作为元数据合并到一个文件中

3.清洗标签，标签中可能存在下划线等，

#!/bin/bash
# make caption script
script_caption_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/tools/sd_lora/sd-scripts/finetune/make_captions.py"
script_merge_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/tools/sd_lora/sd-scripts/finetune/merge_captions_to_metadata.py"
script_clean_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/tools/sd_lora/sd-scripts/finetune/clean_captions_and_tags.py"

caption=0
train_data_dir="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/data/sn/banner/"
batch_size=8

merge=1
merge_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/data/sn/banner/meta_cap.json"

clean=1
clean_name="/home/image_team/image_team_docker_home/lgd/e_commerce_sd/data/sn/banner/meta_clean.json"

if [[ $caption == 1 ]]; then
  python "$script_caption_name" \
    --batch_size "$batch_size" "$train_data_dir"
fi

if [[ $merge == 1 ]]; then
  python "$script_merge_name" \
    --full_path "$train_data_dir" "$merge_name"
fi

if [[ $clean == 1 ]]; then
  python "$script_clean_name" \
    "$merge_name" "$clean_name"
fi

[general]
enable_bucket = true                        # 是否使用Aspect Ratio Bucketing
shuffle_caption = true
keep_tokens = 1

[[datasets]]
resolution = 512                            # 训练分辨率
batch_size = 4                              # 批次大小

  [[datasets.subsets]]
  image_dir = "/home/image_team/image_team_docker_home/lgd/e_commerce_sd/data/sn/banner/"                    # 指定包含训练图像的文件夹
  metadata_file = '/home/image_team/image_team_docker_home/lgd/e_commerce_sd/data/sn/banner/meta_clean.json'

2.3.2 训练

这里的训练可以包括除dreambooth之外的所有的训练方式，主要就是因为数据格式只有两种，包括dreambooth和lora等这两种方式，fine-tune类的都是统一格式，直接调用py即可。

目标检测——玉米叶感染数据集 Bryan Ding 人工智能
一、重要性首先，玉米作为世界上重要的粮食作物之一，其生长状况直接影响到粮食产量和粮食安全。玉米叶感染是玉米生长过程中常见的病害之一，会导致玉米叶片出现肿胀、皱缩、扭曲变形等症状，严重时甚至可能形成瘤状物。因此，及早检测玉米叶感染对于保障玉米的健康生长和提高产量具有重要意义。其次，通过玉米叶感染检测，农民和农业科研人员可以及时发现并采取有效的防治措施，防止病害的扩散和加重。这不仅可以减少因病害导致的
VB6 调用 JS 函数时数据传输json格式或a=1&b=s2字符串专注VB编程开发20年 javascript json 开发语言 vb6 js
1.VB6调用JS函数时数据传输格式当从VB6调用JS设计的函数时，使用JSON字符串作为数据传输格式是一个不错的选择，但并非唯一选择。使用JSON字符串传输的优势通用性：JSON是一种轻量级的数据交换格式，具有良好的跨语言和跨平台特性。在VB6和JS之间使用JSON字符串传输数据，可以方便地表示复杂的数据结构，如对象、数组等。结构化：JSON可以清晰地表示数据的结构，便于在不同语言环境中解析和处
C++ 泛型编程四代目水门 C++学习笔记 c++开发语言
C++泛型编程一、泛型编程基础1.核心概念实现算法与数据结构的分离基于模板技术（函数模板/类模板）本质：类型参数化，减少重复代码典型应用：STL容器、迭代器、算法2.类型本质内存布局的抽象不同类型对应不同的内存分配策略二、函数模板1.基本语法cpptemplate//或template返回类型函数名(参数列表){//函数体}2.关键特性支持隐式推导和显式指定类型可重载（包括与普通函数重载）可声明为
【学习笔记5】Linux下cuda、cudnn、pytorch版本对应关系 longii11 linux pytorch 运维
一、cuda和cudnnNVIDIACUDAToolkit（CUDA）为创建高性能GPU加速应用程序提供了一个开发环境。借助CUDA工具包，您可以在GPU加速的嵌入式系统、桌面工作站、企业数据中心、基于云的平台和HPC超级计算机上开发、优化和部署您的应用程序。该工具包包括GPU加速库、调试和优化工具、C/C++编译器以及用于部署应用程序的运行时库。全球的深度学习研究人员和框架开发人员都依赖cuDN
【踩坑日记15】safetensors_rust.SafetensorError: Error while deserializing header: HeaderTooLarge longii11 开发语言后端
问题描述加载stabilityai/stable-diffusion-xl-base-1.0模型时，出现问题。Errorwhiledeserializingheader:HeaderTooLargeFile"/home/XXX/code/dreambooth_lora/train_dreambooth_lora_sdxl_advanced.py",line1278,inmaintext_encod
【Elasticsearch】Index Lifecycle Management risc123456 Elasticsearch elasticsearch
Elasticsearch的索引生命周期管理（IndexLifecycleManagement，简称ILM）是一种自动化管理索引生命周期的功能，旨在帮助用户根据索引的使用模式和数据价值，高效地管理和优化索引的存储、性能和成本。以下是关于Elasticsearch索引生命周期的详细说明：---1.索引生命周期的五个阶段Elasticsearch的ILM定义了五个主要阶段，每个阶段对应不同的索引使用模
LeetCode-Hot100-006三数之和 YQ_ZJH LeetCode100题 leetcode 数据结构排序算法算法 c++蓝桥杯 java
思路先排序解决重复的问题。再三重循环遍历，但是第二重和第三重使用双指针的做法，复杂度降低为O(n2)O(n^2)O(n2)。代码本次代码来自于力扣官方题解评论区，非本人原创，请注意classSolution{publicList>threeSum(int[]nums){Arrays.sort(nums);//先排序List>res=newArrayList0&&nums[i]==nums[i-1]
【Qt】Qt Widgets和QML（Qt Quick）开发界面的区别￡އއ昔年 qt 开发语言
Qt提供了两种主要的UI技术：QtWidgets和QML（QtQuick）。它们的核心区别主要体现在使用方式、架构、性能、开发难度和适用场景等方面。1.QtWidgetsvs.QML总体对比对比项QtWidgetsQML(QtQuick)语言C++(带QtUI库)QML+JavaScript(底层C++)渲染方式传统窗口系统控件（原生或模拟）基于OpenGL，使用GPU加速UI风格经典桌面UI（W
【AI辅助工具】Trae和Cursor 对比分析 Hello kele 人工智能 AI编程
Trae和Cursor都是旨在提升编程效率的AI辅助工具，但在功能、定位和用户体验上有所差异。Trae：Trae是字节跳动推出的AI集成开发环境（IDE），专为中文开发者设计，提供全中文界面，符合国人使用习惯。主要特点：智能问答与代码自动补全：支持通过自然语言描述需求，自动生成相应的代码，减少手动编写代码的时间。Builder模式：类似于Cursor的Composer功能，帮助用户从零开始构建完整
DeepSeek：AI赋能的无限可能——从日常生活到职业进阶的全场景探索 Hello kele 人工智能人工智能
引言在人工智能技术飞速发展的今天，DeepSeek作为一款国产AI工具，凭借其强大的推理能力、自然语言处理效率和场景化应用潜力，正在重塑人类解决问题的方式。从撰写演讲稿到制定投资策略，从家庭教育到企业管理，DeepSeek通过“自然语言对话”的交互模式，将复杂任务简化为几步提示词的输入，真正实现了“所想即所得”。本文将从七大核心场景出发，系统解析DeepSeek如何成为个人与组织的智能助手，推动效
Leetcode 刷题笔记1 动态规划part05 平乐君 leetcode 笔记动态规划
开始完全背包不同于01背包，完全背包的特色在于元素可以重复拿取，因此在递归公式和遍历顺序上都有些许不同。leetcode518零钱兑换||在组合方式中所用到的递推公式是dp[j]=dp[j-coins[i]]+dp[j]对于coins[i]>j的情况，forjinrange(coin[i],amount+1)不会执行，即实现dp[i][j]=dp[i-1][j]classSolution:defc
IMT-2020(5G)推进组发布《5G-Advanced 场景需求与关键技术白皮书》优橙教育 5G 面试职场和发展 5g 网络
11月16日，由工业和信息化部、深圳市人民政府主办的2022年中国5G发展大会在深圳举行。本届大会以“5G领航新基建，构筑发展新底座”为主题。会上，IMT-2020(5G)推进组发布《5G-Advanced场景需求与关键技术白皮书》。中国工程院院士邬贺铨表示，5G商用三年来在国际上取得了网络部署与用户数领先的成绩。2022年9月中国建成5G基站数占基站总数的20.6%，占全球5G基站数60%。20
[数据结构] [C++ STL] vector使用详解高亚奇数据结构数据结构 c++开发语言
一、概述vector（向量）:是一种序列式容器，事实上和数组差不多，但它比数组更优越。一般来说数组不能动态拓展，因此在程序运行的时候不是浪费内存，就是造成越界。而vector正好弥补了这个缺陷，它的特征是相当于可分配拓展的数组（动态数组），它的随机访问快，在中间插入和删除慢，但在末端插入和删除快。二、定义及初始化使用之前必须加相应容器的头文件：#include//vector属于std命名域的，因
React 基础教程阿贾克斯的黎明前端 react.js 前端前端框架
目录React基础教程一、React简介二、安装和设置三、创建第一个React组件（一）函数式组件（二）类组件四、渲染组件五、组件的属性和状态（一）属性（Props）（二）状态（State）六、组件的生命周期方法七、事件处理八、总结React是一个用于构建用户界面的JavaScript库。它以高效、灵活和可维护性而受到广泛的欢迎。本教程将介绍React的基础知识，帮助你快速上手React开发。一、
【贪心算法1】 m0_46150269 贪心算法算法
力扣455.分发饼干链接:link思路尽可能让更多人吃到饼干并且尽可能少的造成浪费，大尺寸饼干能满足大胃口的人就应该优先分给大胃口的人。所以先将饼干和胃口大小排序，然后从后往前遍历。但是这时候又有一个问题，饼干和胃口哪个作为for循环哪个作为if呢？答案是只能胃口作为for，饼干作为if，因为for循环的i是固定每次移动，而饼干index只有满足条件才会移动。这里可以举一个反例，如果最大胃口大于最
RAG 检索增强生成：技术详解与应用展望君君学姐 RAG检索增强生成
RAG检索增强生成：技术详解与应用展望一、引言随着人工智能技术的飞速发展，自然语言处理（NLP）领域迎来了前所未有的变革。其中，检索增强生成（Retrieval-AugmentedGeneration，简称RAG）作为一种新兴的技术框架，正逐渐成为大模型应用中的热门选择。RAG通过结合信息检索（IR）和自然语言生成（NLG）的能力，旨在提升模型在回答问题、生成文本等任务中的准确性和可靠性。本文将深
【python】软件更新：用conda或Poetry 无水先生 AI原理和python实现 python指南和应用人工智能综合 python conda 开发语言
一、说明在实现anancoda的软件更新问题，需要明确几个问题：1）是python包吗？2）是C++包吗？更新的方法有别。python包可以pip访问。C++包必须是conda访问。二、更新C++包的循环依赖问题如果在Windows10上的Ananconda3.7上安装和更新软件包。运行代码时:condaupdate--all或者condainstallpandas收到以下错误:RemoveErr
CES Asia 2025:可持续科技论坛成焦点赛逸展张胜人工智能大数据
随着全球对环境保护和可持续发展的关注度日益提升，科技领域在推动可持续发展方面扮演着愈发关键的角色。将在首都北京举办的CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展），将目光聚焦于可持续科技，展会期间的相关论坛峰会吸引了众多企业的目光，有望成为展会一大亮点。近年来，科技行业面临着巨大的可持续转型压力。苹果、三星等行业巨头已明确要求供应商在2030年前实现碳中和，这使得整个行业供应链必须加
CES Asia 2025:5G与物联网成焦点，论坛峰会引企业关注赛逸展张胜 5G 物联网
在科技飞速发展的当下，5G与物联网技术正深刻改变着人们的生活和产业格局。作为亚洲消费电子领域的年度盛会，CESAsia2025第七届亚洲消费电子技术贸易展（赛逸展）将在首都北京盛大开幕。此次展会以“科技新视界，创新赢未来”为主题，将全方位展示5G技术及其在物联网中的创新应用，展会期间的相关论坛峰会更是吸引了众多企业的目光，成为行业内交流合作的重要契机。在5G技术展示方面，CESAsia2025将汇
使用OpenCV和Python将图像读取为RGB UixnContext opencv python 人工智能 OpenCV
在计算机视觉和图像处理中，OpenCV是一个广泛使用的开源库，提供了许多功能强大的图像处理工具。其中一个常见的任务是将图像读取为RGB格式，以便进一步处理和分析。在本文中，我将向您展示如何使用OpenCV和Python来实现这个任务。首先，确保您已经安装了OpenCV库。您可以使用以下命令在Python中安装OpenCV：pipinstallopencv-python一旦安装完成，我们可以开始写代
贪心算法-字符串数组能拼接出的最小字典序(java) SP_1024 算法贪心算法算法 java
最小字典序的贪心算法题目描述贪心算法的解题思路贪心算法自定义比较器贪心算法暴力递归解法题目描述给定一个由字符串组成的数组strs，必须把所有的字符串拼接起来，返回所有可能的拼接结果中字典序最小的结果贪心算法的解题思路首先我们很自然的能想到,遍历数组,比较数组中每一个元素,字典序越小的,就放前面.但这里右一个陷阱,比如ba和b两个字符串,b的字典序小于ba,如果拼成bba就错了,显然bab字典序更小
全国首个高速公路5G-A通感一体基站在宁开通测试 NewsMash 5G
7月18日，江苏移动南京分公司联合南京市交通建设投资控股（集团）有限责任公司（以下简称南京交通集团）、南京聚变航天信息科技有限公司，共同完成了全国首个高速公路5G-A通感一体基站部署和低空管理场景的开通测试。5G-A通感一体基站的通信和感知能力不仅为低空无人飞行器的通信和监管提供了有效支撑手段，也将助力南京低空经济发展打开新空间。什么是5G-A？5G-A全称为5G-Advanced，是基于第五代移
大数据面试系列之——Hadoop 潜心_守道大数据面经面试大数据 Hadoop
Hadoop的三个核心：HDFS（分布式存储系统）MapReduce（分布式计算系统）YARN(分布式资源调度)1.Hadoop集群的几种搭建模式1.单机模式：直接解压安装，不存在分布式存储系统2.伪分布式：NameNode和DataNode安装于同一个节点，无法体现分布式处理的优势。3.完全分布式：一个主节点，多个从节点，存在如果主节点宕机，集群就无法使用的缺点。4.高可用模式：多个主节点，多个
【无标题】Hollo world.Javascript 一一代码 python javascript
HelloWorld最简单JavaScript代码console.log("Hello,World!");变量和数据类型JavaScript中的变量声明和基本数据类型。```javascriptletname="Alice";//字符串constage=25;//数字letisStudent=true;//布尔值console.log(name,age,isStudent);```函数定义一个简单
基于python cv 库实现读取图片像素值我是电脑高手 python小工具 python 开发语言图像处理
--------在日常生活中，我们经常用简单的形容词来描述颜色，比如“红色”、“蓝色”、“绿色”等。然而，这种描述方法对于精确确定颜色是有限的，尤其是在设计、图像处理、Web开发等领域。为了更准确和科学地定义颜色，我们通常采用RGB值来表示颜色。什么是RGB值？RGB是指红色（Red）、绿色（Green）和蓝色（Blue）的组合方式，用来表示颜色。RGB是一种加色模型，也就是说，通过将红、绿、蓝三
拓展：核心对象成员访问操作符神里流~霜灭 c++c语言数据结构链表顺序表操作符
前言针对于核心对象成员访问操作符，这篇文章只简单介绍一下两者的区别以及优缺点，什么情况下使用操作符（->）、什么情况下使用操作符（.）。在C++中，操作符->（箭头操作符）和.（点操作符）是用于访问对象成员的核心操作符，但它们的使用场景和底层逻辑有明显区别。以下是详细分析：一、基本定义与区别操作符适用对象语法等价底层逻辑.对象实例（非指针）obj.member直接访问对象的成员->指向对象的指针p
大型项目，选择conda还是Poetry要点分析 Hello kele conda Python Poetry AI编程人工智能
在大型项目中选择conda还是Poetry，取决于项目的具体需求，以下从多个维度进行分析，助你判断哪个更合适：包管理方面支持的包类型conda：作为跨语言的包管理系统，不仅能管理Python包，还能处理其他语言（如C、C++、R等）的包和依赖。对于大型项目，尤其是涉及多语言协同开发的项目，比如数据科学项目中可能会用到Python进行数据分析，同时依赖底层用C语言编写的高性能计算库，conda可以很
量子算法：英译名、概念、历史、现状与展望？ lisw05 量子计算计算机科学技术
李升伟整理####英译名量子算法的英文为**QuantumAlgorithm**。####概念量子算法是利用量子力学原理（如叠加态、纠缠态和干涉）设计的算法，旨在通过量子计算机高效解决经典计算机难以处理的问题。其核心在于利用量子比特（qubit）的并行计算能力，显著提升计算效率。####历史1.**1980年代**：RichardFeynman提出量子计算概念，认为量子计算机可以模拟经典计算机无法
QT-绘画事件 Ryan_Gosling qt 开发语言
实现颜色的随时调整，追加橡皮擦功能widget.h#ifndefWIDGET_H#defineWIDGET_H#include#include#include#include#include#include#include//自定义Line类，存储线段的起点、终点、颜色和宽度classLine{public:Line(constQPoint&start,constQPoint&end,constQ
医院陪诊小程序开发主要解决哪些需求问题 zhushuai0831 个人开发
医院陪诊小程序开发，主要解决以下几个方面的需求问题：1、时间和空间上的便利。陪诊者可以通过小程序实时查询患者的就诊情况，并且可以了解医院的就诊流程和规定。这样可以减少陪诊者等待的时间，避免不必要的浪费。2、信息查询和分享。医院陪诊小程序可以为陪诊者提供疾病查询、药品查询、症状自诊等服务，可以让陪诊者更好地了解病情和治疗方案，并且可以分享这些信息给患者和家属。3、服务评价和反馈。小程序可以提供服务评
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓

[sd_scripts]之train

你可能感兴趣的:(多模态和生成模型,lora,sd_scripts)