The black panther

使用labelImg制作数据集并用于YOLOV5模型训练

LabelImg是图形图像注释工具。它是用Python编写的，并将Qt用于其图形界面。

目前LabelImg支持YOLO和PascalVOC2种格式，前者标签文件后缀是.txt件，而后者标签文件后缀是.xml件。YOLOv5算法所支持的数据格式为YOLO。图片和保存标签的文件名是对应的，只是扩展名不同(例如：00001.txt和00001.jpg)。标签保存在对应的labels文件夹下，与images中的图片文件名一一对应。

在这里补充下两个常用的制作标签数据集的工具labelImg和labelme的区别

labelimg是一种矩形标注工具，常用于目标识别和目标检测，其标记数据输出为.xml和.txt

labelme是一种多边形标注工具，可以准确的将轮廓标注出来，常用于分割，其标记输出格式为json

总之：labelImg和labelme都是训练数据集时，用于给数据集打标签的软件，但一个是矩形框，一个是可以标记不规则边缘，用于CV的不同领域。

本文主要使用labelImg制作自己的数据集并用于YOLOV5模型训练，给出YOLOV5下载地址：GitHub - ultralytics/yolov5: YOLOv5 in PyTorch > ONNX > CoreML > TFLite

1、labelImg的下载即安装：

方法一：labelImg的安装——Win10

Win10可以直接下载简易版exe文件，下载地址：https://github.com/tzutalin/labelImg/releases，选择windows_v1.8.1.zip，下载并解压，直接双击exe文件点开即用，下载后，发个快捷方式到桌面就可了

方法二：labelImg工具原github下载地址

mirrors / tzutalin / labelimg · GitCode

方法三：如何你安装了Anaconda环境，那么在Anaconda Prompt输入命令（作者就是这样的）：

pip install labelImg

等待下载完毕后再接着输入命令以下命令启动：

labelImg

启动后labelImg的界面：

2、使用labelImg制作自己的数据集

先给出最终我们需要制作的yolo格式的数据集，如下：

其中，images是存放图片的位置，labels是存放图片对应的标签，而yolo的标签是某个图片的类别及boundingbox的坐标及大小。labels文件夹下的标签就是需要使用labelImg生成，最后的buffaloLion.yaml是训练yolov5时的数据集配置文件，需要我们先创建，后面会说如何配置。

2.1切换至YOLO模式

2.2 打开数据集文件夹以及labels文件夹

点击Open dir选择我们训练图片所在的文件夹images，选择之后会弹窗让你选择labels所在的文件夹。labels文件夹需要自己建立，名字随意，目的是用来存储图片标注后的信息。如果第二个弹窗没有弹出或者选错了，可以点击change save dir进行修改。以下是本文案例样式。

执行上面两步的结果如下：

2.3 建立类名

2.4 开始标记

常用快捷键：w,a,d

w—创建一个检测box，就是方框

a—前一张图片

d—下一张图片

Ctrl + s——保存结果，先前View中勾选了Auto Save mode后，只需框选，然后下一张，就能自动保存

框选错误可以通过EditRectBox来删除，选中错误框后，按delete

标记完成后，labelImg生成的标签放在labels文件夹下：

生成的标签文件格式：class x_center y_center width height 。每行表示一个目标对象，每行中的第一个数表示目标类别，计数从0开始，比如这里的0代表的橘子。后面的4个值代表目标真实框中心点（x，y）和真实框的宽、高信息。生成的标签文件的内容如下：

打开某个标签txt文件：

class.txt是标签的所有类别名称：

后面的图片及生成的标签类似上述操作，最终会在labels文件夹下生成所有images文件下图片对应的标签。

3、编辑数据集配置文件*.yaml**

buffaloLion.yaml（名称自己取），是一个yolov5模型进行训练时加载的数据集配置文件，比如：yolov5模型从官网下载下来时，有coco.yaml文件等，如下：

因此，我们需要根据这些配置文件的信息，换成自己的数据集的配置文件，这样在使用yolo模型训练时它才会知道如何加载我们自己的数据集。

自行创建一个yaml文件，文件的内容如下：

#path为自己数据集的文件夹名称，要根据的数据集放置自己项目路径下的哪个位置进行更改
path: ./mydata
#train是训练时加载的图片或者标签的路径
train: images/train
#val是验证时加载的图片或者标签的路径
val: images/train
#test是测试时加载的图片或者标签的路径
test: images/test
# 类别数
nc: 2
# 类别名称
names: ['buffalo','lion']

其中需要自己修改的内容为：

train与val后的地址，地址均指向训练图集的文件夹。以及names后的内容，nc类别数。

提示：train与val文件夹下的图片和标签需要自己进行划分哦。记得图片和标签要对应上。

注意 label不用配置：train.py在训练过程中，会将路径中的images替换为 labels来寻找labels数据

至此训练模型的数据就准备好了。

4、编辑models模型配置xxx.yaml文件

在yolov5项目下进入models/目录，可以看到有四个模型配置的yaml文件：

表示训练时，你选中的yolov5的模型结构，这里根据自己的需求选择其中一个的模型，并将模型的配置文件yaml进行修改。

这些Model的yaml文件中都是模型网络相关配置参数，例如nc下面的depth_multiple是指网络的深度，width_multiple是网络的宽度， anchors是锚标（标出物体的方框），backbone既骨干网络。

我在这里选择了yolov5s.yaml文件进行复制一份，并修改了里面模型的nc（类别参数）为2（这里要和你提前训练时设定的类别数一直），以下为我自己编辑的模型配置文件部分截图：

并将文件重命名，自行将他放在一个位置处，我这为了方便，直接放在之前制作的数据集下的目录里，如下：

后面进行训练的时候，就需要记住这些你制作的配置文件的位置。

5、开始训练

前期的数据集自己制作好后，并自行划分训练集、验证集，以及创建了数据集配置文件和模型配置文件后，就可以在项目路径里的终端下执行下面的命令，开始训练了：

python train.py --data mydata/buffaloLion.yaml --weights yolov5s.pt --epoch 50 --batch-size 32 --cfg mydata/yolov5s_my.yaml

这里需要注意的是，终端的路径要执行到train.py文件的目录下，后面的几个参数，如 --data就是自己数据集的配置文件，--weights是你自己是否需要预训练模型（可以提前下载好），--epoch 50是迭代的次数， --cfg为模型的配置文件，

训练过程：

这里再补充下train.py文件里的常用参数及解释：

weights：权重文件路径，如果是’'则重头训练参数，如果不为空则做迁移学习，权重文件的模型需与cfg参数中的模型对应

epochs：指的就是训练过程中整个数据集将被迭代多少次

batch-size：每次梯度更新的批量数，指一次看完多少张图片才进行权重更新

config-thres: 模型目标检测的置信度阈值

cfg：存储模型结构的配置文件

data：存储训练、测试数据的文件

img-size：输入图片的宽高

rect：进行矩形训练

resume：恢复最近保存的模型开始训练

nosave：仅保存最终checkpoint

notest：仅测试最后的epoch

evolve：进化超参数

cache-images：缓存图像以加快训练速度

name：重命名results.txt to results_name.txt

device：cuda device, i.e. 0 or 0,1,2,3 or cpu

adam：使用adam优化

multi-scale：多尺度训练，img-size +/- 50%

single-cls：单类别的训练集

6、训练结果查看

通过最后log可以看到训练好的模型的权重保存在了runs/train/exp（次数）/weights/last.pt和best.pt

其中还包括了PR Curve 曲线、Confusion matric （混淆矩阵）、results.png/txt 等训练过程数据，如下：

7、训练过程中的可视化：

我们可以在模型训练过程时，查看模型权重、损失、精确度、网络结构等的可视化，这里需要使用tensorboard工具进行可视化（需要提前安装）

在项目根路径执行：tensorboard --logdir runs\train

并浏览器打开http://localhost:6006/

8. 测试训练后的模型：

同样使用detect.py，weights使用新训练后的best.pt，测试图片可以拍一个新照片，或者找一个之前没有用到的图片，执行以下命令：

python detect.py --weights runs/train/exp/weights/best.pt --source data/test/Tc400_137.jpg

注意，上面的一些参数要换成自己的，如测试图片的路径，权重的路径等

最后，到run文件夹下查看测试结果。

以上就是使用labelImg工具自己制作数据集，并用于yolov5来训练模型的操作步骤。只是演示，谈不上训练模型的精度和效果，如要要基于某个任务，使用yolo模型进行改进，那么还需要更多的研究工作，如数据集的大小、数据增强、网络结构的调整、超参数的设置等。

你可能感兴趣的:(深度学习,目标检测,YOLO,深度学习,人工智能)

智能教育：DeepSeek在个性化学习中的创新应用 Evaporator Core #DeepSeek快速入门系统架构设计师 DeepSeek进阶开发与应用聚类数据挖掘机器学习
教育是塑造未来的基石，而个性化学习则是现代教育的重要趋势。随着人工智能技术的飞速发展，教育领域正迎来一场深刻的变革。DeepSeek作为人工智能领域的领军者，正在通过其强大的技术能力，推动个性化学习的创新应用。一、个性化学习路径：从数据到洞察个性化学习的核心在于根据学生的学习数据，生成定制化的学习路径。DeepSeek通过深度学习算法，能够从海量的学习数据中提取关键信息，生成更加精准的学习建议。f
【DeepSeek R1构建本地RAG知识库】应用框架选型对比（MaxKB、Dify、FastGPT、RagFlow、Anything-LLM） Xd聊架构从0到1落地AI人工智能 rag ai 知识库
文章目录前言一、MaxKB1.简介2.技术概览二、Dify1.简介2.技术概览三、FastGPT1.简介四、RagFlow1.简介2.技术概览五、Anything-LLM1.简介2.技术概览六、更多资料1.LLM框架推荐2.RAG生产落地实践架构七、总结1.综合对比2.优缺点对比3.按需选择4.社区与支持5.部署与使用便捷性结尾前言在人工智能技术加速渗透各行各业的今天，检索增强生成（Retriev
分布式多卡训练(DDP)踩坑 m0_54804970 面试学习路线阿里巴巴分布式
多卡训练最近在跑yolov10版本的RT-DETR，用来进行目标检测。单卡训练语句（正常运行）：pythonmain.py多卡训练语句：需要通过torch.distributed.launch来启动，一般是单节点，其中CUDA_VISIBLE_DEVICES设置用的显卡编号，也可以不用，直接在main.py里面指定device也行，–nproc_pre_node每个节点的显卡数量。python-m
DeepSeek + IDEA 辅助编程王炸组合猫猫姐大模型 java 大模型
DeepSeek+IDEA辅助编程王炸组合2025年的春节可以说是人工智能在中国史上飘红的一段历史时刻，年后上班的第一天，便马不停蹄的尝试新技能。今天的科技在飞速发展，编程领域的人工智能工具犹如雨后春笋般涌现。其中，DeepSeek则以其卓越的性能和智能化的功能，迅速在众多开发者中赢得了青睐。对于Java开发者而言，将DeepSeek集成到IDEA中，就如同为自己的编程之路配备了一位智能助手，大幅
Lucene硬核解析专题系列（三）：查询解析与执行 yinlongfei_love lucene mybatis 全文检索
Lucene的索引构建为高效搜索奠定了基础，而查询解析与执行则是将用户意图转化为实际结果的关键环节。本篇将从查询的解析开始，逐步深入到查询类型、评分模型和执行流程，揭示Lucene搜索能力的底层原理。一、查询语法与QueryParser的工作原理Lucene的查询过程始于用户输入的搜索字符串，例如“人工智能AND机器学习”。这一字符串需要被解析为Lucene能够理解的结构化对象。QueryPars
虚拟现实与增强现实：DeepSeek在沉浸式体验中的创新应用 Evaporator Core #DeepSeek快速入门人工智能 #深度学习 AI写作
在科技飞速发展的今天，虚拟现实（VR）和增强现实（AR）技术正在深刻改变我们的生活方式和交互体验。某知名科技评论家张华曾指出："VR和AR的潜力远未被完全挖掘，尤其是在与人工智能结合后，它们将带来前所未有的沉浸式体验。"DeepSeek作为人工智能领域的先锋，正在通过其强大的技术能力，推动VR和AR技术在沉浸式体验中的创新应用。一、VR与AR的技术融合VR和AR的核心在于为用户提供沉浸式的交互体验
微软官宣！Skype将在2025年5月5日正式退役，全面押注Teams 新加坡内哥谈技术人工智能自然语言处理语言模型深度学习学习 microsoft
每周跟踪AI热点新闻动向和震撼发展想要探索生成式人工智能的前沿进展吗？订阅我们的简报，深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同，从行业内部的深度分析和实用指南中受益。不要错过这个机会，成为AI领域的领跑者。点击订阅，与未来同行！订阅：https://rengongzhineng.io/23年传奇落幕，Skype正式告别历史舞台！微软宣布，这款曾经引领互联网通话革命的应用将
YOLO 中 SPFF 模块的优化与 Focal Modulation 替代研究向哆哆 YOLO yolov8
文章目录1.YOLO中的SPPF模块分析2.FocalModulation简介3.在YOLO中用FocalModulation替换SPPF4.实验与对比分析4.1代码替换YOLO模型中的SPPF4.2训练对比5.AblationStudy（消融实验）5.1不同模块的对比实验5.2目标尺寸对比分析6.模型部署与推理优化6.1ONNX加速推理6.2适配JetsonNano7.进一步优化方向8.在YOL
NLP自然语言处理——文本处理的基本方法小村学长毕业设计自然语言处理人工智能
NLP（自然语言处理）是人工智能领域的一个重要分支，它专注于使计算机能够理解和生成人类语言。文本处理是NLP中的基础且核心的部分，涉及多个步骤和技术，以确保原始文本数据能够被有效地转换、分析和利用。以下是对文本处理基本方法的详细探讨，包括文本预处理、文本表示、以及常见的NLP任务等。一、文本预处理文本预处理是NLP中的第一步，也是至关重要的一步。它主要包括以下几个子步骤：文本清洗：去除特殊字符：移
【WOA-CNN-LSTM】基于鲸鱼算法优化深度学习预测模型的超参数研究（Matlab代码实现）然哥爱编程深度学习 cnn lstm
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述2运行结果3参考文献4Matlab代码实现1概述摘要：深度学习模型的超参数选择对模型的性能和泛化能力具有重要影响。本文提出了一种基于鲸鱼算法（WOA）优化长短期记忆神经网络（LSTM）模型的超参数选择方法。首先，我们介绍了LSTM模型的结构和训练过程。然后，我们
AI视觉觉醒：深度学习如何革新视频标注，释放数据潜力基于深度学习的视频自动标注系统海棠AI实验室 AI理论探索与学术前沿人工智能深度学习音视频
目录引言：被忽视的视频数据金矿传统视频标注的困境：效率、成本与瓶颈深度学习：视频自动标注的破局之道深度学习视频自动标注系统架构系统架构图核心技术解析目标检测（ObjectDetection）行为识别（ActionRecognition）视频分割（VideoSegmentation）代码实践：基于YOLOv5的目标检测视频标注示例挑战与未来展望结语：AI赋能，释放视频数据的无限可能引言：被忽视的视频
自然语言处理：文本表示梦丶晓羽 python Glove Word2Vec TF-IDF 自然语言处理人工智能
介绍大家好，博主又来给大家分享知识了。今天给大家分享的内容是自然语言处理中的文本表示。在当今数字化信息爆炸的时代，自然语言处理作为人工智能领域的重要分支，发挥着越来越关键的作用。而文本表示，则是自然语言处理的基石之一，它就像是一把神奇的钥匙，能够将人类丰富多样、充满语义的自然语言，转化为计算机可以理解和处理的形式。话不多说，我们直接进入正题。文本表示概念阐述在自然语言处理(NLP)中，文本表示是将
活在AI原生时代的05后，开始用AI创业 shelly聊AI AI行业趋势 AI-native 人工智能 deepseek
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）凌晨1点，14岁的王泽恺在电脑前伸了个懒腰。屏幕
GPT-5倒计时：2025年AI海啸来袭，机器与人类对话临近 shelly聊AI AI核心技术 AI行业趋势 gpt 人工智能 openai
大家好，我是Shelly，一个专注于输出AI工具和科技前沿内容的AI应用教练，体验过300+款以上的AI应用工具。关注科技及大模型领域对社会的影响10年+。关注我一起驾驭AI工具，拥抱AI时代的到来。人工智能&AIGC术语100条Shelly聊AI-重磅发布Shelly聊AI：年度展望：2025年AI与社会发展关键事件的深度思考（每年一篇，十年为期）从实验室到现实，AI的进化速度正在挑战人类想象的
DeepSeek与数据分析：现状、挑战与未来展望 CodeJourney. 数据库人工智能算法
在当今数字化时代，人工智能（AI）的浪潮正以前所未有的速度席卷各个领域，数据分析作为众多行业决策的关键支撑，也不可避免地受到AI技术发展的深刻影响。近期，AI话题持续火热，不少企业老板要求员工学习AI并将其应用纳入考核。在此背景下，本文作者“紫苜”（原“蒋公子”）对频繁登上热搜的DeepSeek展开了探索，深入研究它在数据分析领域的能力、应用方式以及与其他工具的比较。DeepSeek在数据分析方面
DeepSeek-R1：重新定义推理性能的开源人工智能知识小报童 DeepSeek前言内容整理开源人工智能深度学习机器学习神经网络自然语言处理语言模型
目录重新定义卓越的基准变革性应用案例技术创新后训练优化冷启动数据以提高可用性可扩展性蒸馏模型API集成：为开发者而生竞争定价：可及的高级人工智能开源优势DeepSeek代表的引用推动开放人工智能的边界推动边界意味着什么？挑战与未来方向影响与愿景2025年1月20日–DeepSeek推出了DeepSeek-R1，这是一款突破性的开源人工智能推理模型，旨在与OpenAI的o1等专有对手竞争。该模型在M
无人系统：未来科技的智能化代表给生活加糖！热门知识科技
无人系统（UnmannedSystems）是指在不依赖人类直接干预的情况下，通过自主或远程控制方式完成任务的系统。随着科技的不断进步，特别是在人工智能、机器人学、传感技术、通信技术等领域的突破，无人系统在各行各业中得到了广泛的应用，逐渐改变着传统的生产、服务和管理模式。无人系统的典型代表包括无人驾驶汽车、无人机（UAV）、无人船（USV）、无人地面车辆（UGV）等。一、无人系统的定义与类型无人系统
XLNet：超越BERT的新星 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
-XLNet：超越BERT的新星1.背景介绍1.1自然语言处理的重要性自然语言处理(NaturalLanguageProcessing,NLP)是人工智能领域的一个重要分支,旨在使计算机能够理解和生成人类语言。随着大数据时代的到来,海量的自然语言数据不断涌现,对NLP技术的需求与日俱增。NLP技术已广泛应用于机器翻译、智能问答、信息检索、情感分析等诸多领域,为人类生产和生活带来了巨大便利。1.2预
Svelte 开发 AI 应用：高效轻量级前端框架的 AI 集成探索赵大仁大语言模型前端 AI 人工智能前端框架
Svelte开发AI应用：高效轻量级前端框架的AI集成探索1.引言人工智能（AI）与Web应用的结合已经成为前端开发的重要趋势。传统上，Vue、React等框架常用于AI前端交互，而Svelte作为一款编译时优化的前端框架，以轻量级、高性能、无运行时的特点，成为AI应用开发的新选择。本文将探讨如何利用Svelte构建高效的AI应用，包括AIAPI集成、前端推理优化、可视化分析、Web组件开发等关键
Python之使用动态导包优化软件加载速度 Sherry Wangs Python开发实践 python 开发语言
在开发大型Python软件时，可能会遇到以下问题：由于静态导入了大量模块，导致软件启动时间过长，用户体验不佳。例如，一个复杂的桌面应用程序或Web服务可能依赖于多个大型库（如numpy、pandas、torch或Yolo），这些库在启动时被静态导入，即使某些功能模块在启动时并不需要立即使用。这种情况下，静态导入会显著增加软件的启动时间，故使用动态导入。文章目录1.静态导入（StaticImport
DeepSeek R1：揭示适度思考在信息处理中的关键作用耶耶Norsea 网络杂烩人工智能
摘要DeepSeekR1是一款先进的大型推理模型，研究发现其在信息过载时性能显著下降。当减少过度思考，即不过度分析信息时，DeepSeekR1的计算成本可降低43%。这表明适度思考有助于提高信息处理效率并减少资源消耗，为优化人工智能模型提供了新的视角。关键词DeepSeekR1,信息过载,推理模型,计算成本,适度思考一、适度思考与信息处理效率1.1DeepSeekR1推理模型的特性概述DeepSe
深入解析Python机器学习库Scikit-Learn的应用实例 caihuayuan5 面试题汇总与解析 spring boot java 后端大数据课程设计
深入解析Python机器学习库Scikit-Learn的应用实例随着人工智能和数据科学领域的迅速发展，机器学习成为了当下最炙手可热的技术之一。而在机器学习领域，Python作为一种功能强大且易于上手的编程语言，拥有庞大的生态系统和丰富的机器学习库。其中，Scikit-Learn作为Python中一个重要的机器学习库，包含了许多常用的机器学习算法和工具，可用于数据挖掘、数据分析和预测建模等应用场景。
基于YOLOv5的无人超市商品检测：食品、饮料、零食与家居用品深度学习&目标检测实战项目 YOLO 目标跟踪深度学习人工智能 ui
引言随着人工智能技术的快速发展，尤其是计算机视觉的提升，无人超市的概念逐渐成为现实。在无人超市中，商品的智能化管理和检测是其顺利运行的关键。商品检测不仅要实现高效、准确的物品识别，还要支持多种商品类别的实时检测，以保证购物体验的顺畅与安全。在此背景下，深度学习与目标检测算法，如YOLOv5，成为了实现这一目标的重要工具。YOLOv5作为目前最先进且高效的目标检测算法之一，其应用范围广泛，包括人脸检
STM32实战开发（166）：智能体育器材管理系统：基于STM32和LSTM技术的实现方案嵌入式开发项目 stm32 lstm 嵌入式硬件单片机 struts 能源
1.引言随着物联网、人工智能技术的不断发展，智能体育器材管理系统逐渐成为体育行业的热点。传统的体育器材管理方式往往依赖人工统计、人工管理，容易导致数据失真和管理不及时等问题。因此，基于STM32微控制器和LSTM（长短期记忆网络）模型的智能体育器材管理系统应运而生，结合物联网技术、传感器技术、数据分析算法等，能够为体育器材的管理提供更加高效、智能的解决方案。2.STM32微控制器概述STM32是一
[论文阅读]DAMO-YOLO——实时目标检测设计报告一朵小红花HH 知识蒸馏目标检测 YOLO 目标检测目标跟踪论文阅读人工智能
DAMO-YOLODAMO-YOLO:AReportonReal-TimeObjectDetectionDesign实时目标检测设计报告论文网址：DAMO-YOLO简读论文这篇论文介绍了一个名为DAMO-YOLO的新型目标检测方法,相比YOLO系列的其他方法有着更好的性能。该方法的优势来自于几项新技术:使用了MAE-NAS作为骨干网络,可以自动搜索出不同延迟预算下的优化网络结构。MAE-NAS被称
基于YOLOv5的野生动物检测与监控系统：猫、狗、鸟、猴子、狮子、老虎、象的实时识别与分析深度学习&目标检测实战项目 YOLO 目标跟踪人工智能深度学习 ui 目标检测机器学习
1.引言随着人工智能技术的飞速发展，尤其是深度学习在计算机视觉领域的突破，目标检测技术已广泛应用于各类场景。从城市交通监控到安防系统，再到野生动物保护和生态监测，目标检测技术为我们提供了实时、精确的解决方案。在众多目标检测算法中，YOLO（YouOnlyLookOnce）系列因其高效性和实时性，已成为解决多类别目标检测任务的首选方法。本文将介绍如何使用YOLOv5进行野生动物检测与监控，包括猫、狗
LLaMA Factory添加新模型template的实战解析 herosunly 大模型 llama factory 新模型 template 实战解析
大家好，我是herosunly。985院校硕士毕业，现担任算法研究员一职，热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委，编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
《解锁万相2.1大模型：开启视频创作新世界》：此文为AI自动生成空云风语人工智能音视频人工智能
《解锁万相2.1大模型：开启视频创作新世界》：此文为AI自动生成万相2.1大模型初印象在人工智能飞速发展的当下，大模型领域的每一次突破都备受瞩目。2025年2月25日晚间，阿里巴巴带来了一个令人振奋的消息：阿里云视频生成大模型万相2.1（Wan）正式开源。这一消息瞬间在AI圈引发了广泛关注，也让众多开发者和视频创作爱好者们对万相2.1充满了期待。万相2.1作为阿里云通义系列AI模型的重要成员，自发
电商图书行业类目AI导购Agent系统详细设计与开发实战 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍随着电子商务的蓬勃发展，图书行业也迎来了线上销售的黄金时代。然而，海量的图书种类、复杂的读者需求，使得用户在选购图书时常常面临选择困难。传统的搜索和推荐方式往往无法精准匹配用户的个性化需求，导致用户体验不佳，转化率低。为了解决这一痛点，AI导购Agent系统应运而生。该系统利用人工智能技术，模拟专业的图书导购员，为用户提供个性化的图书推荐和导购服务。通过深度学习、自然语言处理等技术，A
PyTorch数据加载：实战入门秋‍. pytorch 人工智能 python 数据加载
"好的数据加载是成功训练的第一步"一、为什么要用DataLoader？当我们刚开始学习深度学习时，常常会这样处理数据：#传统方式加载数据images=[...]#所有图片数据labels=[...]#所有标签foriinrange(0,len(images),32):batch_images=images[i:i+32]batch_labels=labels[i:i+32]#训练代码...这种方式
关于旗正规则引擎规则中的上传和下载问题何必如此文件下载压缩 jsp 文件上传
文件的上传下载都是数据流的输入输出，大致流程都是一样的。一、文件打包下载 1.文件写入压缩包 string mainPath="D:\upload\"; 下载路径 string tmpfileName=jar.zip; &n
【Spark九十九】Spark Streaming的batch interval时间内的数据流转源码分析 bit1129 Stream
以如下代码为例（SocketInputDStream）： Spark Streaming从Socket读取数据的代码是在SocketReceiver的receive方法中，撇开异常情况不谈(Receiver有重连机制，restart方法，默认情况下在Receiver挂了之后，间隔两秒钟重新建立Socket连接)，读取到的数据通过调用store(textRead)方法进行存储。数据
spark master web ui 端口8080被占用解决方法 daizj 8080 端口占用 spark master web ui
spark master web ui 默认端口为8080，当系统有其它程序也在使用该接口时，启动master时也不会报错，spark自己会改用其它端口，自动端口号加1，但为了可以控制到指定的端口，我们可以自行设置，修改方法： 1、cd SPARK_HOME/sbin 2、vi start-master.sh 3、定位到下面部分
oracle_执行计划_谓词信息和数据获取周凡杨 oracle 执行计划
oracle_执行计划_谓词信息和数据获取(上) 一：简要说明在查看执行计划的信息中，经常会看到两个谓词filter和access，它们的区别是什么，理解了这两个词对我们解读Oracle的执行计划信息会有所帮助。简单说，执行计划如果显示是access，就表示这个谓词条件的值将会影响数据的访问路径（表还是索引），而filter表示谓词条件的值并不会影响数据访问路径，只起到
spring中datasource配置 g21121 dataSource
datasource配置有很多种，我介绍的一种是采用c3p0的，它的百科地址是： http://baike.baidu.com/view/920062.htm  <bean name="propertiesConfig" class="org.springframework.b
web报表工具FineReport使用中遇到的常见报错及解决办法（三）老A不折腾 finereport FAQ 报表软件
这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、repeated column width is largerthan paper width：这个看这段话应该是很好理解的。比如做的模板页面宽度只能放
mysql 用户管理墙头上一根草 linux mysql user
1.新建用户 //登录MYSQL@>mysql -u root -p@>密码//创建用户mysql> insert into mysql.user(Host,User,Password) values(‘localhost’,'jeecn’,password(‘jeecn’));//刷新系统权限表mysql>flush privileges;这样就创建了一个名为：
关于使用Spring导致c3p0数据库死锁问题 aijuans spring Spring 入门 Spring 实例 Spring3 Spring 教程
这个问题我实在是为整个 springsource 的员工蒙羞如果大家使用 spring 控制事务，使用 Open Session In View 模式， com.mchange.v2.resourcepool.TimeoutException: A client timed out while waiting to acquire a resource from com.mchange.
百度词库联想 annan211 百度
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> <title>RunJS</title&g
int数据与byte之间的相互转换实现代码百合不是茶位移 int转byte byte转int 基本数据类型的实现
在BMP文件和文件压缩时需要用到的int与byte转换,现将理解的贴出来; 主要是要理解;位移等概念 http://baihe747.iteye.com/blog/2078029 int转byte; byte转int; /** * 字节转成int,int转成字节 * @author Administrator *
简单模拟实现数据库连接池 bijian1013 java thread java多线程简单模拟实现数据库连接池
简单模拟实现数据库连接池实例1： package com.bijian.thread; public class DB { //private static final int MAX_COUNT = 10; private static final DB instance = new DB(); private int count = 0; private i
一种基于Weblogic容器的鉴权设计 bijian1013 java weblogic
服务器对请求的鉴权可以在请求头中加Authorization之类的key，将用户名、密码保存到此key对应的value中，当然对于用户名、密码这种高机密的信息，应该对其进行加砂加密等，最简单的方法如下： String vuser_id = "weblogic"; String vuse
【RPC框架Hessian二】Hessian 对象序列化和反序列化 bit1129 hessian
任何一个对象从一个JVM传输到另一个JVM，都要经过序列化为二进制数据(或者字符串等其他格式，比如JSON)，然后在反序列化为Java对象，这最后都是通过二进制的数据在不同的JVM之间传输(一般是通过Socket和二进制的数据传输)，本文定义一个比较符合工作中。 1. 定义三个POJO Person类 package com.tom.hes
【Hadoop十四】Hadoop提供的脚本的功能 bit1129 hadoop
1. hadoop-daemon.sh 1.1 启动HDFS ./hadoop-daemon.sh start namenode ./hadoop-daemon.sh start datanode 通过这种逐步启动的方式，比start-all.sh方式少了一个SecondaryNameNode进程，这不影响Hadoop的使用，其实在 Hadoop2.0中，SecondaryNa
中国互联网走在“灰度”上 ronin47 管理灰度
中国互联网走在“灰度”上（转）文/孕峰第一次听说灰度这个词，是任正非说新型管理者所需要的素质。第二次听说是来自马化腾。似乎其他人包括马云也用不同的语言说过类似的意思。灰度这个词所包含的意义和视野是广远的。要理解这个词，可能同样要用“灰度”的心态。灰度的反面，是规规矩矩，清清楚楚，泾渭分明，严谨条理，是决不妥协，不转弯，认死理。黑白分明不是灰度，像彩虹那样
java-51-输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。 bylijinnan java
public class PrintMatrixClockwisely { /** * Q51.输入一个矩阵，按照从外向里以顺时针的顺序依次打印出每一个数字。例如：如果输入如下矩阵： 1 2 3 4 5 6 7 8 9
mongoDB 用户管理开窍的石头 mongoDB用户管理
1:添加用户第一次设置用户需要进入admin数据库下设置超级用户（use admin） db.addUsr({user:'useName',pwd:'111111',roles:[readWrite,dbAdmin]}); 第一个参数用户的名字第二个参数
[游戏与生活]玩暗黑破坏神3的一些问题 comsci 生活
暗黑破坏神3是有史以来最让人激动的游戏。。。。但是有几个问题需要我们注意玩这个游戏的时间，每天不要超过一个小时，且每次玩游戏最好在白天结束游戏之后，最好在太阳下面来晒一下身上的暗黑气息，让自己恢复人的生气 &nb
java 二维数组如何存入数据库 cuiyadll java
using System; using System.Linq; using System.Text; using System.Windows.Forms; using System.Xml; using System.Xml.Serialization; using System.IO; namespace WindowsFormsApplication1 {
本地事务和全局事务Local Transaction and Global Transaction(JTA) darrenzhu java spring local global transaction
Configuring Spring and JTA without full Java EE http://spring.io/blog/2011/08/15/configuring-spring-and-jta-without-full-java-ee/ Spring doc -Transaction Management http://docs.spring.io/spri
Linux命令之alias - 设置命令的别名，让 Linux 命令更简练 dcj3sjt126com linux alias
用途说明设置命令的别名。在linux系统中如果命令太长又不符合用户的习惯，那么我们可以为它指定一个别名。虽然可以为命令建立“链接”解决长文件名的问题，但对于带命令行参数的命令，链接就无能为力了。而指定别名则可以解决此类所有问题【1】。常用别名来简化ssh登录【见示例三】，使长命令变短，使常用的长命令行变短，强制执行命令时询问等。常用参数格式：alias 格式：ali
yii2 restful web服务[格式响应] dcj3sjt126com PHP yii2
响应格式当处理一个 RESTful API 请求时，一个应用程序通常需要如下步骤来处理响应格式：确定可能影响响应格式的各种因素，例如媒介类型，语言，版本，等等。这个过程也被称为 content negotiation。资源对象转换为数组，如在 Resources 部分中所描述的。通过 [[yii\rest\Serializer]]
MongoDB索引调优（2）——[十] eksliang mongodb MongoDB索引优化
转载请出自出处：http://eksliang.iteye.com/blog/2178555 一、概述上一篇文档中也说明了，MongoDB的索引几乎与关系型数据库的索引一模一样，优化关系型数据库的技巧通用适合MongoDB，所有这里只讲MongoDB需要注意的地方二、索引内嵌文档可以在嵌套文档的键上建立索引，方式与正常
当滑动到顶部和底部时，实现Item的分离效果的ListView gundumw100 android
拉动ListView，Item之间的间距会变大，释放后恢复原样； package cn.tangdada.tangbang.widget; import android.annotation.TargetApi; import android.content.Context; import android.content.res.TypedArray; import andr
程序员用HTML5制作的爱心树表白动画 ini JavaScript jquery Web html5 css
体验效果：http://keleyi.com/keleyi/phtml/html5/31.htmHTML代码如下： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"><head><meta charset="UTF-8" > <ti
预装windows 8 系统GPT模式的ThinkPad T440改装64位 windows 7旗舰版 kakajw ThinkPad 预装改装 windows 7 windows 8
该教程具有普遍参考性，特别适用于联想的机器，其他品牌机器的处理过程也大同小异。该教程是个人多次尝试和总结的结果，实用性强，推荐给需要的人！缘由小弟最近入手笔记本ThinkPad T440，但是特别不能习惯笔记本出厂预装的Windows 8系统，而且厂商自作聪明地预装了一堆没用的应用软件，消耗不少的系统资源（本本的内存为4G，系统启动完成时，物理内存占用比
Nginx学习笔记 mcj8089 nginx
一、安装nginx 1、在nginx官方网站下载一个包，下载地址是： http://nginx.org/download/nginx-1.4.2.tar.gz 2、WinSCP(ftp上传工
mongodb 聚合查询每天论坛链接点击次数 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 18 */ { "_id" : ObjectId("5596414cbe4d73a327e50274"), "msgType" : "text", "sendTime" : ISODate("2015-07-03T08:01:16.000Z"
java术语（PO/POJO/VO/BO/DAO/DTO） Luob. DAO POJO DTO po VO BO
PO(persistant object) 持久对象在o/r 映射的时候出现的概念,如果没有o/r映射,就没有这个概念存在了.通常对应数据模型(数据库),本身还有部分业务逻辑的处理.可以看成是与数据库中的表相映射的java对象.最简单的PO就是对应数据库中某个表中的一条记录,多个记录可以用PO的集合.PO中应该不包含任何对数据库的操作. VO(value object) 值对象通
算法复杂度 Wuaner Algorithm
Time Complexity & Big-O： http://stackoverflow.com/questions/487258/plain-english-explanation-of-big-o http://bigocheatsheet.com/ http://www.sitepoint.com/time-complexity-algorithms/

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他