E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MindSpore训练
Python—JSON格式标签转换为TXT格式标签详细教程2(附完整代码)
这个代码主要是解析一个json文件转换成多个txt文件使用的,尤其是便于yolo
训练
decode_json函数中的convert函数确实是用于将坐标缩放到0-1之间的。
资源补给站
·
2025-03-17 01:16
python
图像处理
笔记
python
json
开发语言
AI技术学习笔记系列001:FastLanguageModel.get_peft_model 函数各参数的详细解释
FastLanguageModel.get_peft_model函数各参数的详细解释,以及企业实际微调时的选择考量:参数详解及对微调的影响1.r=32(秩)作用:控制LoRA适配器的低秩矩阵的维度(秩),直接影响可
训练
参数数量
新说一二
·
2025-03-17 00:43
人工智能
学习
笔记
PyTorch 实现 Conditional DCGAN(条件深度卷积生成对抗网络)进行图像到图像转换的示例代码
该代码包含
训练
和可视化部分,假设输入为图片和4个工艺参数,根据这些输入生成相应的图片。
max500600
·
2025-03-16 23:04
算法
python
YOLO
深度学习
人工智能
【人工智能基础2】机器学习、深度学习总结
人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数:四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络
训练
方法一
roman_日积跬步-终至千里
·
2025-03-16 23:02
人工智能习题
人工智能
机器学习
深度学习
一文搞懂 AI Agent 与 AI 大模型的区别
Manus:Manus定义与核心能力AI大模型AI大模型是基于深度学习架构,通过海量数据
训练
得到的复杂模型,像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力,
a小胡哦
·
2025-03-16 23:02
人工智能
Manus
Ai
agent
代码随想录算法
训练
营第 20 天 | LeetCode235. 二叉搜索树的最近公共祖先 LeetCode701.二叉搜索树中的插入操作 LeetCode 450.删除二叉搜索树中的节点
代码随想录算法
训练
营Day20代码随想录算法
训练
营第20天|LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点目录代码随想录算法
训练
营前言
HIT最菜电控
·
2025-03-16 23:01
代码随想录算法训练营
算法
leetcode
数据结构
c++
一周热点:微软攻克语音输入、文本输出难题-Phi-4-multimodal
它通过创新的架构和
训练
方法,实现了在不同模态之间的无缝交互,为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构,通过LoRA(
数据分析能量站
·
2025-03-16 22:57
机器学习
人工智能
Adobe Firefly 技术浅析(三):GANs 的改进
生成式对抗网络(GANs)在图像生成领域取得了显著的进展,但原始的GANs在
训练
稳定性、生成质量以及多样性方面存在一些挑战。
爱研究的小牛
·
2025-03-16 21:50
AIGC——图像
AIGC—生成对抗网络
AIGC
机器学习
深度学习
关于stable diffusion的lora
训练
在linux远程工作站的部署
在学校Arc中部署loratraining,一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。安装anaconda或者miniconda(官网上也有教程):wgethttps://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.shchmod+xAnaconda3-5.3.0-Linux-x8
回天一梦
·
2025-03-16 19:02
stable
diffusion
python
经验分享
新手村:混淆矩阵
《PythonCrashCourse》或在线教程(如Codecademy)scikit-learn基础掌握模型
训练
、预测、评估的基
嘉羽很烦
·
2025-03-16 18:28
机器学习
机器学习
即插即用模块--KANLinear
在相同迭代次数下超越传统MLP,不仅
训练
速度更快,收敛性更好,而且在拟合复杂函数时的精度也明显提高。
苏格拉没有鞋底
·
2025-03-16 17:51
模型训练
深度学习
人工智能
python
机器学习——正则化、欠拟合、过拟合、学习曲线
过拟合(overfitting):模型只能拟合
训练
数据的状态。即过度
训练
。
代码的建筑师
·
2025-03-16 17:51
学习记录
机器学习
机器学习
学习曲线
过拟合
欠拟合
正则化
IMWeb提升营Day4 |
训练
题19:顺时针打印矩阵
题目描述输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下矩阵:12345678910111213141516则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.12345678910111213141516123456789101112131415161718192021222324252627282930313233343
rical730
·
2025-03-16 17:19
Web开发
算法
基于DeepSeek R1构建下一代Manus通用型AI智能体的技术实践
目录一、技术背景与目标定位1.1大模型推理能力演进趋势1.2DeepSeekR1核心特性解析-混合专家架构(MoE)优化-组相对策略优化(GRPO)原理-多阶段强化学习
训练
范式1.3Manus智能体框架设计理念
zhangjiaofa
·
2025-03-16 15:08
DeepSeek
R1&
AI人工智能大模型
DeepSeek
Manus
智能体
AI
大语言模型微调和大语言模型应用区别
大语言模型微调和大语言模型应用区别微调与应用LLM的区别微调大语言模型(LLM)是指取一个已经预
训练
好的模型,进一步用特定数据集
训练
,使其更好地适应某个任务或领域,比如为医疗聊天机器人优化医疗术语理解。
AI Echoes
·
2025-03-16 15:34
深度学习
人工智能
自然语言处理
呵护斜颈老人:解锁护理关键,重塑健康生活
康复
训练
是护理的关键环节。鼓
全力以赴66
·
2025-03-16 15:31
生活
大规模语言模型从理论到实践 开源指令数据集
这些模型的成功离不开庞大的
训练
数据集和复杂的算法架构。然而,如何有效地构建和利用开源指令数据集,仍然是一个值得深入探讨的话题。2.核
AI天才研究院
·
2025-03-16 13:17
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Python3 【项目实战】深度解析:赛跑成绩统计分析工具
本工具通过程序化处理赛跑数据,自动计算各选手成绩及整体统计指标,主要应用于:学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员
训练
数据分析2.技术定位:时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二
李智 - 重庆
·
2025-03-16 12:11
Python
精讲精练
-
从入门到实战
python
案例学习
编程技巧
时间处理
项目实战
主流开源大模型能力对比矩阵
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次
训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
基于 svm 的金融咨询情感分析
金融咨询处理1.利用7万多条利好/利空语料(已经标注好的,分为1正性,-1负性两类),首先采用B-gram卡方差提取特征词汇2.使用卡方提取的特征词为每一篇咨询建立向量表示模型3.使用向量进行svm分割,
训练
语料
ouprince
·
2025-03-16 10:28
NLP
svm
情感分析
KNN算法性能优化技巧与实战案例
一、核心性能瓶颈维度挑战描述计算复杂度单次预测需计算全部
训练
样本距离,时间复杂度为(n=样本数,d=特征维度)内存占用需全量存储
训练
数据,大规模数据集难以加载高维灾难高维数据中距离计算失去
可问 可问春风
·
2025-03-16 09:22
算法
性能优化
LLaMA-Factory
训练
数据默认使用 instruction、input、output 三个 key
在LLaMA-Factory进行SFT(Directivesupervisionfine-tuning指令监督微调)时,
训练
数据的格式非常重要,因为大模型依赖标准化的数据结构来学习指令-响应模式。
背太阳的牧羊人
·
2025-03-16 08:43
模型微调
llama
人工智能
大模型微调
Matlab多种算法解决未来杯B的多分类问题
1.读取数据首先,我们从Excel文件中读取
训练
集和测试集:2.
训练
集划分我们将80%的数据用于
训练
,20%用于验证。3.
训练
多个模型我们选取8种常见分类模型,并存储预测结果。
Subject.625Ruben
·
2025-03-16 06:05
算法
分类
机器学习
数学建模
未来杯
matlab
人工智能
【prompt实战】知乎问题解答专家
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-03-16 06:04
prompt实战应用案例
prompt
DeepSeek全栈开发指南:从代码生成到分布式
训练
的黑科技解析
一、DeepSeek技术新突破:程序员必须掌握的MoE架构实战2025年2月25日,DeepSeek开源了专为MoE模型设计的DeepEP通信库,这项技术革新直接影响了分布式
训练
和推理效率。
AI创享派
·
2025-03-16 06:00
后端
提出机器人自主学习新范式,深大团队最新顶会论文,刷新6大复杂任务SOTA
在多个高维度机器人任务上,在仅使用89%
训练
样本的情况下,比现有SOTA方法平均性能提升95.3%。众所周知,随着机器人技术的快速发展,其应用已渗透至日常生活和工业生产场景。
·
2025-03-16 04:50
量子位
数据处理和分析之数据降维:t-SNE:使用t-SNE进行数据可视化实践
降维不仅可以帮助我们更有效地存储和处理数据,还能在高维数据中发现潜在的模式和结构,这对于数据可视化和模型
训练
尤为重要。高维数据往往难以直观理解,通过降维,我们可以将其转换为二维或三维空间,便于可视化
kkchenkx
·
2025-03-16 04:17
数据挖掘
信息可视化
算法
聚类
均值算法
数据挖掘
机器学习
第20篇:从零开始构建NLP项目之电商用户评论分析:模型
训练
阶段
大家好,今天我们继续探讨如何从零开始构建一个NLP项目,特别是电商用户评论分析中的模型
训练
阶段。模型
训练
是NLP项目的核心环节,通过合理的调参和优化,可以显著提升模型性能。
Gemini技术窝
·
2025-03-16 04:46
自然语言处理
人工智能
深度学习
AIGC
机器学习
nlp
langchain
使用yolo
训练
自己的模型数据遇到的问题
1、报错:NolabelsfoundinD:\xxx\valid\labels.cache查找网上的文章大多都是说文件目录没按规定创建,但我检查了我的目录没问题,后来发现是labels文件夹里的txt文件和images文件夹的图片没有一一对应,对应好之后问题解决2、解决完上个问题之后还是不报上面的错了但还是FatalPythonerror:Aborted;Restartingkernel...检查
次次皮
·
2025-03-16 03:12
YOLO
深度学习
人工智能
【AI】Transformer布道:让AI学会“左顾右盼”的超级大脑!(扫盲帖)
你可以想象我们是从“什么是注意力”开始,一步步搭积木,直到把整个Transformer这台“机器”组装起来,然后再看看它能干什么、怎么
训练
、为什么厉害。
碣石潇湘无限路
·
2025-03-16 03:37
人工智能
transformer
深度学习
NPU的应用场景:从云端到边缘
模型
训练
加速:在大规模
训练
任务中,NPU可以作为加速单元,提升
训练
效率。2.边缘计算智能摄像头:在安防监控中,NPU可以实时处理视频流,实现目标检测和跟踪。
绿算技术
·
2025-03-16 02:29
NPU架构介绍
缓存
人工智能
科技
深度学习
NPU的工作原理:神经网络计算的流水线
NPU的工作原理可以概括为以下几个步骤:1.模型加载·将
训练
好的神经网络模型加载到NPU的内存中。2.数据输入·输入数据(如图像、语音)通过接口传输到NPU。
绿算技术
·
2025-03-16 02:28
NPU架构介绍
神经网络
人工智能
深度学习
孪生网络模型,当
训练
集与测试集共用一个数据集时,
训练
准确率为100%,而测试准确率仍在50%左右浮动
问题描述【问题】孪生网络模型,测试效果异常:当
训练
集与测试集共用一个数据集(样本、标签完全相同)时,
训练
准确率为100%,而测试准确率仍在50%左右浮动(正常来说测试的都
bug菌¹
·
2025-03-16 01:26
全栈Bug调优(实战版)
pytorch
机器学习
如何快速开发一款AI小程序?基于微信云开发的实战指南
本文将深入讲解如何利用微信云开发快速搭建一款AI小程序,展示从模型
训练
到云端部署的完整流程。准备工作在开始开发之前,确保完成以下准备工作:
一键难忘
·
2025-03-16 00:21
人工智能
小程序
微信
数据分布偏移检测:保障模型在生产环境中的稳定性
当
训练
数据与生产环境中的数据分布不一致时,即使是经过精心调优的模型也可能表现出明显的性能下降。本文将深入探讨数据分布偏移的检测方法,并提供一套系统化的解决方案,帮助读者构建更加稳健的机器学习系统。
trust Tomorrow
·
2025-03-16 00:18
机器学习
python
机器学习
人工智能
深度学习
Crawl4AI 与 BrowserUseTool 的详细对比
涵盖功能、技术实现、适用场景等核心维度:1.核心定位对比工具Crawl4AIBrowserUseTool类型专为AI优化的网络爬虫框架浏览器自动化工具(模拟人类操作浏览器)核心目标高效获取结构化数据供AI
训练
燃灯工作室
·
2025-03-15 23:42
Lmplement
人工智能
学习
数学建模
pytorch
训练
权重转化为tensorflow模型的教训
模型构建时候有时候在工程量比较大的时候,不可避免使用迭代算法,迭代算法本身会让错误的追踪更加困难,因此掌握基本的框架之间的差异非常重要。以下均是在模型转换过程中出现的错误。shuffleoperation(shuffle操作)这个操作原本是用来将各个通道之间的信息进行打乱后,此时面临重要的问题就是,如果将通道打乱,在pytorch里面与tensorflow中间,两种通道排序是不一样的,是采用不同的
小枫小疯
·
2025-03-15 21:57
深度学习部署模型转移
pytorch
tensorflow
人工智能
大模型工程师学习日记(十五):Hugging Face 模型微调
训练
(基于 BERT 的中文评价情感分析)
1.datasets库核心方法1.1.列出数据集使用datasets库,你可以轻松列出所有HuggingFace平台上的数据集:fromdatasetsimportlist_datasets#列出所有数据集all_datasets=list_datasets()print(all_datasets)1.2.加载数据集你可以通过load_dataset方法加载任何数据集:fromdatasetsim
MMMMMMMay Love Code
·
2025-03-15 20:52
学习
bert
人工智能
深度学习
自然语言处理
全量微调
DeepSeek:中国大模型 “破壁者” 引发的四大产业地震
一、算力霸权瓦解:低成本训推技术改写游戏规则1.1
训练
成本“悬崖式下降”DeepSeek通过混合专家架构(MoE)动态路由算法,在同等效果下将模型激活参数压缩
赵同学爱学习
·
2025-03-15 20:47
人工智能
chatgpt
DeepSeek
语言模型
大模型
开源
大语言模型的潜力是否被高估
以下从技术能力、应用局限性和未来发展方向三个方面综合分析:一、技术能力的争议:潜力与局限并存对现实世界的理解与模拟MIT的研究表明,LLM在
训练
过程中可能自发形成对现实世界的内部模拟。
dev.null
·
2025-03-15 19:12
AI
#
NLP
语言模型
人工智能
机器学习
**ResNet-SE + MFCC**
训练
框架,包括 **数据加载、
训练
流程**,以及 **混淆矩阵** 可视化示例
1.依赖库安装如果你还没安装相关库,请先执行:pipinstalltorchtorchaudiotorchvisionscikit-learnmatplotlibtqdm2.数据加载这里假设你有一个音频分类数据集,其文件结构如下:dataset/│──train/│├──class_0/││├──audio_0.wav││├──audio_1.wav│├──class_1/││├──audio_0
大霸王龙
·
2025-03-15 19:10
系统分析业务
矩阵
python
线性代数
人工智能
机器学习
深度学习
max_samples,batch_size,gradient_accumulation_steps这三个分别的联系和区别
这三个参数都是控制
训练
数据如何被处理的,它们的作用和区别如下:1.max_samples(最大样本数)定义:限制每个数据集最多使用多少条数据。
背太阳的牧羊人
·
2025-03-15 19:09
模型微调
batch
机器学习
人工智能
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预
训练
LLaMA-2—解析命令行参数→初始化配置(分布式
训练
环境colossalai+
训练
日志+加速插
LLMs之Colossal-LLaMA-2:源码解读(train.py文件)基于给定数据集实现持续预
训练
LLaMA-2—解析命令行参数→初始化配置(分布式
训练
环境colossalai+
训练
日志+加速插件
一个处女座的程序猿
·
2025-03-15 18:38
NLP/LLMs
精选(人工智能)-中级
Colossal-AI
LLaMA-2
大语言模型
自然语言处理
(大模型微调大模型学习路线大模型入门)_大模型 学习,吹爆!2025最详细的大模型学习路线已整理!手把手带你高效入门,大模型论文全打通!
大模型,通常指的是在人工智能领域中的大型预
训练
模型。你可以把它们想象成非常聪明的大脑,这些大脑通过阅读大量的文本、图片、声音等信息,学习到了世界的知识。
大模型老炮
·
2025-03-15 17:28
学习
人工智能
大模型学习
AI
大模型
大模型微调
大模型教程
L1-5 别再来这么多猫娘了!
言归正传,对于GPT类的AI,一个使用方式受到不少年轻用户的欢迎——将AI变成猫娘:当然,由于
训练
数据里并不区分道德或伦理倾向,因此如果不加审查,A
云格~
·
2025-03-15 16:22
团队天梯赛
算法
c++
训练
模型时,步长为什么不能太大也不能太小?
在
训练
模型时,步长(也称为学习率,LearningRate)是一个关键的超参数,它控制着每次参数更新的大小。
yuanpan
·
2025-03-15 16:52
人工智能
六十天前端强化
训练
之第十七天React Hooks 入门:useState 深度解析
=====欢迎来到编程星辰海的博客讲解======看完可以给一个免费的三连吗,谢谢大佬!目录一、知识讲解1.Hooks是什么?2.useState的作用3.基本语法解析4.工作原理5.参数详解a)初始值设置方式b)更新函数特性6.注意事项7.类组件对比8.常见问题解答二、核心代码示例三、实现效果四、学习要点总结五、扩展阅读推荐官方文档优质文章推荐学习路径进阶资源六、实践步骤一、表单输入控制二、动态
编程星辰海
·
2025-03-15 16:50
#
前端
前端
react.js
javascript
机器学习中的梯度到底是什么?(chat-gpt问答)
在机器学习中,我们通过不断调整参数,使目标函数达到最小值,从而实现模型的
训练
和学习。2、为什么梯度要求偏导来求解?梯度是一个向量,它的方向指向函数值增加最快的方向,其大小表示函数值的变化率。
湫怿
·
2025-03-15 16:19
机器学习
gpt
人工智能
梯度
大型语言模型与强化学习的融合:迈向通用人工智能的新范式——基于基础复现的实验平台构建
强化学习(RL)作为一种通过与环境交互学习最优策略的方法,在智能体
训练
中发挥着重要作用。本文旨在探索LLM与RL的深度融合,分析LLM如何赋能RL,并阐述这种融合对于迈向通用人工智能(AGI)的意义。
(initial)
·
2025-03-15 16:17
大模型科普
人工智能
强化学习
深度学习-服务器
训练
SparseDrive过程记录
1、cuda安装1.1卸载安装失败的cuda参考:https://blog.csdn.net/weixin_40826634/article/details/127493809注意:因为/usr/local/cuda-xx.x/bin/下没有卸载脚本,很可能是apt安装的,所以通过执行下面的命令删除:apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
weixin_40826634
·
2025-03-15 15:41
深度学习
服务器
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他