E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
solov2训练
【AI】使用Python实现机器学习小项目教程
通过这个项目,您将掌握机器学习的基本流程,包括数据加载、预处理、模型
训练
、评估和优化等步骤。论文AIGC检测,降AIGC检测,AI降重,三连私信免费获取:ReduceAIGC9折券!
丶2136
·
2025-03-17 18:21
AI
人工智能
python
机器学习
LORA 微调大模型:从入门到入土
在当今人工智能领域,预
训练
的大模型已经成为推动技术发展的核心力量。然而,在实际项目中,我们往往会发现这些预
训练
模型虽然强大,但直接就去应用于一些特定的任务时,往往无法完全满足需求。
大模型.
·
2025-03-17 17:49
人工智能
开发语言
gpt
agi
架构
大模型
【源码阅读】olmocr中的prompts
目录一、PDF转换为
训练
数据二、使用微调模型三、比较差异总结一、PDF转换为
训练
数据让ChatGPT-4将文档(如PDF文件)转换为结构化的“银级”
训练
数据(silvertrainingdata)#Thisisthepromptweuseforgettingchatgpt4otoconvertdocumentsintooursilvertrainingdatadefbuild_openai_sil
海绵波波107
·
2025-03-17 17:46
#
大模型
pdf
GAN模型的Python应用——生成对抗网络
两个神经网络相互博弈,通过一次次迭代
训练
,最终生成器可以生成足以骗过
代码编织匠人
·
2025-03-17 17:15
python
生成对抗网络
开发语言
如何使用Python实现生成对抗网络(GAN)
生成器负责生成与
训练
数据相似的新数据,而判别器负责判断输入数据是真实的还是由生成器生成的。这两个部分不断相互博弈,直到生成器能够生成非常逼真的数据,使判别器难以区分生成数据和真实数据。
「已注销」
·
2025-03-17 16:13
互联网前沿技术
韩进的创作空间
全栈开发知识库
python
生成对抗网络
tensorflow
深度学习
数据分析
ST-Align:一个包含430万
训练
样本,涵盖了15种细粒度多模态数据集
2025-01-15,由北航大学、合肥工业大学、中科院信息工程研究所和美团等机构联合创建介绍了一种名为LLaVA-ST的多模态大型语言模型。该模型配备了一个名为ST-Align的数据集,专为细粒度时空多模态理解设计。一、研究背景近年来,多模态大型语言模型(MLLMs)在多模态理解方面取得了显著进展,能够基于图像或视频生成对话或描述。然而,对于需要基于语言输入处理视觉坐标的细粒度多模态理解任务,现有
·
2025-03-17 15:12
数据集
s1K 数据集:是一个用于提升语言模型推理能力的高质量数据集。
一、研究背景近年来,语言模型(LMs)在大规模预
训练
的基础上取得了显著进展,其性能提升主要依赖于
训练
时计算资源的增加。然而,随着模型规模的不断扩大,
训练
成本也急剧上升。
·
2025-03-17 14:37
数据集
ChatGPT智能聊天机器人实现
技术架构与工具核心模型基座模型:HuggingFaceTransformers库(如GPT-2/GPT-3.5TurboAPI/LLaMA2)轻量化方案:微软DeepSpeed或MetaFairScale(降低显存占用)
训练
框架
云端源想
·
2025-03-17 14:57
chatgpt
机器人
训练
数据重复采样,让正负样本比例1:1
确保
训练
集数量相同:通过resample函数,你可以确保正
训练
集和负
训练
集的数量相同,即使其中一个集的数量小于另一个集的数量。如果n_train_num小于max_train_num,res
kimi-222
·
2025-03-17 14:24
机器学习
人工智能
深度学习
【北上广深杭大厂AI算法面试题】计算机视觉篇...详解目标检测中的多尺度
训练
和测试?
【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度
训练
和测试?【北上广深杭大厂AI算法面试题】计算机视觉篇…详解目标检测中的多尺度
训练
和测试?
努力毕业的小土博^_^
·
2025-03-17 14:53
AI算法题库
人工智能
计算机视觉
算法
深度学习
神经网络
目标检测
当大模型
训练
遇上“双向飙车”:DeepSeek开源周 DualPipe解析指南
前言在大模型
训练
中,传统流水线并行因单向数据流和通信延迟的限制,导致GPU利用率不足60%,成为算力瓶颈。
来自于狂人
·
2025-03-17 13:51
人工智能
gpu算力
算法
系统架构
Ollama 基本概念
通过Ollama,用户能够方便地与本地部署的大型预
训练
模型进行交互。1.模型(Model)在Ollama中,模型是核心组成部分。
Mr_One_Zhang
·
2025-03-17 13:47
学习Ollama
ai
【go从入门到精通】探秘struct结构体转json为什么需要首字母大写?
并且深耕深度学习和数据集
训练
,提供商业化的视觉人工智能检测和预警系统(煤矿,工厂,制造业
前网易架构师-高司机
·
2025-03-17 13:47
golang从入门到精通
golang
json
go
结构体首字母大写
golang从入门到精通
go从入门到精通
AI 大模型应用数据中心建设:高性能计算与存储架构
AI大模型、数据中心、高性能计算、存储架构、分布式
训练
、GPU加速、数据管理1.背景介绍近年来,人工智能(AI)技术取得了飞速发展,特别是深度学习模型的突破性进展,催生了一系列基于大规模数据
训练
的强大AI
AI智能涌现深度研究
·
2025-03-17 12:10
AI大模型应用入门实战与进阶
java
python
javascript
kotlin
golang
架构
人工智能
Python(1)Python全方位指南:定义、应用与零基础入门实战
跨领域通吃:从Web开发到AI
训练
,覆盖90%以上技术场景。企业级应用:YouTube用Python处理视频推荐,NAS
一个天蝎座 白勺 程序猿
·
2025-03-17 10:31
Python入门到精通
python
开发语言
AI大模型从入门到精通,2025终极指南!好卷啊,又不能躺平,只能悄悄卷你们了!
AI大模型是指使用大规模数据和强大的计算能力
训练
出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。为什么要学AI大模型?
大模型教程
·
2025-03-17 10:30
人工智能
大模型训练
LLM
知识库
大模型
大模型入门
大模型学习
【sklearn 04】DNN、CNN、RNN
DNNDNN(DeepNeuralNetworks,深度神经网络)是一种相对浅层机器学习模型具有更多参数,需要更多数据进行
训练
的机器学习算法CNNCNN(convolutionalNeuralNetworks
@金色海岸
·
2025-03-17 09:24
sklearn
dnn
cnn
【sklearn 02】监督学习、非监督下学习、强化学习
-第二类:监督学习(supervisedlearning),监督学习指的是使用带标签的数据去
训练
模型,并预测未知数据的标签。监督学习有两种,当预测
@金色海岸
·
2025-03-17 09:54
sklearn
学习
人工智能
跨域视线估计的协同对比学习(重点针对局部对比学习解释)
跨域视线估计的协同对比学习1.问题表述在视线估计领域中,跨域问题是指当
训练
数据和测试数据来自不同的领域(如不同的个体、光照条件、拍摄设备等)时,模型性能会显著下降。
阳光明媚大男孩
·
2025-03-17 09:50
学习
人工智能
DeepSeek 在代码生成方面的优势解析
文章将详细解析DeepSeek在代码生成方面的优势,包括模型架构、数据
训练
、优化策略、编程语言支持、推理效率等核心技术点。1.DeepSeek-Coder的模型架构优化DeepSeek-Code
草莓屁屁我不吃
·
2025-03-17 08:15
人工智能
ai
chatgpt
DeepSeek-R1模型1.5b、7b、8b、14b、32b、70b和671b有啥区别?
码笔记mabiji.com分享:1.5B、7B、8B、14B、32B、70B是蒸馏后的小模型,671B是基础大模型,它们的区别主要体现在参数规模、模型容量、性能表现、准确性、
训练
成本、推理成本和不同使用场景
facaixxx2024
·
2025-03-17 06:01
AI大模型
人工智能
算法
深度学习
从零开始大模型开发与微调:PyCharm的下载与安装
PyTorch和TensorFlow等深度学习框架为
训练
和微调大型语言模型提供了强大的支持。PyCharm
AI天才研究院
·
2025-03-17 06:55
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
新手村:数据预处理-特征缩放
特征缩放可以使不同尺度的特征具有相同的量级,从而提高模型
训练
的效率和性能。常见的特征缩放方法包括标准化(Standardization)和归一化(Normalization)。
嘉羽很烦
·
2025-03-17 05:20
机器学习
线性回归
算法
机器学习
MindSpore:华为全场景AI框架的技术全景与生态实践
作为华为昇腾AI生态的基石,MindSpore支持端、边、云全场景覆盖,并深度融合昇腾处理器的算力特性,提供从模型开发、
训练
到推理部署的端到端能力。
彩旗工作室
·
2025-03-17 05:44
人工智能
人工智能
过拟合:机器学习中的“死记硬背”陷阱
它像一把双刃剑:当模型过于“聪明”时,可能会陷入对
训练
数据的过度依赖,从而失去处理新问题的能力。本文将从原理到实践,深入探讨过拟合的本质及应对策略。1.什么是过拟合?
彩旗工作室
·
2025-03-17 05:44
人工智能
机器学习
人工智能
Python—JSON格式标签转换为TXT格式标签详细教程2(附完整代码)
这个代码主要是解析一个json文件转换成多个txt文件使用的,尤其是便于yolo
训练
decode_json函数中的convert函数确实是用于将坐标缩放到0-1之间的。
资源补给站
·
2025-03-17 01:16
python
图像处理
笔记
python
json
开发语言
AI技术学习笔记系列001:FastLanguageModel.get_peft_model 函数各参数的详细解释
FastLanguageModel.get_peft_model函数各参数的详细解释,以及企业实际微调时的选择考量:参数详解及对微调的影响1.r=32(秩)作用:控制LoRA适配器的低秩矩阵的维度(秩),直接影响可
训练
参数数量
新说一二
·
2025-03-17 00:43
人工智能
学习
笔记
PyTorch 实现 Conditional DCGAN(条件深度卷积生成对抗网络)进行图像到图像转换的示例代码
该代码包含
训练
和可视化部分,假设输入为图片和4个工艺参数,根据这些输入生成相应的图片。
max500600
·
2025-03-16 23:04
算法
python
YOLO
深度学习
人工智能
【人工智能基础2】机器学习、深度学习总结
人工智能关键技术二、机器学习基础1.监督、无监督、半监督学习2.损失函数:四种损失函数3.泛化与交叉验证4.过拟合与欠拟合5.正则化6.支持向量机三、深度学习基础1、概念与原理2、学习方式3、多层神经网络
训练
方法一
roman_日积跬步-终至千里
·
2025-03-16 23:02
人工智能习题
人工智能
机器学习
深度学习
一文搞懂 AI Agent 与 AI 大模型的区别
Manus:Manus定义与核心能力AI大模型AI大模型是基于深度学习架构,通过海量数据
训练
得到的复杂模型,像GPT-4、文心一言等。它们具备强大的知识储备和语言理解生成能力,
a小胡哦
·
2025-03-16 23:02
人工智能
Manus
Ai
agent
代码随想录算法
训练
营第 20 天 | LeetCode235. 二叉搜索树的最近公共祖先 LeetCode701.二叉搜索树中的插入操作 LeetCode 450.删除二叉搜索树中的节点
代码随想录算法
训练
营Day20代码随想录算法
训练
营第20天|LeetCode235.二叉搜索树的最近公共祖先LeetCode701.二叉搜索树中的插入操作LeetCode450.删除二叉搜索树中的节点目录代码随想录算法
训练
营前言
HIT最菜电控
·
2025-03-16 23:01
代码随想录算法训练营
算法
leetcode
数据结构
c++
一周热点:微软攻克语音输入、文本输出难题-Phi-4-multimodal
它通过创新的架构和
训练
方法,实现了在不同模态之间的无缝交互,为用户提供更自然、更智能的交互体验。模型架构该模型采用多模态Transformer架构,通过LoRA(
数据分析能量站
·
2025-03-16 22:57
机器学习
人工智能
Adobe Firefly 技术浅析(三):GANs 的改进
生成式对抗网络(GANs)在图像生成领域取得了显著的进展,但原始的GANs在
训练
稳定性、生成质量以及多样性方面存在一些挑战。
爱研究的小牛
·
2025-03-16 21:50
AIGC——图像
AIGC—生成对抗网络
AIGC
机器学习
深度学习
关于stable diffusion的lora
训练
在linux远程工作站的部署
在学校Arc中部署loratraining,一大问题就是依赖缺失和冲突。可以利用miniconda或者anaconda建立虚拟环境来解决。安装anaconda或者miniconda(官网上也有教程):wgethttps://repo.anaconda.com/archive/Anaconda3-5.3.0-Linux-x86_64.shchmod+xAnaconda3-5.3.0-Linux-x8
回天一梦
·
2025-03-16 19:02
stable
diffusion
python
经验分享
新手村:混淆矩阵
《PythonCrashCourse》或在线教程(如Codecademy)scikit-learn基础掌握模型
训练
、预测、评估的基
嘉羽很烦
·
2025-03-16 18:28
机器学习
机器学习
即插即用模块--KANLinear
在相同迭代次数下超越传统MLP,不仅
训练
速度更快,收敛性更好,而且在拟合复杂函数时的精度也明显提高。
苏格拉没有鞋底
·
2025-03-16 17:51
模型训练
深度学习
人工智能
python
机器学习——正则化、欠拟合、过拟合、学习曲线
过拟合(overfitting):模型只能拟合
训练
数据的状态。即过度
训练
。
代码的建筑师
·
2025-03-16 17:51
学习记录
机器学习
机器学习
学习曲线
过拟合
欠拟合
正则化
IMWeb提升营Day4 |
训练
题19:顺时针打印矩阵
题目描述输入一个矩阵,按照从外向里以顺时针的顺序依次打印出每一个数字,例如,如果输入如下矩阵:12345678910111213141516则依次打印出数字1,2,3,4,8,12,16,15,14,13,9,5,6,7,11,10.12345678910111213141516123456789101112131415161718192021222324252627282930313233343
rical730
·
2025-03-16 17:19
Web开发
算法
基于DeepSeek R1构建下一代Manus通用型AI智能体的技术实践
目录一、技术背景与目标定位1.1大模型推理能力演进趋势1.2DeepSeekR1核心特性解析-混合专家架构(MoE)优化-组相对策略优化(GRPO)原理-多阶段强化学习
训练
范式1.3Manus智能体框架设计理念
zhangjiaofa
·
2025-03-16 15:08
DeepSeek
R1&
AI人工智能大模型
DeepSeek
Manus
智能体
AI
大语言模型微调和大语言模型应用区别
大语言模型微调和大语言模型应用区别微调与应用LLM的区别微调大语言模型(LLM)是指取一个已经预
训练
好的模型,进一步用特定数据集
训练
,使其更好地适应某个任务或领域,比如为医疗聊天机器人优化医疗术语理解。
AI Echoes
·
2025-03-16 15:34
深度学习
人工智能
自然语言处理
呵护斜颈老人:解锁护理关键,重塑健康生活
康复
训练
是护理的关键环节。鼓
全力以赴66
·
2025-03-16 15:31
生活
大规模语言模型从理论到实践 开源指令数据集
这些模型的成功离不开庞大的
训练
数据集和复杂的算法架构。然而,如何有效地构建和利用开源指令数据集,仍然是一个值得深入探讨的话题。2.核
AI天才研究院
·
2025-03-16 13:17
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
Python3 【项目实战】深度解析:赛跑成绩统计分析工具
本工具通过程序化处理赛跑数据,自动计算各选手成绩及整体统计指标,主要应用于:学校运动会成绩实时统计田径锦标赛的自动化成绩公示运动员
训练
数据分析2.技术定位:时间数据处理与统计计算的典型案例字典数据结构的实践应用面向过程编程的教学范例二
李智 - 重庆
·
2025-03-16 12:11
Python
精讲精练
-
从入门到实战
python
案例学习
编程技巧
时间处理
项目实战
主流开源大模型能力对比矩阵
模型名称核心优势主要局限Llama2/3✅多语言生态完善✅Rotary位置编码✅GQA推理加速⚠️数据时效性差⚠️隐私保护不足Qwen✅千亿参数规模✅中文语境优化✅复杂文本生成⚠️需高性能硬件⚠️领域知识需二次
训练
时光旅人01号
·
2025-03-16 12:09
人工智能
开源
python
深度学习
pytorch
基于 svm 的金融咨询情感分析
金融咨询处理1.利用7万多条利好/利空语料(已经标注好的,分为1正性,-1负性两类),首先采用B-gram卡方差提取特征词汇2.使用卡方提取的特征词为每一篇咨询建立向量表示模型3.使用向量进行svm分割,
训练
语料
ouprince
·
2025-03-16 10:28
NLP
svm
情感分析
KNN算法性能优化技巧与实战案例
一、核心性能瓶颈维度挑战描述计算复杂度单次预测需计算全部
训练
样本距离,时间复杂度为(n=样本数,d=特征维度)内存占用需全量存储
训练
数据,大规模数据集难以加载高维灾难高维数据中距离计算失去
可问 可问春风
·
2025-03-16 09:22
算法
性能优化
LLaMA-Factory
训练
数据默认使用 instruction、input、output 三个 key
在LLaMA-Factory进行SFT(Directivesupervisionfine-tuning指令监督微调)时,
训练
数据的格式非常重要,因为大模型依赖标准化的数据结构来学习指令-响应模式。
背太阳的牧羊人
·
2025-03-16 08:43
模型微调
llama
人工智能
大模型微调
Matlab多种算法解决未来杯B的多分类问题
1.读取数据首先,我们从Excel文件中读取
训练
集和测试集:2.
训练
集划分我们将80%的数据用于
训练
,20%用于验证。3.
训练
多个模型我们选取8种常见分类模型,并存储预测结果。
Subject.625Ruben
·
2025-03-16 06:05
算法
分类
机器学习
数学建模
未来杯
matlab
人工智能
【prompt实战】知乎问题解答专家
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-03-16 06:04
prompt实战应用案例
prompt
DeepSeek全栈开发指南:从代码生成到分布式
训练
的黑科技解析
一、DeepSeek技术新突破:程序员必须掌握的MoE架构实战2025年2月25日,DeepSeek开源了专为MoE模型设计的DeepEP通信库,这项技术革新直接影响了分布式
训练
和推理效率。
AI创享派
·
2025-03-16 06:00
后端
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他