E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
detectron训练
机器学习中的梯度到底是什么?(chat-gpt问答)
在机器学习中,我们通过不断调整参数,使目标函数达到最小值,从而实现模型的
训练
和学习。2、为什么梯度要求偏导来求解?梯度是一个向量,它的方向指向函数值增加最快的方向,其大小表示函数值的变化率。
湫怿
·
2025-03-15 16:19
机器学习
gpt
人工智能
梯度
大型语言模型与强化学习的融合:迈向通用人工智能的新范式——基于基础复现的实验平台构建
强化学习(RL)作为一种通过与环境交互学习最优策略的方法,在智能体
训练
中发挥着重要作用。本文旨在探索LLM与RL的深度融合,分析LLM如何赋能RL,并阐述这种融合对于迈向通用人工智能(AGI)的意义。
(initial)
·
2025-03-15 16:17
大模型科普
人工智能
强化学习
深度学习-服务器
训练
SparseDrive过程记录
1、cuda安装1.1卸载安装失败的cuda参考:https://blog.csdn.net/weixin_40826634/article/details/127493809注意:因为/usr/local/cuda-xx.x/bin/下没有卸载脚本,很可能是apt安装的,所以通过执行下面的命令删除:apt-get--purgeremove"cuda*"apt-getautoremove然后执行f
weixin_40826634
·
2025-03-15 15:41
深度学习
服务器
人工智能
使用 Ollama 对 LLaMA-2 模型进行微调的详细指南
如果条件允许,使用多卡GPU(如RTX4090或A100)可以显著加快
训练
速度。对于更大的模型(如LLaMA-213B或33B),
软件职业规划
·
2025-03-15 15:08
llama
机器学习-----决策树
概念2.决策树的构建过程2.1特征选择2.2树的生成2.3树的剪枝3.决策树的优缺点4.决策树的应用4.1分类任务4.2回归任务4.3集成学习代码示例总结1、概念1.1决策树是什么决策树是通过对样本的
训练
多巴胺与内啡肽.
·
2025-03-15 15:37
机器学习
机器学习
决策树
人工智能
算法
训练
-拓扑排序2
洛谷P1807最长路https://www.luogu.com.cn/problem/P1807本题数据范围过大盲目使用dfs容易超时爆栈题目要求中提到i#defineintlonglong#defineendl'\n'/*===\\================//\\===================//\\============//\\==========//=========\\=
往往歌咏理想
·
2025-03-15 14:33
算法
深度优先
代码随想录算法
训练
营DAY05之栈和队列
题目和链接232.用栈实现队列225.用队列实现栈20.有效的括号1047.删除字符串中的所有相邻重复项150.逆波兰表达式求值239.滑动窗口最大值347.前k个高频元素232.用栈实现队列题意:请你仅使用两个栈实现先入先出队列。队列应当支持一般队列支持的所有操作(push、pop、peek、empty):实现MyQueue类:voidpush(intx)将元素x推到队列的末尾intpop()从
失序空间
·
2025-03-15 14:33
跟着代码随想录学算法
算法
c++
HuggingFace下载模型并导入Ollama指南
众所周知,HuggingFace仓库托管了诸多
训练
模型。DeepSeek官方也将完整满血版DeepSeek-R1:671B模型镜像托管在此仓库,但是目前国内无法直接从HugingFace下载。
Repetion_Maxumim
·
2025-03-15 14:00
embedding
语言模型
人工智能
自然语言处理
ai
增量预
训练
和微调的区别
文章目录前言一、增量预
训练
和微调的区别二、代码示例1.增量预
训练
示例2.微调示例3.代码的区别三、数据格式1.增量预
训练
2.微调3.示例4.小结四、数据量要求1.指导原则2.示例3.实际操作中的考虑4.
做个天秤座的程序猿
·
2025-03-15 13:54
大模型原理
webkit
【Transformer-Hugging Face手册 07/10】 微调预
训练
模型
微调预
训练
模型-目录一、说明二、在本机PyTorch中微调预
训练
模型。
无水先生
·
2025-03-15 13:54
人工智能高级阶段
人工智能综合
transformer
深度学习
人工智能
《探秘人工智能与鸿蒙系统集成开发的硬件基石》
对于模型
训练
任务,尤其是深度学习模型,其复杂的
程序猿阿伟
·
2025-03-15 12:43
人工智能
harmonyos
华为
数据标注工具及其对预
训练
模型性能的影响
1.背景介绍1.1预
训练
模型的崛起近年来,预
训练
模型(Pre-trainedModels)在自然语言处理(NLP)领域取得了显著的成功。
AGI大模型与大数据研究院
·
2025-03-15 10:00
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
数据标注质量对AI模型质量的影响分析
没有高质量的标注数据,就如同建造高楼大厦没有坚实的地基,AI模型就无法有效地学习和
训练
,最终的AI质量也就无从谈起。
训练
数据是AI模型
自由鬼
·
2025-03-15 10:30
行业发展
IT应用探讨
人工智能
机器学习
深度学习
AI
基于纯视觉的 GUI 代理的屏幕解析工具(OmniParser)
一、技术原理1.数据集构建:从流行网页和应用中提取数据,构建可交互图标检测数据集和图标描述数据集,为模型
训练
提供基础。
deepdata_cn
·
2025-03-15 09:51
应用软件
GUI
Anthropic 的模型
Anthropic的模型(特别是Claude系列)之所以在性能和推理能力上表现强劲,可以从技术设计、研究理念、
训练
方法以及应用优化等多个方面进行详细分析。
调皮的芋头
·
2025-03-15 06:50
深度学习
神经网络
机器学习
人工智能
RV1126笔记三十七:PaddleOCR检测模型
训练
PaddleOCR检测模型
训练
及验证测试1、准备数据集在PaddleOCR目录下新建文件夹:train_data,这个文件夹用于存放数据集的。
殷忆枫
·
2025-03-15 05:16
RV1126项目实战
笔记
大语言模型微调和大语言模型应用的区别?
1.基本概念微调(Fine-tuning)定义:微调是指在预
训练
大语言模型的基础上,通过在特定领域或任务的数据上进一步
训练
,从而使模型在该特定任务上表现更优。
AI Echoes
·
2025-03-15 05:38
深度学习
人工智能
机器学习
大语言模型(LLMs)全面学习指南(非常详细)零基础入门到精通,收藏这一篇就够了
如下这份指南将涵盖LLMs的基础知识、
训练
过程、用例和未来趋势……一.WhatareLargeLanguage
网络安全大白
·
2025-03-15 04:38
科技
程序员
人工智能
语言模型
人工智能
自然语言处理
DeepSeek创始人专访:中国的AI不可能永远跟随,需要有人站到技术的前沿
训练
成本估计只有Llama3.1405B模型的11分之一,后者的效果还不如它。
AIBigModel
·
2025-03-15 04:06
人工智能
十分钟学会微调大语言模型
在之前的文章中,我分享了一些使用大语言模型开发应用的方法,也介绍了几个开源大语言模型的部署方式,有同学给我留言说想知道怎么
训练
自己的大语言模型,让它更贴合自己的业务场景。
喝不喝奶茶丫
·
2025-03-15 04:35
语言模型
人工智能
自然语言处理
大模型
大模型应用
AI大模型
微调
大语言模型微调和大语言模型应用的区别?
1.定义与目标微调(Fine-tuning)目标:调整预
训练
模型(如GPT、LLaMA、PaLM)的参数,使其适应特定任务或领域。
AI Echoes
·
2025-03-15 04:34
人工智能
深度学习
机器学习
神经网络完成
训练
的详细过程
神经网络完成
训练
的详细过程一、神经网络的基本概念神经网络是一种模拟人脑神经系统的计算模型,由大量的神经元(节点)和它们之间的连接(权重)组成。
每天五分钟玩转人工智能
·
2025-03-15 04:34
神经网络
人工智能
深度学习
pytorch
机器学习
优化算法包括梯度下降法
pytorch实现cifar10多分类总结
它包含了10个不同类别,每个类别有6000张图像,其中5000张用于
训练
,1000张用于测试。这10个类别分别为:飞机、汽车、鸟类、猫、鹿、狗、青蛙、马、船和卡车。
L_pyu
·
2025-03-15 00:31
人工智能
pytorch
分类
多分类—微调DistilBERT对生物医学文本进行实验方法多分类:Automated Text Mining of Experimental Methodologies from Biomedical
AutomatedTextMiningofExperimentalMethodologiesfromBiomedicalLiterature从生物医学文献中自动挖掘实验方法文本paper:https://arxiv.org/abs/2404.13779github:本文做的就是微调DistilBERT去做多分类任务,
训练
自己的数据集
小小帅AIGC
·
2025-03-14 23:56
information
extraction
人工智能
自然语言处理
语言模型
多分类
学术领域
生物医学
数据挖掘技术介绍
功能:根据已标记的
训练
数据,学习一个模型,用于预测新数据的类别。方法:决策树、支持向量机、神经网络、逻辑回归、
柒柒钏
·
2025-03-14 23:25
数据挖掘
数据挖掘
人工智能
图神经网络学习笔记—高级小批量处理(专题十四)
小批量(mini-batch)的创建对于让深度学习模型的
训练
扩展到海量数据至关重要。与逐条处理样本不同,小批量将一组样本组合成一个统一的表示形式,从而可以高效地并行处理。
AI专题精讲
·
2025-03-14 23:52
图神经网络入门到精通
人工智能
医学文本分析中的命名实体识别:从理论到实践
1.数据预处理数据预处理是医学命名实体识别系统的基础步骤,其质量直接影响模型的
训练
效果和最终性能。数据预处理主要包括医学文本的标注、清洗以及数据增强三个方面。
软件职业规划
·
2025-03-14 23:51
语言模型
unity
人工智能
Deepseek:物理神经网络PINN入门教程
一、物理信息网络(PINN)的概念与原理1.定义与来源物理信息网络(Physics-InformedNeuralNetworks,PINN)是一种将物理定律(如偏微分方程、守恒定律等)嵌入神经网络
训练
过程的深度学习方法
天一生水water
·
2025-03-14 23:50
神经网络
人工智能
深度学习
基于Transformer的医学文本分类:从BERT到BioBERT
Transformer模型,尤其是BERT及其变体,通过预
训练
和微调的方式,能够有效捕捉医学文本中的语义信息,为医学文本分类提供了强大的工具。本文将探讨Transfor
Evaporator Core
·
2025-03-14 23:17
人工智能
#
深度学习
#
DeepSeek快速入门
transformer
分类
bert
H100解锁生成式AI算力新纪元
其创新性设计聚焦三大技术支柱:第三代TensorCore通过稀疏计算与混合精度支持,显著提升矩阵运算效率;显存带宽优化技术结合HBM3高带宽内存,将数据吞吐量提升至3.35TB/s,有效缓解大规模模型
训练
中的显存墙问题
智能计算研究中心
·
2025-03-14 22:43
其他
Batch Normalization理解
来说输入的就是满足某一分布的特征矩阵,但对于Conv2而言输入的featuremap就不一定满足某一分布规律了(注意这里所说满足某一分布规律并不是指某一个featuremap的数据要满足分布规律,理论上是指整个
训练
zhimengxiang
·
2025-03-14 22:13
图像处理
人工智能
图像处理
深度学习项目--基于DenseNet网络的“乳腺癌图像识别”,准确率90%+,pytorch复现
本文为365天深度学习
训练
营中的学习记录博客原作者:K同学啊前言如果说最经典的神经网络,ResNet肯定是一个,从ResNet发布后,很多人做了修改,denseNet网络无疑是最成功的一个,它采用密集型连接
羊小猪~~
·
2025-03-14 22:08
深度学习
网络
pytorch
人工智能
python
机器学习
分类
从零到一:Transformer模型的原理与实战之旅
1.2自注意力机制的核心1.3Transformer的结构2.实战:构建Transformer模型2.1任务目标2.2环境准备2.3数据准备2.4模型构建2.5模型
训练
3.推理实战:完整示例与输出结果3.1
樽酒ﻬق
·
2025-03-14 21:06
AI
transformer
深度学习
人工智能
PyTorch 深度学习实战(13):Proximal Policy Optimization (PPO) 算法
一、PPO算法基础PPO是OpenAI提出的一种强化学习算法,旨在解决策略梯度方法中的
训练
不稳定问题。PPO通过
进取星辰
·
2025-03-14 19:47
PyTorch
深度学习实战
深度学习
pytorch
算法
笔记:代码随想录算法
训练
营day39:LeetCode 198.打家劫舍,213.打家劫舍II,337.打家劫舍III
学习资料:代码随想录198.打家劫舍力扣题目链接思路:有点像贪心,是一个不断比较取最大路径的思路定义:偷到下标为i的这家,能偷到的最大值递推公式:选当前这家偷能得到的钱和不偷当前这家的钱作比较,选能偷到的最大金额。因为这个金额是逐一递推过来的,所以是能够代表最大值的。初始化:把第一家和第二家初始化,简单来说,因为递推公式需要i-1和i-2遍历顺序:顺着偷打印://五部曲//定义:dp[i]为偷到第
jingjingjing1111
·
2025-03-14 18:07
笔记
leetcode
算法
数据结构
动态规划
【大模型LLM面试合集】分布式
训练
_总结
数据并行不仅仅指对
训练
的数据并行操作,还可以对网络模型梯度、权重参数、优化器状态等数据进行并行。
X.AI666
·
2025-03-14 17:28
大模型LLM面试合集
面试
分布式
人工智能
语言模型
2025年渗透测试面试题总结-阿里巴巴-阿里云安全(二面)(题目+回答)
目录阿里巴巴-阿里云安全二面一、职业方向与技术偏好1.安全研究vs安全研发的定位二、云安全与身份认证2.云上PKI与身份认证的关注方向三、项目实践与成果3.字节跳动
训练
营项目四、攻防技术深度解析4.SQL
独行soc
·
2025-03-14 17:25
2025年渗透测试面试指南
科技
安全
web安全
面试
职场和发展
红蓝攻防
阿里云
KNN算法实例_手写识别系统
数据集我们将使用MNIST数据集,它包含60000个
训练
样本和10000个测试样本。每个样本是一个28x28像素的灰度图像,表示0-9之间的手写数字。
V文宝
·
2025-03-14 16:47
机器学习
算法
大模型高效优化技术全景解析:微调、量化、剪枝、梯度裁剪与蒸馏
Quantization)剪枝(Pruning)梯度裁剪(GradientClipping)知识蒸馏(KnowledgeDistillation)技术对比与协同策略总结与趋势1.微调(Fine-tuning)核心思想在预
训练
模型
时光旅人01号
·
2025-03-14 15:40
人工智能
剪枝
算法
深度学习
数据挖掘
人工智能
推理大模型:技术解析与未来趋势全景
ReasoningLLMs)是专门针对复杂多步推理任务优化的大型语言模型,具备以下核心特性:输出形式创新展示完整逻辑链条(如公式推导、多阶段分析)任务类型聚焦擅长数学证明、编程挑战、多模态谜题等深度逻辑任务
训练
方法升级融合强化学习
时光旅人01号
·
2025-03-14 15:10
深度学习
人工智能
python
pytorch
神经网络
LibreTranslate的本地部署与应用服务开发
最近在关注大模型预
训练
文章和应用服务开发,有时候需要借助翻译工具,使用起来都不太方便,就找了一下类似的常见语言的翻译方案,无意中看到一个开源翻译方案(即LibreTranslate),对于通用和计算机类内容的翻译效果还是不错的
一望无际的大草原
·
2025-03-14 15:08
高级数据应用
后端
人工智能
大模型
翻译
源码部署
【AI论文】TPDiff:时序金字塔视频扩散模型
基于这一洞见,我们提出了TPDiff,一个统一的框架,用于提高
训练
和推理效率。通过将扩散过程分为几个阶段,我们的框架在扩散过程中逐步增加帧率,仅在最后阶段采用全帧率,从而优化计算效率。
东临碣石82
·
2025-03-14 14:31
人工智能
算法
DeepSeek 面试题精选
以下是针对DeepSeek面试的精选问题及解答,涵盖技术原理、模型架构、
训练
方法和应用场景等方面,供面试准备参考:一、DeepSeek模型架构与技术原理1.请简述DeepSeek-V3模型的总体架构和主要创新点
CarlowZJ
·
2025-03-14 14:00
DeepSeek
30.代码随想录算法
训练
营第三十天|452. 用最少数量的箭引爆气球,435. 无重叠区间,763. 划分字母区间
30.代码随想录算法
训练
营第三十天|452.用最少数量的箭引爆气球,435.无重叠区间,763.划分字母区间452.用最少数量的箭引爆气球-力扣(LeetCode)有一些球形气球贴在一堵用XY平面表示的墙面上
白鹭鸣鸣!
·
2025-03-14 14:00
算法
java
从LayerNorm到RMSNorm:深度学习归一化技术的进化!qwen2.5的技术。
(RootMeanSquare,RMS)来进行归一化,避免了传统归一化方法中均值和方差的计算1.LayerNorm(层归一化)LayerNorm(层归一化)是一种用于深度学习的归一化技术,主要用于稳定
训练
过程
KangkangLoveNLP
·
2025-03-14 13:29
qwen2.5
深度学习
人工智能
transformer
pytorch
自然语言处理
python
神经网络
十种处理权重矩阵的方法及数学公式
1.权重归一化(WeightNormalization)目的:通过分离权重向量的范数和方向来加速
训练
。
阳光明媚大男孩
·
2025-03-14 13:26
矩阵
机器学习
线性代数
【Agent实战】发票信息识别提取专家(AI +OCR技术结合ChatGPT4o能力+结构化prompt(CoT、One-shot等)+Knowledge - RAG+API工具Agent项目实践)
本文原创作者:姚瑞南AI-agent大模型运营专家,先后任职于美团、猎聘等中大厂AI
训练
专家和智能运营专家岗;多年人工智能行业智能产品运营及大模型落地经验,拥有AI外呼方向国家专利与PMP项目管理证书。
姚瑞南
·
2025-03-14 13:55
大模型落地探索及agent搭建
RAG技术应用探索
prompt实战应用案例
人工智能
ocr
prompt
AIGC
chatgpt
gpt
agi
【漫话机器学习系列】137.随机搜索(Randomized Search)
随机搜索(RandomizedSearch)详解在机器学习和深度学习的模型
训练
过程中,超参数调优(HyperparameterTuning)是至关重要的一环。
IT古董
·
2025-03-14 12:50
漫话机器学习系列专辑
机器学习
人工智能
医学人工智能影像诊断数据收集与整理
为了
训练
这些模型,需要大量的高质量标注数据。下面我会给出一个简单的示例流程,介绍如何收集、整理和准备医学影像数据集,并提供一些基础的Python代码示例。数据收集首先,你需要收集包含医学影像的数据集。
V搜xhliang0246
·
2025-03-14 12:18
人工智能
健康医疗
算法
GAN生成对抗网络小记
生成对抗网络(GAN)深入解析:数学原理与优化生成对抗网络(GenerativeAdversarialNetwork,GAN)是一个基于博弈论的深度学习框架,通过生成器(G)和判别器(D)之间的对抗
训练
文弱_书生
·
2025-03-14 11:38
乱七八糟
生成对抗网络
人工智能
神经网络
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他