E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
紫书训练
huggingface/pytorch-image-models
huggingface/pytorch-image-models1.使用技巧1.1.
训练
指令单卡:pythontrain.py--pretrained--input-size3224224--mean000
GarryLau
·
2025-02-19 00:23
ML&DL
pytorch
python
huggingface
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:46
人工智能
什么是Scaling Laws(缩放定律);DeepSeek的Scaling Laws
ScalingLaws(缩放定律)ScalingLaws(缩放定律)在人工智能尤其是深度学习领域具有重要意义,以下是相关介绍及示例:定义与内涵ScalingLaws主要描述了深度学习模型在规模(如模型参数数量、
训练
数据量
ZhangJiQun&MXP
·
2025-02-18 23:14
教学
2024大模型以及算力
2021
论文
人工智能
自然语言处理
神经网络
语言模型
深度学习
智能算力中心万卡GPU集群架构深度解析
超万卡集群缩短
训练
时间,加速迭代,助力市场趋势应对。在超万卡集群中,高效稳定地
训练
大模型面临双重挑战:确保集群算力最大化、网
科技互联人生
·
2025-02-18 23:13
科技
数码
人工智能
人工智能
gpu算力
硬件架构
PyTorch `.pth` 转 ONNX:从模型
训练
到跨平台部署
PyTorch.pth转ONNX:从模型
训练
到跨平台部署在深度学习里,模型的格式决定了它的可用性。如果你是PyTorch用户,你可能熟悉.pth文件,它用于存储
训练
好的模型。
MO__YE
·
2025-02-18 23:12
pytorch
人工智能
python
如何
训练
LLM“思考”(像o1和DeepSeek-R1一样, 高级推理模型解析
2024年9月,OpenAI发布了它的o1模型,该模型基于大规模强化学习
训练
,赋予了它“高级推理”能力。不幸的是,他们是如何做到这一点的细节从未被公开披露。
果冻人工智能
·
2025-02-18 22:06
AI员工
人工智能
chatgpt
深度学习
商汤绝影端到端自动驾驶的迭代优化
自动驾驶,端到端,迭代优化,深度学习,感知,规划,控制,模型
训练
,数据增强,模型微调1.背景介绍随着人工智能和计算机视觉技术的飞速发展,自动驾驶汽车从科幻走进了现实。
AGI大模型与大数据研究院
·
2025-02-18 22:33
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
2. 从HuggingFace下载千问模型、数据、微调并运行
视频链接(1)3.从HuggingFace下载千问模型、数据、微调并运行(上)_哔哩哔哩_bilibili在本课程中,我们将带你下载并本地运行一个大模型,进行模型的微调
训练
等,视频播放量525、弹幕量0
ApiChain
·
2025-02-18 20:45
gpt
大模型
语言模型
人工智能
python
解剖DeepSeek四把刀,一场深到源码,大到行业,细到人心盛宴
他们公开的是经过蒸馏的“成品模型”,而非原始
训练
框架:就像给你组装好的乐高战舰,却藏起了设计图纸。这种半开放式开源既能吸引开发者构建生态,又
leluckys
·
2025-02-18 19:33
AI大模型
AI编程
SFT(监督微调)和RLHF(基于人类反馈的强化学习)的区别
和RLHF(基于人类反馈的强化学习)的区别STF(SupervisedFine-Tuning)和RLHF(ReinforcementLearningfromHumanFeedback)是两种不同的模型
训练
方法
钟小宇
·
2025-02-18 18:11
LLM
人工智能
语言模型
【机器学习】半监督和无监督极限学习机SS-US-ELM附Matlab代码
2.2ELM的学习过程介绍ELM的学习算法和
训练
过程。三、半监督极限学习机(SS-ELM)3.1SS-ELM的提
默默科研仔
·
2025-02-18 18:09
粉丝福利
机器学习
人工智能
DeepSeek为什么超越了OpenAI
其中,技术架构的突破最具革命性——DeepSeek创造性地采用"混合专家系统+领域预
训练
"架构,在特定领域的推理效率比OpenAI的GPT-4提升40%以上(根据2023年MLPerch基准测试)。
·
2025-02-18 17:19
deepseek
DeepSeek的
训练
与优化流程
DeepSeek的
训练
与优化流程一、数据工程体系1.多模态数据融合处理动态数据湖架构:实时摄入互联网文本、科学论文、专利文献、传感器数据等20+数据源日均处理原始数据量达1.2PB,支持200+文件格式自动解析智能清洗流水线
程序猿000001号
·
2025-02-18 17:01
DeepSeek
训练
优化
机器学习基本篇
1基本概念机器学习,分为回归,分类,聚类,降维有监督学习回归,分类,有特征,有标签,进行
训练
,然后对新数据进行预测无监督学习聚类,降维。
胖胖的小肥猫
·
2025-02-18 16:51
机器学习
deepseek本地部署后做微调
训练
实现智能对话的一些建议
在本地部署大模型后,进行微调和
训练
以实现智能对话,通常需要按照以下步骤操作。以下是详细的指导内容:1.准备数据集在微调大模型之前,需要准备适合的
训练
数据集。
慧香一格
·
2025-02-18 14:34
AI
学习
deepseek
服务器
AI
机器学习和线性回归、softmax回归
分类——交叉熵样本属于“哪一类”的问题称为分类问题回归是
训练
一个回归函数来输出一个数值;分类是
训练
一个分
小名叫咸菜
·
2025-02-18 13:53
人工智能
线性回归
大模型AI应用安全与合规测试实战指南-模型层
核心痛点直击:黑盒失控:生成内容不可预测,传统规则引擎失效数据深渊:
训练
数据含敏感信息,清洗难度指数级上升合规迷宫:全球AI监
测试匠心:技能精进·职场跃迁·面试赢家
·
2025-02-18 12:13
人工智能
安全
AI赋能教育:深度解析大模型在教育场景中的应用与架构设计【无标题】
在这篇文章中,我们将基于一张完整的应用设计架构图,从应用场景到AI核心能力、
训练
标注平台、智能处理引擎以及业务数据,全方位剖析大模型如何助力教育行业实现突破,真正实现“AI赋能教育,重塑未来”。
和老莫一起学AI
·
2025-02-18 11:33
人工智能
语言模型
产品经理
ai
自然语言处理
大模型
程序员
算法
训练
Day01 Leetcode704.二分查找
0.学习资料来源题目链接:力扣https://leetcode.cn/problems/binary-search/文章讲解:代码随想录代码随想录PDF,代码随想录百度网盘,代码随想录知识星球,代码随想录八股文PDF,代码随想录刷题路线,代码随想录知识星球八股文https://programmercarl.com/0704.%E4%BA%8C%E5%88%86%E6%9F%A5%E6%89%BE.
weixin_47284299
·
2025-02-18 10:25
代码随想录训练营
算法
面试
职场和发展
python
数学建模基础
训练
-1:概念解析
文章目录数学建模基础
训练
-1:概念解析问题一:如何找到“概念”?问题二:如何全面理解概念的基础含义?问题三:如何深刻理解概念并作出创新点发掘?
MPCTHU
·
2025-02-18 09:44
数学建模
数学建模
InspireMusic - 阿里通义实验室开源音乐生成框架 支持音乐、歌曲、音频生成 本地一键整合包下载
InspireMusic不仅为研究者和开发者提供了丰富的音乐/歌曲/音频生成模型的
训练
和调优工具,还为他们配备了高效的模型,以便优化生成效果。
昨日之日2006
·
2025-02-18 09:12
ai语音
音视频
驾培行业转战无人机飞手执照培训的优缺点分析及技术详解
2.场地与设施优势:驾培场地通常较为宽敞,且部分场地可改造为无人机飞行
训练
场地,节省场地租赁成本。可利用现有设施进行无人机组装、调试和维修等实操培训。3.人力资源利用:驾培行业的
无人机技术圈
·
2025-02-18 05:03
无人机技术
无人机
DeepSeek对AI发展的范式革新与推动:研究报告
其核心技术突破包括:低算力消耗的模型
训练
通过蒸馏
训练
策略、动态模型剪枝和稀疏
训练
,DeepSeek将
训练
成本降至OpenAI同类模型的1/10,同时保持性能可比甚至超越。
芝士AI吃鱼
·
2025-02-18 05:57
DeepSeek
AI
OpenAI
LLM
强化学习原理与代码实战案例讲解
想象一下,你正在
训练
一只小狗学习坐下。你不会给它看成千上万张“坐下”的照片,而是会给它一些指令,比如“坐下”,如果它照
AI天才研究院
·
2025-02-18 05:53
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
OpenCV机器学习(1)人工神经网络 - 多层感知器类cv::ml::ANN_MLP
它提供了一种方式来创建和
训练
多层感知器模型,以解决分类、回归等
村北头的码农
·
2025-02-18 04:51
OpenCV
opencv
机器学习
人工智能
Pytorch实现mnist手写数字识别
>-**本文为[365天深度学习
训练
营]中的学习记录博客**>-**原作者:[K同学啊]**我的环境:语言环境:Python3.8编译器:JupyterLab深度学习环境:torch==1.12.1+cu113torchvision
Zn要学习
·
2025-02-18 04:49
python
《DeepSeek
训练
算法:开启高效学习的新大门》
DeepSeek作为其中的佼佼者,凭借其独特的
训练
算法和高效的学习能力,吸引了众多目光。今天,就让我们深入探究DeepSeek
训练
算法的独特之处,以及它是如何保证模型实现高效学习的。
·
2025-02-18 04:41
人工智能深度学习
DeepSeek推理模型架构以及DeepSeek爆火的原因
在
训练
过程中,DeepSeek广泛应用蒸馏技术,通过生成高质量数据和将大型模型的推理能力迁移至小型模型,大幅提升
训练
效率与模型性能。Deep
微学AI
·
2025-02-18 03:06
架构
LLM
deepseek
【LLM】大模型基础--大规模预
训练
语言模型的开源教程笔记
1.引言本文以DataWhale大模型开源教程为学习路线,进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列(token)的概率分布,可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看,LM(languagemodle)可以简单的分为:自回归模型非自回归模型特点逐字生成文本,每个词的生成都依赖于上文,关联性好一次性生成整个文本序列,不捕捉上文信息优点内容质量高生成速度快
Langchain
·
2025-02-18 02:00
笔记
人工智能
langchain
llama
大模型
产品经理
大模型基础
模型GPU->NPU(Ascend)迁移
训练
简述
目录一、迁移
训练
流程图解二、详细流程步骤1.模型
训练
与日志记录2.跨平台精度对齐对比3.问题定位与修复4.迭代验证三、关键技术点四、常见问题与解决方案一、迁移
训练
流程图解通过华为云的modelart进行运行环境选型北京四使用
終不似少年遊*
·
2025-02-18 01:12
深度学习
人工智能
迁移学习
GPU
NPU
华为云
python 学习曲线函数_如何使用学习曲线来诊断你的LSTM模型的行为?(附代码)...
第二章:怎么样
训练
weixin_39576066
·
2025-02-17 23:49
python
学习曲线函数
翻译Deep Learning and the Game of Go(14)第十二章 采用actor-critic方法的强化学习
本章包括:利用优势使强化学习更有效率用actor-critic方法来实现自我提升AI设计和
训练
Keras的多输出神经网络如果你正在学习下围棋,最好的改进方法之一是让一个水平更高的棋手给你复盘。
idol_watch
·
2025-02-17 22:16
围棋与深度学习
【漫话机器学习系列】041.信息丢失(dropout)
信息丢失(Dropout)Dropout是一种广泛应用于神经网络
训练
中的正则化技术,旨在减少过拟合(overfitting),提高模型的泛化能力。
IT古董
·
2025-02-17 22:40
漫话机器学习系列专辑
机器学习
人工智能
深度学习
第二章:12.3 建立表现基准
在这个过程中,算法的性能可以通过
训练
误差和交叉验证误差来评估。误差定义
训练
误差(Jtrain):指算法在
训练
数据集上无法正确转录的音频片段的百分比。
望云山190
·
2025-02-17 22:40
基准性能水平
人工智能
机器学习
第二章:12.4 学习曲线
学习曲线的基本概念学习曲线是展示机器学习模型性能如何随着
训练
数据量增加而变化的图表。它们可以帮助我们理解模型在不同数据量下的表现,以及模型是否过拟合或欠拟合。
望云山190
·
2025-02-17 22:05
深度学习
机器学习
人工智能
机器学习相关基础
2.日常生活中的机器学习:①称为RGB(由红色,绿色,蓝色组成),这种是欠拟合欠拟合和过拟合区别:•欠拟合(Underfitting):模型在
训练
数据上表现不佳,无法很好地捕捉数据中的规律。通
星辰瑞云
·
2025-02-17 20:55
机器学习
【DeepSeek】一文详解GRPO算法——为什么能减少大模型
训练
资源?
GRPO,一种新的强化学习方法,是DeepSeekR1使用到的
训练
方法。
FF-Studio
·
2025-02-17 20:19
DeepSeek
R1
算法
AIMv2:多模态自回归预
训练
的视觉新突破
AIMv2:多模态自回归预
训练
的视觉新突破阅读时长:19分钟发布时间:2025-02-17近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM
·
2025-02-17 20:28
人工智能
Audio-Visual Speech Enhancement(视听语音增强)领域近三年研究进展与国内团队及手机厂商动态分析
一、视听语音增强领域近三年研究进展多模态融合与模型轻量化多模态特征融合:中国科学技术大学团队提出通过引入超声舌头图像和唇部视频的联合建模,结合知识蒸馏技术,在
训练
阶段利用教师模型传递舌部运动知识,从而在推断时仅依赖唇部视频即可提升语音增强效果
AndrewHZ
·
2025-02-17 20:47
深度学习新浪潮
智能手机
算法
计算机视觉
硬件架构
硬件工程
智能硬件
Aerospike
文章来源:拉勾教育Java高薪
训练
营第3期Aerospike介绍Aerospike(简称AS)是一个分布式,可扩展的键值存储的NoSQL数据库。
小的~~
·
2025-02-17 17:22
nosql
Aerospike
朴素贝叶斯模型在文本分类中的应用
它的核心思想是根据
训练
数据中不同类别的条件概率,预测新文本属于哪个类别。尽管其假设条件较为简单(假设特征之间相互独立),但朴素贝叶斯在许多实际应用中仍表现出色,特别是在处理文本分类任务时。
Ash Butterfield
·
2025-02-17 15:36
nlp
分类
数据挖掘
人工智能
Flux【Lora模型】:效率太高了,超写实逼真黑悟空Flux Lora它来了
在大家热心谈论黑悟空的时候,AI绘画领域也不甘落后,结合最近火爆的AI绘画工具Flux,各路大神第一时间就
训练
出了Flux的loar版本,今天我们就来体验感受一下大神“AIGAME熊熊”推出的Flux版本的
AI绘画师-海绵
·
2025-02-17 15:59
ui
AIGC
人工智能
3d
平面
设计
计算机
递归消除特征法RFE筛选特征-包装法-特征选择-特征降维
RFE(Recursivefeatureelimination):递归消除特征法使用一个基模型(这里使用逻辑回归)来进行多轮
训练
,每轮
训练
后,消除若干权值系数的特征,再基于新的特征集进行下一轮
训练
。
糯米君_
·
2025-02-17 14:59
预处理
机器学习
python
人工智能
【深度学习】计算机视觉(CV)-图像分类-ResNet(Residual Network,残差网络)
ResNet的核心思想是残差学习(ResidualLearning),它通过跳跃连接(SkipConnections)解决了深度神经网络
训练
中的梯度消失和梯度爆炸问题,使得非常深的网络(如50层、1
IT古董
·
2025-02-17 14:57
深度学习
人工智能
深度学习
计算机视觉
分类
【第15章:量子深度学习与未来趋势—15.3 量子深度学习在图像处理、自然语言处理等领域的应用潜力分析】
想象这样一个场景:你现在
训练
一个GPT-5级别的模型,不需要耗费价值上亿美元的算力资源,不需要等待数周的
训练
时间,甚至不需要纠结于模型参数是否过拟合。这就是量子深度学
再见孙悟空_
·
2025-02-17 14:25
#
【
深度学习・探索智能核心奥秘】
深度学习
机器学习
人工智能
音视频
自然语言处理
量子深度学习
量子学习未来
Python 循环神经网络(RNN)算法详解与应用案例
的优势与挑战二、Python中RNN的面向对象实现2.1`RNNCell`类的实现2.2`RNNModel`类的实现2.3`Trainer`类的实现三、案例分析3.1序列预测3.1.1数据准备3.1.2模型
训练
闲人编程
·
2025-02-17 13:48
python
python
rnn
算法
循环神经网络
深度学习
文本生成
基于深度学习YOLOv10的PCB板缺陷检测系统(附完整资源+PySide6界面+
训练
代码)
引言:在现代制造业中,电子元件和PCB(印刷电路板)是非常重要的基础设施。PCB缺陷检测是生产过程中至关重要的一步。传统的缺陷检测方法主要依靠人工检查,这不仅效率低,而且容易受到人眼疲劳的影响。随着深度学习技术的不断发展,基于深度学习的自动化缺陷检测已成为研究的热点,尤其是在计算机视觉领域。YOLO(YouOnlyLookOnce)系列算法凭借其高速和高精度的优势,成为了目标检测领域的佼佼者。本文
人工智能_SYBH
·
2025-02-17 13:47
深度学习
YOLO
人工智能
目标检测
python
使用多模态大语言模型进行深度学习的图像、文本和语音数据增强
在过去的五年里,研究方向已从传统的机器学习(ML)和深度学习(DL)方法转向利用大语言模型(LLMs),包括多模态方法,用于数据增强,以提高泛化能力,并在
训练
深度卷积神经网络时防止过拟合。
数行天下
·
2025-02-17 12:42
人工智能
语言模型
深度学习
人工智能
自然语言处理
OpenWebUI,RAG+外部知识库+AI写文的开源应用
一般情况下,大模型依靠自身
训练
数据便能够完成的任务质量偏高,像翻译总结、格式转换之类,市面上所有的AI程序基本都能够满足这一点需求;但是需要结合外部资料/超长上文信息/实时信
m0_74824780
·
2025-02-17 12:39
人工智能
开源
【Vim Masterclass 笔记10】S06L23:Vim 核心操作
训练
之 —— 文本的搜索、查找与替换操作(第二部分)
文章目录S06L23Search,Find,andReplace-PartTwo1文本替换命令`:s/old/new/`2指定范围的文本替换3特例:路径的替换4文件行号的配置5要点总结(1)搜索当前行(SameLineSearching)(2)跨行搜索(Searching)(3)替换命令(SubstituteCommand)写在前面根据李笑来《自学是门手艺》的建议,梳理完知识要点后又对这章内容制作
安冬的码畜日常
·
2025-02-17 12:07
Vim
Masterclass
vim
笔记
vim查找与替换
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他