E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
upc训练
Deepseek到底有多牛?ChatGPT、DeepSeek等大语言模型助力科研应用
●成本优势:DeepSeek的参数规模虽然庞大,但
训练
和使用费用却低至一个数量级,大大降低了用户的经济负担。
小艳加油
·
2025-02-15 00:24
语言类
chatgpt
人工智能
DeepSeek
大语言模型
PyTorch Lightning LightningDataModule 介绍
✅统一数据加载流程:确保
训练
、
qq_27390023
·
2025-02-14 23:21
pytorch
人工智能
python
代码随想录算法
训练
营第三天 | 链表理论基础,203.移除链表元素,707.设计链表,206.反转链表
代码随想录算法
训练
营第三天|链表理论基础,203.移除链表元素,707.设计链表,206.反转链表203.移除链表元素给你一个链表的头节点head和一个整数val,请你删除链表中所有满足Node.val
白鹭鸣鸣!
·
2025-02-14 23:49
算法
链表
数据结构
java
【笔记】使用 Pytorch 进行分布式
训练
本文原文以CCBY-NC-SA4.0许可协议发布于技术相关|使用Pytorch进行分布式
训练
,转载请注明出处。
LittleNyima
·
2025-02-14 23:49
人工智能
深度学习
pytorch
分布式
实验随记2-Pytorch Lightning多机多卡
训练
本文章主要收录笔者在阅读时发现的一些比较优质的多机多卡
训练
教程~~,由于pytorchLightning多机多卡示例很少,因此需要等笔者最近做完实验验证后才能更新示例。
晓岚和雪
·
2025-02-14 23:48
实验随记
pytorch
人工智能
python
深度学习
分布式
PyTorch Lightning多GPU分布式日志介绍
在多GPU/分布式
训练
环境下,多个进程会同时运行,普通的print()或logging可能会在所有GPU上重复输出,导致日志混乱。
qq_27390023
·
2025-02-14 23:48
pytorch
人工智能
python
ACM
训练
系统 1003 [编程入门]密码破译 C
代码思路:利用srcii对每个字符进行加四处理一使用四个变量和getchar();对每个字符加密;。//baizhen#includeintmain(void){chara,b,c,d,e;a=getchar();b=getchar();c=getchar();d=getchar();e=getchar();printf("%c%c%c%c%c",a+4,b+4,c+4,d+4,e+4);//字符
眉间白
·
2025-02-14 23:16
ACM
c语言
蓝桥杯
c++
利用Blackbox AI让编程更轻松
由于
训练
集、调教等方面的差别,不同的AI适用的工作也不尽相同。在编程辅助方面,已经有一系列比较成熟的平台,但它们一方面价格昂贵,另一方面功能比较单一。
·
2025-02-14 22:03
人工智能ai开发图像处理
拉普拉斯平滑(Laplacian smoothing)
概念零概率问题:在计算事件的概率时,如果某个事件在观察样本库(
训练
集)中没有出现过,会导致该事件的概率结果是0。
潜心学习的渣渣
·
2025-02-14 22:07
机器学习
【人工智能】临时抱佛脚准备明天的人工智能考试,试题与答案汇总
过拟合:指模型在
训练
数据上表现非常好,但在未见过的测试数据上表现很差,即模型学习到了
训练
数据中的噪声或偶然特征。
奋力向前123
·
2025-02-14 21:31
人工智能
人工智能
Pytorch学习之路(3)
一.机器学习任务的整体流程1.数据预处理:数据格式统一、异常数据消除、必要数据转换,划分
训练
集、验证集、测试集2.选择模型3.设定损失函数、优化方法、对应的超参数4.用模型拟合
训练
集数据,在验证集/测试集上计算模型表现二
AAAx1anyu
·
2025-02-14 21:28
Pytorch学习之旅
学习
人工智能
pytorch
深度学习
笔记
【深入探讨 ResNet:解决深度神经网络
训练
问题的革命性架构】
深入探讨ResNet:解决深度神经网络
训练
问题的革命性架构随着深度学习的快速发展,卷积神经网络(CNN)已经成为图像识别、目标检测等计算机视觉任务的主力军。
机器学习司猫白
·
2025-02-14 16:26
深度学习
人工智能
resnet
神经网络
残差
LowCode 低代码平台集成 AI 大模型会产生怎样的化学反应?
而AI大模型(AIBigModel)则是一种利用深度学习技术构建的大规模神经网络,它可以对海量数据进行
训练
和预测,从而实现各种智能化的应用。本文将探讨低代码平台集成AI大模型
AI天才研究院
·
2025-02-14 15:43
DeepSeek
R1
&
大数据AI人工智能大模型
架构师必知必会系列
ChatGPT
低代码
人工智能
使⽤MATLAB进⾏⽬标检测
目录数据准备定义模型并
训练
用测试集评估性能推理过程⼀⾏代码查看⽹络结构⼀⾏代码转onnx结语⼈⽣苦短,我⽤MATLAB。
唐BiuBiu
·
2025-02-14 15:13
机器学习
matlab
开发语言
目标检测
深度学习
警告accumulate and all-reduce gradients in fp32 for bfloat16 data type
这条警告信息是关于分布式
训练
中的通信优化策略的,具体涉及流水线并行(PipelineParallelism)和点对点通信(P2PCommunication)。
NLstudy33
·
2025-02-14 14:36
python
DexVLA:通用机器人控制中具有插件式扩散专家的视觉语言模型
虽然视觉-语言-动作(VLA)模型已显示出可泛化机器人技能的前景,但要充分发挥其潜力,需要解决动作表示和有效
训练
方面的限制。当前的VLA模型通
硅谷秋水
·
2025-02-14 13:03
大模型
智能体
计算机视觉
语言模型
计算机视觉
深度学习
机器学习
人工智能
9、深度学习-自学之路-损失函数、梯度下降、学习率、权重更新的理解
我们先来讲一下损失函数,e_dn=(p_dn-ture)**2#损失值的计算p_dn:预测值ture:真实值e_dn:损失值我们在第7章说了,我们的预测值和真实值相差越小(也就是损失值越小),说明我们模型
训练
的越好
小宇爱
·
2025-02-14 11:16
深度学习-自学之路
深度学习
学习
人工智能
27、深度学习-自学之路-NLP自然语言处理-做一个简单的项目识别一组电影评论,来判断电影评论是积极的,还是消极的。
一、如果我们要做这个项目,第一步我们要做的就是需要有对应的
训练
数据集。
小宇爱
·
2025-02-14 10:39
深度学习-自学之路
深度学习
自然语言处理
人工智能
DeepSeek正重构人形机器人和具身大模型赛道!
2024年1月20日,公司发布全球首个完全通过强化学习
训练
的专注于推理任务的高性能语言模型DeepSeek-R1
Robot251
·
2025-02-14 10:38
重构
机器人
人工智能
科技
大数据
自动驾驶
分布式
训练
三大并行策略:数据、模型与流水线并行的本质解析
分布式
训练
通过多维度并行策略实现:算力维度:聚合多卡计算能力存储维度:分布式参数存储通信维度:优化数据传输路径本文将深入剖析三大并行策略的数学本质。
WHCIS
·
2025-02-14 10:07
#
分布式训练
人工智能与机器学习
分布式
人工智能
深度学习
大数据、云计算、人工智能等技术深度融合的智慧快消开源了。
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-14 10:37
大数据
云计算
人工智能
音视频
运维
《深度解析:批量、随机和小批量梯度下降的区别与应用》
原理与计算方式批量梯度下降(BGD):BGD在每次迭代时,都会使用整个
训练
数据集来计算损失函数的梯度,然后根据梯度更新模型参数。例如,若
训练
集中有1000个样本,那么每次迭代
·
2025-02-14 09:40
人工智能深度学习
【深度学习入门实战】基于Keras的手写数字识别实战(附完整可视化分析)
文章将包含:关键概念图解完整实现代码
训练
过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
机器学习司猫白
·
2025-02-14 09:01
深度学习
深度学习
keras
人工智能
机器学习
python
模型实战(19)之 从头搭建yolov9环境+tensorrt部署+CUDA前处理 -> 实现目标检测
从头搭建yolov9环境+tensorrt部署实现目标检测yolov9虚拟环境搭建实现
训练
、推理与导出导出onnx并转为tensorrt模型Python\C++-trt实现推理,CUDA实现图像前处理文中将给出详细实现源码
明月醉窗台
·
2025-02-14 09:59
#
深度学习实战例程
目标检测
人工智能
计算机视觉
图像处理
YOLO
基于PyTorch的生成对抗网络入门(5)——利用PyTorch搭建条件生成对抗网络(CGAN)超详解
案例描述二、代码详解2.1构建真实数据集2.2创建生成虚假数据2.3构建判别器2.3.1创建生成虚假标签2.3.2判别器类2.3.3测试判别器2.4构建生成器2.4.1生成器类2.4.2测试生成器2.5
训练
wendy_ya
·
2025-02-14 08:56
PyTorch
python
pytorch
生成对抗网络
深度学习
python
神经网络
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预
训练
的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
AI 写作(三)文本生成算法:创新与突破
在
训练
复杂度方面,生成式模型通常较为复杂,因为它需要学习更多的参数来模拟数据的生成过程。例如,常
sdgfsdfxcg
·
2025-02-14 06:11
人工智能
算法
第二章:9.5 多个输出的分类
构建多标签分类神经网络的方法方法一:独立
训练
多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说,
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
ALBERT:轻量级的BERT,用于语言表征的自监督学习
全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】ALBERT提出了特定的参数缩减技术,以降低内存消耗并提高BERT的
训练
速度
·
2025-02-14 05:05
人工智能
rk3588部署yolov8视频目标检测教程
目录1.环境配置1.1
训练
和导出onnx环境(电脑端执行)1.2导出rknn环境(电脑端执行)2.
训练
部分(电脑端执行)2.1
训练
脚本(电脑端执行)3.onnx转rknn(电脑端执行)1.环境配置1.1
今夕是何年,
·
2025-02-14 05:58
视觉算法部署
YOLO
目标检测
人工智能
【Transformer】小白入门指南
Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork)位置编码(PositionalEncoding)残差连接与标准化框架认识1.输入输出2.Encoder3.Decoder4.
训练
过程
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
Python阶段小结:从零基础到项目实战的蜕变之旅
️知识肌肉
训练
清单
训练
部位核心动作(知识点)动作标准(关键要点)基础代谢变量/数据类型、运算符、f-stringtype()类型检测,f"{value:.2f}"精度控制条件反射if-elif-else
GHXX.
·
2025-02-14 04:18
python
学习
笔记
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式预
训练
模型(GPT),它通过大量文本数据
训练
,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
华为 MindStudio 安装指南
它支持模型
训练
、推理、算子开发、性能优化等AI任务,并依赖CANN(ComputeArchitectureforNeuralNetworks)作为计算架构基础。
丰年稻香
·
2025-02-14 03:01
人工智能
python
人工智能
DeepSeek为何如此厉害,先是横扫华尔街,又是引得国内三大运营商争相加入?普通人又该如何入局?
在DeepSeek诞生之前,全世界对于AI大模型的认知是:只有疯狂砸钱,堆算力才能做出类似于OpenAI这样强大的AI大模型;可在DeepSeek诞生之后,直接将AI大模型的
训练
成本降低为不到原先的1%
2501_90560745
·
2025-02-14 02:51
人工智能
程序人生
chatgpt
AI写作
课程设计
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在深度学习和大规模预
训练
模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D
四卡RTX5080VS两卡RTX5090D:AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度,分析在部署和
训练
大规模AI模型时,采用四卡RTX5080方案与两卡RTX5090D
weixin_40941102
·
2025-02-14 01:47
语言模型
人工智能
自然语言处理
商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
升级服务:全周期定制化方案,赋能智能开发全流程商汤大装置依托领先的技术平台与专家资源,形成了"场景定义-
训练
-部署-迭代"的闭环服务体系,确保客户开发效率与应用效果的双重提升。
·
2025-02-14 01:01
deepseek人工智能
零基础入门机器学习 -- 第二章机器学习的基本流程
训练
模型:让模型从数据中学习模式并调整参数。评估模型:检查模型的准确率,以判断效果是否良好。本章会通过电影评分预测的示例,帮助你快速体验从数据到模型的基本
山海青风
·
2025-02-14 01:14
#
机器学习
机器学习
python
人工智能
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他