E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
寒假训练题
警告accumulate and all-reduce gradients in fp32 for bfloat16 data type
这条警告信息是关于分布式
训练
中的通信优化策略的,具体涉及流水线并行(PipelineParallelism)和点对点通信(P2PCommunication)。
NLstudy33
·
2025-02-14 14:36
python
DexVLA:通用机器人控制中具有插件式扩散专家的视觉语言模型
虽然视觉-语言-动作(VLA)模型已显示出可泛化机器人技能的前景,但要充分发挥其潜力,需要解决动作表示和有效
训练
方面的限制。当前的VLA模型通
硅谷秋水
·
2025-02-14 13:03
大模型
智能体
计算机视觉
语言模型
计算机视觉
深度学习
机器学习
人工智能
9、深度学习-自学之路-损失函数、梯度下降、学习率、权重更新的理解
我们先来讲一下损失函数,e_dn=(p_dn-ture)**2#损失值的计算p_dn:预测值ture:真实值e_dn:损失值我们在第7章说了,我们的预测值和真实值相差越小(也就是损失值越小),说明我们模型
训练
的越好
小宇爱
·
2025-02-14 11:16
深度学习-自学之路
深度学习
学习
人工智能
Next.js v15-样式处理
#
题
引:我认为跟着官方文档学习不会走歪路Next.js支持多种为应用程序添加样式的方法,包括:CSSModules:创建局部作用域的CSS类,避免命名冲突并提高可维护性。
红绿鲤鱼
·
2025-02-14 11:45
javascript
开发语言
Next.js
LeetCode第22
题
_括号生成
LeetCode第22
题
:括号生成题目描述数字n代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且有效的括号组合。
@蓝莓果粒茶
·
2025-02-14 10:43
算法
leetcode
算法
职场和发展
c#
unity
数据结构
27、深度学习-自学之路-NLP自然语言处理-做一个简单的项目识别一组电影评论,来判断电影评论是积极的,还是消极的。
一、如果我们要做这个项目,第一步我们要做的就是需要有对应的
训练
数据集。
小宇爱
·
2025-02-14 10:39
深度学习-自学之路
深度学习
自然语言处理
人工智能
DeepSeek正重构人形机器人和具身大模型赛道!
2024年1月20日,公司发布全球首个完全通过强化学习
训练
的专注于推理任务的高性能语言模型DeepSeek-R1
Robot251
·
2025-02-14 10:38
重构
机器人
人工智能
科技
大数据
自动驾驶
分布式
训练
三大并行策略:数据、模型与流水线并行的本质解析
分布式
训练
通过多维度并行策略实现:算力维度:聚合多卡计算能力存储维度:分布式参数存储通信维度:优化数据传输路径本文将深入剖析三大并行策略的数学本质。
WHCIS
·
2025-02-14 10:07
#
分布式训练
人工智能与机器学习
分布式
人工智能
深度学习
大数据、云计算、人工智能等技术深度融合的智慧快消开源了。
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-14 10:37
大数据
云计算
人工智能
音视频
运维
《深度解析:批量、随机和小批量梯度下降的区别与应用》
原理与计算方式批量梯度下降(BGD):BGD在每次迭代时,都会使用整个
训练
数据集来计算损失函数的梯度,然后根据梯度更新模型参数。例如,若
训练
集中有1000个样本,那么每次迭代
·
2025-02-14 09:40
人工智能深度学习
【深度学习入门实战】基于Keras的手写数字识别实战(附完整可视化分析)
文章将包含:关键概念图解完整实现代码
训练
过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
机器学习司猫白
·
2025-02-14 09:01
深度学习
深度学习
keras
人工智能
机器学习
python
模型实战(19)之 从头搭建yolov9环境+tensorrt部署+CUDA前处理 -> 实现目标检测
从头搭建yolov9环境+tensorrt部署实现目标检测yolov9虚拟环境搭建实现
训练
、推理与导出导出onnx并转为tensorrt模型Python\C++-trt实现推理,CUDA实现图像前处理文中将给出详细实现源码
明月醉窗台
·
2025-02-14 09:59
#
深度学习实战例程
目标检测
人工智能
计算机视觉
图像处理
YOLO
LeetCode第23
题
_合并K个升序链表
LeetCode第23
题
:合并K个升序链表题目描述给你一个链表数组,每个链表都已经按升序排列。请你将所有链表合并到一个升序链表中,返回合并后的链表。
@蓝莓果粒茶
·
2025-02-14 08:57
算法
leetcode
链表
windows
算法
c#
unity
数据结构
基于PyTorch的生成对抗网络入门(5)——利用PyTorch搭建条件生成对抗网络(CGAN)超详解
案例描述二、代码详解2.1构建真实数据集2.2创建生成虚假数据2.3构建判别器2.3.1创建生成虚假标签2.3.2判别器类2.3.3测试判别器2.4构建生成器2.4.1生成器类2.4.2测试生成器2.5
训练
wendy_ya
·
2025-02-14 08:56
PyTorch
python
pytorch
生成对抗网络
深度学习
python
神经网络
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预
训练
的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
AI 写作(三)文本生成算法:创新与突破
在
训练
复杂度方面,生成式模型通常较为复杂,因为它需要学习更多的参数来模拟数据的生成过程。例如,常
sdgfsdfxcg
·
2025-02-14 06:11
人工智能
算法
ACM
寒假
培训5
学习总结一.深度优先搜索DFS注意点1.用boolvis[]标记当前是否走过2.停止条件3.边界函数4.递归进行搜索5.记得回溯,vis[]变为false二.广度优先搜索BFS过程1.dx[],dy[]储存方向向量2.vis[]标记是否走过3.用队列每一个元素作为起点4.如果某个方向的下一个位置还没走过,那么就走到该位置,并记录,同时让该点入队,用队列才能保证走最近的路线解题思路及代码洛谷P125
ZIZIZIZIZ()
·
2025-02-14 05:33
算法
笔记
深度优先
广度优先
第二章:9.5 多个输出的分类
构建多标签分类神经网络的方法方法一:独立
训练
多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说,
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
ALBERT:轻量级的BERT,用于语言表征的自监督学习
全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】ALBERT提出了特定的参数缩减技术,以降低内存消耗并提高BERT的
训练
速度
·
2025-02-14 05:05
人工智能
rk3588部署yolov8视频目标检测教程
目录1.环境配置1.1
训练
和导出onnx环境(电脑端执行)1.2导出rknn环境(电脑端执行)2.
训练
部分(电脑端执行)2.1
训练
脚本(电脑端执行)3.onnx转rknn(电脑端执行)1.环境配置1.1
今夕是何年,
·
2025-02-14 05:58
视觉算法部署
YOLO
目标检测
人工智能
c语言如何输入带\n和空格的字符串
样例输入:IlikeC++.样例输出:11思路:这道
题
要使用数组储存输入的内容,判
爱吃芝麻汤圆
·
2025-02-14 04:52
C语言
c语言
数据结构
c++
【Transformer】小白入门指南
Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork)位置编码(PositionalEncoding)残差连接与标准化框架认识1.输入输出2.Encoder3.Decoder4.
训练
过程
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
Python阶段小结:从零基础到项目实战的蜕变之旅
️知识肌肉
训练
清单
训练
部位核心动作(知识点)动作标准(关键要点)基础代谢变量/数据类型、运算符、f-stringtype()类型检测,f"{value:.2f}"精度控制条件反射if-elif-else
GHXX.
·
2025-02-14 04:18
python
学习
笔记
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式预
训练
模型(GPT),它通过大量文本数据
训练
,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
华为 MindStudio 安装指南
它支持模型
训练
、推理、算子开发、性能优化等AI任务,并依赖CANN(ComputeArchitectureforNeuralNetworks)作为计算架构基础。
丰年稻香
·
2025-02-14 03:01
人工智能
python
人工智能
全排列(力扣46)
这道
题
让我们求这个集合有多少种排列方式,那么与之前组合问题的不同就在于要考虑元素之间的顺序了,所以每一层递归的or循环的起始值无需变量控制,都从0开始。
qy发大财
·
2025-02-14 03:59
leetcode
算法
职场和发展
最大子数组和(力扣53)
这道
题
的贪心贪在何处呢?当我们发现当前的子数组和已经为负数时,就要立马清0,因为继续加的话,一定会让后面的数字变小,这样一定无法达到题目要求的最大子数组和。
qy发大财
·
2025-02-14 03:59
leetcode
算法
职场和发展
力扣(leetcode)第455
题
分发饼干(Python)
455.分发饼干题目链接:455.分发饼干假设你是一位很棒的家长,想要给你的孩子们一些小饼干。但是,每个孩子最多只能给一块饼干。对每个孩子i,都有一个胃口值g[i],这是能让孩子们满足胃口的饼干的最小尺寸;并且每块饼干j,都有一个尺寸s[j]。如果s[j]>=g[i],我们可以将这个饼干j分配给孩子i,这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子,并输出这个最大数值。示例1:输入:g=[
十八子是李
·
2025-02-14 02:26
Python题集
leetcode
python
算法
开发语言
DeepSeek为何如此厉害,先是横扫华尔街,又是引得国内三大运营商争相加入?普通人又该如何入局?
在DeepSeek诞生之前,全世界对于AI大模型的认知是:只有疯狂砸钱,堆算力才能做出类似于OpenAI这样强大的AI大模型;可在DeepSeek诞生之后,直接将AI大模型的
训练
成本降低为不到原先的1%
2501_90560745
·
2025-02-14 02:51
人工智能
程序人生
chatgpt
AI写作
课程设计
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在深度学习和大规模预
训练
模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
分发饼干(力扣455)
从这道
题
开始我们就进入贪心算法的学习了。这个算法没有固定的套路,甚至题目之间的联系也很少,基本上每一道
题
都要当新
题
来写。我们能做的只有见多识广,这样才有机会在考试中根据以往经验解决贪心的题目。
qy发大财
·
2025-02-14 01:49
leetcode
算法
职场和发展
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D
四卡RTX5080VS两卡RTX5090D:AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度,分析在部署和
训练
大规模AI模型时,采用四卡RTX5080方案与两卡RTX5090D
weixin_40941102
·
2025-02-14 01:47
语言模型
人工智能
自然语言处理
商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
升级服务:全周期定制化方案,赋能智能开发全流程商汤大装置依托领先的技术平台与专家资源,形成了"场景定义-
训练
-部署-迭代"的闭环服务体系,确保客户开发效率与应用效果的双重提升。
·
2025-02-14 01:01
deepseek人工智能
零基础入门机器学习 -- 第二章机器学习的基本流程
训练
模型:让模型从数据中学习模式并调整参数。评估模型:检查模型的准确率,以判断效果是否良好。本章会通过电影评分预测的示例,帮助你快速体验从数据到模型的基本
山海青风
·
2025-02-14 01:14
#
机器学习
机器学习
python
人工智能
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
机器学习算法工程师笔试选择
题
(1)
1.关于梯度下降的说法正确的是:A.梯度下降法可以确保找到全局最优解。B.随机梯度下降每次使用所有数据来更新参数。C.批量梯度下降(BatchGradientDescent)通常收敛更快。D.学习率过大会导致梯度下降过程震荡。答案:D(学习率过大会导致不稳定,可能震荡或无法收敛)2.在以下算法中,哪种算法属于无监督学习?A.逻辑回归B.K-近邻算法C.支持向量机D.K-均值聚类答案:D(K-均值聚
Ash Butterfield
·
2025-02-14 00:08
机器学习
算法
人工智能
YOLO各版本原理和优缺点解析
模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
一、C语言编程LeetCode数据结构
题
一、链表1、两数相加算法思想:1、设置两个指针p,q,分别指向两个链表的头结点2、设置一个临时变量temp,用来记录两个数相加时是否有进位,初始化为0。只要p,q指针不指向空,就循环把两个指针所指向节点的值和temp相加。如果大于9,就让一个临时变量设置为1,并把相加结果减10,把结果赋给两个指针所指向节点的值;如果小于9就直接赋值给两个节点所指向的值。然后p,q指针分别后移一个节点。3、最后,判
失败才是人生常态
·
2025-02-13 22:58
考研初试准备
c语言
数据结构
CF Round 1004 记录 & 题解(div.1 A - D1 & div.2 D - F)
上午C
题
因为少判了一个条件,罚时吃饱了。[Codeforces2066A&2067D]ObjectIdentification神奇交互
题
。
JeremyHe1209
·
2025-02-13 22:57
算法
考核第四
题
视频QQ2025210-22215代码Document.a{width:500px;height:400px;margin:0auto;}.b{display:flex;justify-content:center;}.nav{margin:20px;}a{text-decoration:none;color:black;}.c{color:rgb(194,145,237);}.e{display
故里人间165
·
2025-02-13 22:23
前端
javascript
css
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他