E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
记忆训练
合作阿里后,传苹果仍将和百度合作开发AI;库克预告2月19日迎接“家庭新成员”;Gemini宣布上线全局
记忆
功能 | 极客头条
「极客头条」——技术人员的新闻圈!CSDN的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|郑丽媛出品|CSDN(ID:CSDNnews)一分钟速览新闻点!合作阿里巴巴后,传苹果仍将和百度合作开发AI抖音副总裁回应代码抄袭:重复代码占比很小,涉事员工已离职宇树人形机器人G1亮相春晚后热租,日租金最高达1.5万元传蓝思科技有望成为苹果折叠屏玻璃供应商,回应:涉
极客日报
·
2025-02-14 14:04
人工智能
百度
DexVLA:通用机器人控制中具有插件式扩散专家的视觉语言模型
虽然视觉-语言-动作(VLA)模型已显示出可泛化机器人技能的前景,但要充分发挥其潜力,需要解决动作表示和有效
训练
方面的限制。当前的VLA模型通
硅谷秋水
·
2025-02-14 13:03
大模型
智能体
计算机视觉
语言模型
计算机视觉
深度学习
机器学习
人工智能
蓝桥杯单片机国奖模板(全考也不怕)
定时器0用于Ne555测频率定时器1用于主程序控制定时器2用于串口通信PCA定时器用于超声波注意不要死记模板,理解
记忆
,基础最重要。不讲原理直接上代码,文末有某度网盘链接直接下载。
雁北.
·
2025-02-14 13:59
蓝桥杯
单片机
c语言
9、深度学习-自学之路-损失函数、梯度下降、学习率、权重更新的理解
我们先来讲一下损失函数,e_dn=(p_dn-ture)**2#损失值的计算p_dn:预测值ture:真实值e_dn:损失值我们在第7章说了,我们的预测值和真实值相差越小(也就是损失值越小),说明我们模型
训练
的越好
小宇爱
·
2025-02-14 11:16
深度学习-自学之路
深度学习
学习
人工智能
27、深度学习-自学之路-NLP自然语言处理-做一个简单的项目识别一组电影评论,来判断电影评论是积极的,还是消极的。
一、如果我们要做这个项目,第一步我们要做的就是需要有对应的
训练
数据集。
小宇爱
·
2025-02-14 10:39
深度学习-自学之路
深度学习
自然语言处理
人工智能
DeepSeek正重构人形机器人和具身大模型赛道!
2024年1月20日,公司发布全球首个完全通过强化学习
训练
的专注于推理任务的高性能语言模型DeepSeek-R1
Robot251
·
2025-02-14 10:38
重构
机器人
人工智能
科技
大数据
自动驾驶
分布式
训练
三大并行策略:数据、模型与流水线并行的本质解析
分布式
训练
通过多维度并行策略实现:算力维度:聚合多卡计算能力存储维度:分布式参数存储通信维度:优化数据传输路径本文将深入剖析三大并行策略的数学本质。
WHCIS
·
2025-02-14 10:07
#
分布式训练
人工智能与机器学习
分布式
人工智能
深度学习
大数据、云计算、人工智能等技术深度融合的智慧快消开源了。
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-14 10:37
大数据
云计算
人工智能
音视频
运维
《深度解析:批量、随机和小批量梯度下降的区别与应用》
原理与计算方式批量梯度下降(BGD):BGD在每次迭代时,都会使用整个
训练
数据集来计算损失函数的梯度,然后根据梯度更新模型参数。例如,若
训练
集中有1000个样本,那么每次迭代
·
2025-02-14 09:40
人工智能深度学习
【深度学习入门实战】基于Keras的手写数字识别实战(附完整可视化分析)
文章将包含:关键概念图解完整实现代码
训练
过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
机器学习司猫白
·
2025-02-14 09:01
深度学习
深度学习
keras
人工智能
机器学习
python
模型实战(19)之 从头搭建yolov9环境+tensorrt部署+CUDA前处理 -> 实现目标检测
从头搭建yolov9环境+tensorrt部署实现目标检测yolov9虚拟环境搭建实现
训练
、推理与导出导出onnx并转为tensorrt模型Python\C++-trt实现推理,CUDA实现图像前处理文中将给出详细实现源码
明月醉窗台
·
2025-02-14 09:59
#
深度学习实战例程
目标检测
人工智能
计算机视觉
图像处理
YOLO
基于PyTorch的生成对抗网络入门(5)——利用PyTorch搭建条件生成对抗网络(CGAN)超详解
案例描述二、代码详解2.1构建真实数据集2.2创建生成虚假数据2.3构建判别器2.3.1创建生成虚假标签2.3.2判别器类2.3.3测试判别器2.4构建生成器2.4.1生成器类2.4.2测试生成器2.5
训练
wendy_ya
·
2025-02-14 08:56
PyTorch
python
pytorch
生成对抗网络
深度学习
python
神经网络
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预
训练
的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
AI 写作(三)文本生成算法:创新与突破
在
训练
复杂度方面,生成式模型通常较为复杂,因为它需要学习更多的参数来模拟数据的生成过程。例如,常
sdgfsdfxcg
·
2025-02-14 06:11
人工智能
算法
第二章:9.5 多个输出的分类
构建多标签分类神经网络的方法方法一:独立
训练
多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说,
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
ALBERT:轻量级的BERT,用于语言表征的自监督学习
全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】ALBERT提出了特定的参数缩减技术,以降低内存消耗并提高BERT的
训练
速度
·
2025-02-14 05:05
人工智能
rk3588部署yolov8视频目标检测教程
目录1.环境配置1.1
训练
和导出onnx环境(电脑端执行)1.2导出rknn环境(电脑端执行)2.
训练
部分(电脑端执行)2.1
训练
脚本(电脑端执行)3.onnx转rknn(电脑端执行)1.环境配置1.1
今夕是何年,
·
2025-02-14 05:58
视觉算法部署
YOLO
目标检测
人工智能
【Transformer】小白入门指南
Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork)位置编码(PositionalEncoding)残差连接与标准化框架认识1.输入输出2.Encoder3.Decoder4.
训练
过程
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
Python阶段小结:从零基础到项目实战的蜕变之旅
️知识肌肉
训练
清单
训练
部位核心动作(知识点)动作标准(关键要点)基础代谢变量/数据类型、运算符、f-stringtype()类型检测,f"{value:.2f}"精度控制条件反射if-elif-else
GHXX.
·
2025-02-14 04:18
python
学习
笔记
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式预
训练
模型(GPT),它通过大量文本数据
训练
,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
华为 MindStudio 安装指南
它支持模型
训练
、推理、算子开发、性能优化等AI任务,并依赖CANN(ComputeArchitectureforNeuralNetworks)作为计算架构基础。
丰年稻香
·
2025-02-14 03:01
人工智能
python
人工智能
DeepSeek为何如此厉害,先是横扫华尔街,又是引得国内三大运营商争相加入?普通人又该如何入局?
在DeepSeek诞生之前,全世界对于AI大模型的认知是:只有疯狂砸钱,堆算力才能做出类似于OpenAI这样强大的AI大模型;可在DeepSeek诞生之后,直接将AI大模型的
训练
成本降低为不到原先的1%
2501_90560745
·
2025-02-14 02:51
人工智能
程序人生
chatgpt
AI写作
课程设计
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在深度学习和大规模预
训练
模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D
四卡RTX5080VS两卡RTX5090D:AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度,分析在部署和
训练
大规模AI模型时,采用四卡RTX5080方案与两卡RTX5090D
weixin_40941102
·
2025-02-14 01:47
语言模型
人工智能
自然语言处理
商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
升级服务:全周期定制化方案,赋能智能开发全流程商汤大装置依托领先的技术平台与专家资源,形成了"场景定义-
训练
-部署-迭代"的闭环服务体系,确保客户开发效率与应用效果的双重提升。
·
2025-02-14 01:01
deepseek人工智能
零基础入门机器学习 -- 第二章机器学习的基本流程
训练
模型:让模型从数据中学习模式并调整参数。评估模型:检查模型的准确率,以判断效果是否良好。本章会通过电影评分预测的示例,帮助你快速体验从数据到模型的基本
山海青风
·
2025-02-14 01:14
#
机器学习
机器学习
python
人工智能
真正通俗易懂的Langchain入门学习(一)
与普通LLM应用的区别:支持多步骤任务、
记忆
管理、外部工具集成。核心
caridle
·
2025-02-14 00:42
智能体
langchain
学习
数据库
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
“我不喜欢Tensorflow,但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027),和大家简单地聊了一下关于如何在
训练
过程中有序地组织
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
具身智能
训练
新思路!将生成视频用于
训练
机器人
将生成视频用于
训练
具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散模型、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、
训练
成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
从零开始大模型开发与微调:Miniconda的下载与安装
这些模型通过在海量文本数据上进行预
训练
,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的模型评估技术,目的是通过将数据集分割为多个子集,反复
训练
和验证模型,以便更好地估计模型的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
【深度学习】常见模型-GPT(Generative Pre-trained Transformer,生成式预
训练
Transformer)
GPT(GenerativePre-trainedTransformer,生成式预
训练
Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令微调简介7.2为有监督的指令微调准备数据集7.3将数据整理成
训练
批次7.4为指令数据集创建数据加载器7.5加载预
训练
的大语言模型7.6在指令数据上对大语言模型进行微调7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
基于深度学习的半导体检测与预测算法研究(二)
本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法,介绍了常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)及其变体在半导体数据处理中的应用,分析了模型
训练
与优化的关键技术
埃菲尔铁塔_CV算法
·
2025-02-13 12:45
深度学习
人工智能
神经网络
opencv
计算机视觉
python
基于深度学习的半导体算法原理及应用
本文全面阐述了基于深度学习的半导体算法原理,涵盖卷积神经网络(CNN)、循环神经网络(RNN)及其变体长短时
记忆
网络(LSTM)和门控循环单元(GRU)等在半导体制造过程监测、缺陷检测、性能预测等方面的应用
埃菲尔铁塔_CV算法
·
2025-02-13 12:44
算法
机器学习
人工智能
计算机视觉
深度学习
python
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他