E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
落地训练
大数据、云计算、人工智能等技术深度融合的智慧快消开源了。
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-14 10:37
大数据
云计算
人工智能
音视频
运维
《深度解析:批量、随机和小批量梯度下降的区别与应用》
原理与计算方式批量梯度下降(BGD):BGD在每次迭代时,都会使用整个
训练
数据集来计算损失函数的梯度,然后根据梯度更新模型参数。例如,若
训练
集中有1000个样本,那么每次迭代
·
2025-02-14 09:40
人工智能深度学习
【深度学习入门实战】基于Keras的手写数字识别实战(附完整可视化分析)
文章将包含:关键概念图解完整实现代码
训练
过程可视化模型效果深度分析环境准备importnumpyasnpimportmatplotlib.pyplotaspltfromtensorflowimportkerasfromtensorflo
机器学习司猫白
·
2025-02-14 09:01
深度学习
深度学习
keras
人工智能
机器学习
python
模型实战(19)之 从头搭建yolov9环境+tensorrt部署+CUDA前处理 -> 实现目标检测
从头搭建yolov9环境+tensorrt部署实现目标检测yolov9虚拟环境搭建实现
训练
、推理与导出导出onnx并转为tensorrt模型Python\C++-trt实现推理,CUDA实现图像前处理文中将给出详细实现源码
明月醉窗台
·
2025-02-14 09:59
#
深度学习实战例程
目标检测
人工智能
计算机视觉
图像处理
YOLO
基于PyTorch的生成对抗网络入门(5)——利用PyTorch搭建条件生成对抗网络(CGAN)超详解
案例描述二、代码详解2.1构建真实数据集2.2创建生成虚假数据2.3构建判别器2.3.1创建生成虚假标签2.3.2判别器类2.3.3测试判别器2.4构建生成器2.4.1生成器类2.4.2测试生成器2.5
训练
wendy_ya
·
2025-02-14 08:56
PyTorch
python
pytorch
生成对抗网络
深度学习
python
神经网络
技术分享 | 《云原生下的IAST
落地
实践》
悬镜安全合伙人、华东区技术运营负责人周幸带来《云原生下的IAST
落地
实践》主题演讲。内容摘要:云原生概述云
悬镜安全
·
2025-02-14 08:25
安全技术
IAST
云原生安全
悬镜安全
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预
训练
的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
AI 写作(三)文本生成算法:创新与突破
在
训练
复杂度方面,生成式模型通常较为复杂,因为它需要学习更多的参数来模拟数据的生成过程。例如,常
sdgfsdfxcg
·
2025-02-14 06:11
人工智能
算法
第二章:9.5 多个输出的分类
构建多标签分类神经网络的方法方法一:独立
训练
多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说,
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
ALBERT:轻量级的BERT,用于语言表征的自监督学习
全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】ALBERT提出了特定的参数缩减技术,以降低内存消耗并提高BERT的
训练
速度
·
2025-02-14 05:05
人工智能
rk3588部署yolov8视频目标检测教程
目录1.环境配置1.1
训练
和导出onnx环境(电脑端执行)1.2导出rknn环境(电脑端执行)2.
训练
部分(电脑端执行)2.1
训练
脚本(电脑端执行)3.onnx转rknn(电脑端执行)1.环境配置1.1
今夕是何年,
·
2025-02-14 05:58
视觉算法部署
YOLO
目标检测
人工智能
解读 119页可编辑PPT 大型集团企业财务共享业财一体化平台建设方案
该方案介绍了某大型集团企业财务共享业财一体化平台的建设方案,包括项目理解、项目计划、实施方案、项目
落地
方案、Q&A与保障管理咨询承接等多个方面。
智慧化智能化数字化方案
·
2025-02-14 05:55
方案解读馆
人工智能
财务共享系统
业财一体化平台
财务数字化转型
财务共享管控
【Transformer】小白入门指南
Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork)位置编码(PositionalEncoding)残差连接与标准化框架认识1.输入输出2.Encoder3.Decoder4.
训练
过程
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
Python阶段小结:从零基础到项目实战的蜕变之旅
️知识肌肉
训练
清单
训练
部位核心动作(知识点)动作标准(关键要点)基础代谢变量/数据类型、运算符、f-stringtype()类型检测,f"{value:.2f}"精度控制条件反射if-elif-else
GHXX.
·
2025-02-14 04:18
python
学习
笔记
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式预
训练
模型(GPT),它通过大量文本数据
训练
,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
华为 MindStudio 安装指南
它支持模型
训练
、推理、算子开发、性能优化等AI任务,并依赖CANN(ComputeArchitectureforNeuralNetworks)作为计算架构基础。
丰年稻香
·
2025-02-14 03:01
人工智能
python
人工智能
DeepSeek为何如此厉害,先是横扫华尔街,又是引得国内三大运营商争相加入?普通人又该如何入局?
在DeepSeek诞生之前,全世界对于AI大模型的认知是:只有疯狂砸钱,堆算力才能做出类似于OpenAI这样强大的AI大模型;可在DeepSeek诞生之后,直接将AI大模型的
训练
成本降低为不到原先的1%
2501_90560745
·
2025-02-14 02:51
人工智能
程序人生
chatgpt
AI写作
课程设计
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在深度学习和大规模预
训练
模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D
四卡RTX5080VS两卡RTX5090D:AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度,分析在部署和
训练
大规模AI模型时,采用四卡RTX5080方案与两卡RTX5090D
weixin_40941102
·
2025-02-14 01:47
语言模型
人工智能
自然语言处理
商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
升级服务:全周期定制化方案,赋能智能开发全流程商汤大装置依托领先的技术平台与专家资源,形成了"场景定义-
训练
-部署-迭代"的闭环服务体系,确保客户开发效率与应用效果的双重提升。
·
2025-02-14 01:01
deepseek人工智能
零基础入门机器学习 -- 第二章机器学习的基本流程
训练
模型:让模型从数据中学习模式并调整参数。评估模型:检查模型的准确率,以判断效果是否良好。本章会通过电影评分预测的示例,帮助你快速体验从数据到模型的基本
山海青风
·
2025-02-14 01:14
#
机器学习
机器学习
python
人工智能
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与
落地
实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
乙巳年正月十六晴日行
乙巳年正月十六晴日行春阳北风寒,梅花
落地
香。琵芭招蜂蝶,最忧化尘伤。枝条芽孢发,柔软伸展长。娇翠青樟下,历程大道上。迎来新气象,送往旧时尚。久远常感怀,近日少迷茫。年有四季分,月经三旬浪。
一叶迎秋
·
2025-02-13 21:21
文心一言
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
“我不喜欢Tensorflow,但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027),和大家简单地聊了一下关于如何在
训练
过程中有序地组织
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
具身智能
训练
新思路!将生成视频用于
训练
机器人
将生成视频用于
训练
具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散模型、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、
训练
成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
为什么说网络安全行业是IT行业最后的红利?
这几年随着我国《国家网络空间安全战略》《网络安全法》《网络安全等级保护2.0》等一系列政策/法规/标准的持续
落地
,网络安全行业地位、薪资随之水涨船高。
网络安全技术分享地
·
2025-02-13 18:00
web安全
安全
docker
网络安全
网络攻击模型
从零开始大模型开发与微调:Miniconda的下载与安装
这些模型通过在海量文本数据上进行预
训练
,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的模型评估技术,目的是通过将数据集分割为多个子集,反复
训练
和验证模型,以便更好地估计模型的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
美团一面,有点难度。
一位粉丝朋友分享了最近参与美团民宿旅游业务线的一面的经历,全程约1小时,面试官围绕高并发、分布式事务、性能优化等高频考点展开追问,问题密集且注重
落地
细节。
·
2025-02-13 16:08
go
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
【深度学习】常见模型-GPT(Generative Pre-trained Transformer,生成式预
训练
Transformer)
GPT(GenerativePre-trainedTransformer,生成式预
训练
Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令微调简介7.2为有监督的指令微调准备数据集7.3将数据整理成
训练
批次7.4为指令数据集创建数据加载器7.5加载预
训练
的大语言模型7.6在指令数据上对大语言模型进行微调7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
基于深度学习的半导体检测与预测算法研究(二)
本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法,介绍了常见的深度学习模型如卷积神经网络(CNN)、循环神经网络(RNN)及其变体在半导体数据处理中的应用,分析了模型
训练
与优化的关键技术
埃菲尔铁塔_CV算法
·
2025-02-13 12:45
深度学习
人工智能
神经网络
opencv
计算机视觉
python
基于深度学习的半导体算法原理及应用
详细分析了这些算法处理半导体相关数据的机制,探讨了算法实现中的关键技术,如数据预处理、模型
训练
与优化等。通过实际案例展示
埃菲尔铁塔_CV算法
·
2025-02-13 12:44
算法
机器学习
人工智能
计算机视觉
深度学习
python
模型应用管理的成功之道:策略、工具与团队协作
●
训练
与验证:使用
训练
数据
训练
模型,并通过验证集评估模型性能。●超参数调优:通过交叉验证、网格搜索等方法优化模型超参数。2.模型部署●
·
2025-02-13 11:28
项目管理工具
图像分类与目标检测算法
本文将详细介绍这两项技术的算法原理、技术进展以及当前的
落地
应用。一、图像分类算法图像分类是指将输入的图像划分为预定义的类别之一。这一过程的核心在于特征提取和分类器的设计。
BugNest
·
2025-02-13 10:26
AI
算法
分类
目标检测
ai
人工智能
图像处理
DeepSeek-V2 论文解读:混合专家架构的新突破
Economical,andEfficientMixture-of-ExpertsLanguageModel目录一、引言二、模型架构(一)多头部潜在注意力(MLA):重塑推理效率(二)DeepSeekMoE:经济高效的
训练
架构三
进一步有进一步的欢喜
·
2025-02-13 09:49
DeepSeek-V2
大模型
MoE
混合专家架构
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他