E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
深度学习训练
我的创作纪念日
技术领域发展日新月异,为了紧跟前沿,我不断学习新的知识,如人工智能中的
深度学习
框架、云计算的最新技术应用等。在学习过程中,我将遇到的难点、理解的过程以及总结的知识点记录下来,整理成文章发布在
学无止尽5
·
2025-02-14 07:45
经验分享
视觉中的transformer:ViT
但是在cv领域用的很少,视觉里一般是和cnn一起用或者把某些conv替换成transformer(整体还是CNN)本篇文章证明纯的transformer直接在图片分类上也做得很好:在大量数据集上进行预
训练
的前提上
ch隔壁老张
·
2025-02-14 06:12
深度学习笔记
transformer
深度学习
计算机视觉
AI 写作(三)文本生成算法:创新与突破
在
训练
复杂度方面,生成式模型通常较为复杂,因为它需要学习更多的参数来模拟数据的生成过程。例如,常
sdgfsdfxcg
·
2025-02-14 06:11
人工智能
算法
第二章:9.5 多个输出的分类
构建多标签分类神经网络的方法方法一:独立
训练
多个神经网络一种方法是将多标签分类问题分解为多个独立的二分类问题。具体来说,
望云山190
·
2025-02-14 05:33
分类
数据挖掘
人工智能
AI人工智能
深度学习
算法:在缺陷检测中的应用
AI人工智能
深度学习
算法:在缺陷检测中的应用1.背景介绍1.1缺陷检测的重要性在制造业中,产品质量是关键因素之一。缺陷检测是确保产品质量的重要环节,旨在及时发现并排除产品中的任何缺陷或异常。
AI天才研究院
·
2025-02-14 05:59
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
ALBERT:轻量级的BERT,用于语言表征的自监督学习
全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎【柏企】公众号【柏企科技说】【柏企阅文】ALBERT提出了特定的参数缩减技术,以降低内存消耗并提高BERT的
训练
速度
·
2025-02-14 05:05
人工智能
rk3588部署yolov8视频目标检测教程
目录1.环境配置1.1
训练
和导出onnx环境(电脑端执行)1.2导出rknn环境(电脑端执行)2.
训练
部分(电脑端执行)2.1
训练
脚本(电脑端执行)3.onnx转rknn(电脑端执行)1.环境配置1.1
今夕是何年,
·
2025-02-14 05:58
视觉算法部署
YOLO
目标检测
人工智能
【Transformer】小白入门指南
Multi-HeadAttention)前馈神经网络(Feed-ForwardNeuralNetwork)位置编码(PositionalEncoding)残差连接与标准化框架认识1.输入输出2.Encoder3.Decoder4.
训练
过程
静静喜欢大白
·
2025-02-14 04:18
随记
医疗影像
transformer
深度学习
人工智能
Python阶段小结:从零基础到项目实战的蜕变之旅
️知识肌肉
训练
清单
训练
部位核心动作(知识点)动作标准(关键要点)基础代谢变量/数据类型、运算符、f-stringtype()类型检测,f"{value:.2f}"精度控制条件反射if-elif-else
GHXX.
·
2025-02-14 04:18
python
学习
笔记
使用OpenAI的API构建聊天机器人
核心原理解析聊天机器人主要依赖于生成式预
训练
模型(GPT),它通过大量文本数据
训练
,学习语言模式和上下文关联,从而能够生成
dgay_hua
·
2025-02-14 04:16
机器人
python
华为 MindStudio 安装指南
它支持模型
训练
、推理、算子开发、性能优化等AI任务,并依赖CANN(ComputeArchitectureforNeuralNetworks)作为计算架构基础。
丰年稻香
·
2025-02-14 03:01
人工智能
python
人工智能
论文笔记《基于
深度学习
模型的药物-靶标结合亲和力预测》
基于
深度学习
模型的药物-靶标结合亲和力预测这是一篇二区的文章,算是一个综述,记录一下在阅读过程中遇到的问题。
I_dyllic
·
2025-02-14 03:57
深度学习
论文阅读
深度学习
人工智能
Andrej Karpathy:计算范式的变革者
他以其深刻的技术见解,对
深度学习
和自然语言处理领域的贡献,以及对计算范式的革新性思考,成为了当今技术领域的引领者之一。本文分为六个
AI天才研究院
·
2025-02-14 03:57
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
大厂Offer收割机
面试题
简历
程序员读书
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
DeepSeek为何如此厉害,先是横扫华尔街,又是引得国内三大运营商争相加入?普通人又该如何入局?
在DeepSeek诞生之前,全世界对于AI大模型的认知是:只有疯狂砸钱,堆算力才能做出类似于OpenAI这样强大的AI大模型;可在DeepSeek诞生之后,直接将AI大模型的
训练
成本降低为不到原先的1%
2501_90560745
·
2025-02-14 02:51
人工智能
程序人生
chatgpt
AI写作
课程设计
人工智能之自然语言处理技术演进
近年来,NLP技术经历了从规则驱动到数据驱动的革命性演进,尤其是在
深度学习
和大规模预
训练
模型的推动下,取得了显著突破。
香橙薄荷心
·
2025-02-14 02:50
AI
人工智能
自然语言处理
面向生成式语言模型场景到底是选择4卡5080还是选择两卡5090D
四卡RTX5080VS两卡RTX5090D:AI大模型性能比拼实践与思考本文主要从算力、显存、多卡扩展效率以及性价比等多个角度,分析在部署和
训练
大规模AI模型时,采用四卡RTX5080方案与两卡RTX5090D
weixin_40941102
·
2025-02-14 01:47
语言模型
人工智能
自然语言处理
商汤大装置上架DeepSeek系列模型,限免体验、服务升级!
升级服务:全周期定制化方案,赋能智能开发全流程商汤大装置依托领先的技术平台与专家资源,形成了"场景定义-
训练
-部署-迭代"的闭环服务体系,确保客户开发效率与应用效果的双重提升。
·
2025-02-14 01:01
deepseek人工智能
零基础入门机器学习 -- 第二章机器学习的基本流程
训练
模型:让模型从数据中学习模式并调整参数。评估模型:检查模型的准确率,以判断效果是否良好。本章会通过电影评分预测的示例,帮助你快速体验从数据到模型的基本
山海青风
·
2025-02-14 01:14
#
机器学习
机器学习
python
人工智能
深度学习
-108-大语言模型LLM之基于langchain的结构化输出功能提取结构化信息
文章目录1langchain的结构化输出1.1推荐的使用流程1.2模式定义1.3返回结构化输出1.3.1工具调用(方式一)1.3.2JSON模式(方式二)1.3.3结构化输出法(方式三)2提取结构化信息2.1定义数据模型2.2配置提示模板2.3设置执行链3参考附录1langchain的结构化输出对于许多应用程序,例如聊天机器人,模型需要直接用自然语言响应用户。然而,在某些情况下,我们需要模型以结构
皮皮冰燃
·
2025-02-14 01:44
深度学习
深度学习
语言模型
langchain
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的
深度学习
工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
【学术投稿-2025年计算机视觉研究进展与应用国际学术会议 (ACVRA 2025)】CSS样式解析:行内、内部与外部样式的区别与优先级分析
本次会议将探讨前沿技术,包括
深度学习
、多模态学习、图像和视频分析、3D重建等,以及其在智能交通、医疗影像、增强现实和自动化等多个实际应用中的创新转化。会议官网:www.acvra.org目录前言一、
禁默
·
2025-02-13 20:11
前端
学术会议
css
前端
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
“我不喜欢Tensorflow,但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027),和大家简单地聊了一下关于如何在
训练
过程中有序地组织
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
具身智能
训练
新思路!将生成视频用于
训练
机器人
将生成视频用于
训练
具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散模型、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、
训练
成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
从零开始大模型开发与微调:Miniconda的下载与安装
这些模型通过在海量文本数据上进行预
训练
,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的模型评估技术,目的是通过将数据集分割为多个子集,反复
训练
和验证模型,以便更好地估计模型的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
小白零基础学习
深度学习
之张量
1.张量PyTorch中的张量(Tensor)就是一种用来存储数据的“盒子”,这个盒子可以有不同的形状和大小,里面可以装各种数字。张量是PyTorch中最基本的东西,就像乐高积木一样,你可以用它来搭建各种复杂的模型。2.张量的用途存储数据:你可以把张量当作一个容器,用来存储各种数据。比如,一张图片可以用一个三维张量来表示,其中第一维是颜色通道(红、绿、蓝),第二维和第三维是图片的宽度和高度。进行计
爱理科的小王子
·
2025-02-13 17:53
学习
深度学习
人工智能
深度学习
-情感分析
以下将分别使用PyTorch和TensorFlow框架实现基于
深度学习
的情感分析,这里以影评的情感分析为例,数据集使用IMDB影评数据集。
小赖同学啊
·
2025-02-13 17:52
人工智能
深度学习
人工智能
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
【
深度学习
】常见模型-GPT(Generative Pre-trained Transformer,生成式预
训练
Transformer)
GPT(GenerativePre-trainedTransformer,生成式预
训练
Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
DeepSeek 实现原理探析
DeepSeek实现原理探析引言DeepSeek是一种基于
深度学习
的智能搜索技术,它通过结合自然语言处理(NLP)、信息检索(IR)和机器学习(ML)等多领域的技术,旨在提供更加精准、智能的搜索结果。
rockmelodies
·
2025-02-13 15:41
人工智能
ai
deepseek
深度学习
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令微调简介7.2为有监督的指令微调准备数据集7.3将数据整理成
训练
批次7.4为指令数据集创建数据加载器7.5加载预
训练
的大语言模型7.6在指令数据上对大语言模型进行微调7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
深度学习
视频教程推荐
推荐一个
深度学习
视频教程,中文,推导详细。老先生娓娓道来,将神经网络、
深度学习
讲的非常透彻。
yunTrans
·
2025-02-13 14:01
Deep
Learning
深度学习
视频
神经网络
基于
深度学习
的商品推荐
基于
深度学习
的商品推荐系统利用
深度学习
技术对用户的行为和商品的特征进行分析和建模,从而向用户推荐最相关的商品。这类系统在电子商务、社交媒体和内容推荐等领域中具有广泛应用。
SEU-WYL
·
2025-02-13 14:31
深度学习dnn
深度学习
人工智能
dnn
常见的
深度学习
模型总结
1.深度前馈神经网络(DeepFeedforwardNetworks)发明时间:2006年左右,随着计算能力的提升和大数据集的可用性增加,
深度学习
开始兴起。
编码时空的诗意行者
·
2025-02-13 13:29
深度学习
人工智能
深度学习
视频推荐
以下为你呈现一个基于
深度学习
实现视频推荐的简化代码示例。这里我们使用的是协同过滤思想结合神经网络的方式,借助TensorFlow和Keras库来构建模型。
小赖同学啊
·
2025-02-13 13:57
人工智能
深度学习
音视频
人工智能
23、
深度学习
-自学之路-激活函数relu、tanh、sigmoid、softmax函数的正向传播和反向梯度。
在使用这个非线性激活函数的时候,其实我们重点还是学习的是他们的正向怎么传播,以及反向怎么传递的。如下图所示:第一:relu函数的正向传播函数是:当输入值(隐藏层)值大于了,就输出自己本身的值。反向梯度传播:当输出值大于0,那么反向梯度值就等于输出值乘以1如果小于0,那反向梯度值就等于0.通俗的来说就是,如果输入值是0或小于0,那么输出值的反向增强就没有。如果输入值大于0,那么输出值的方向增强就有。
小宇爱
·
2025-02-13 13:22
深度学习-自学之路
深度学习
人工智能
基于
深度学习
的半导体检测与预测算法研究(二)
深度学习
凭借其强大的数据处理和特征提取能力,在半导体领域展现出巨大的应用潜力。
埃菲尔铁塔_CV算法
·
2025-02-13 12:45
深度学习
人工智能
神经网络
opencv
计算机视觉
python
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他