E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
神经网络训练
DDPM(Denoising Diffusion Probabilistic Models)的公式推导
核心推导在于通过变分推断将KL散度转换为噪声预测问题,大幅简化了
训练
目标。1.前向扩散过程前向过程通过\(T\)步逐渐向数据\(x_0\)添加高斯噪声,最终得到纯噪声\(x_T\)。
AndrewHZ
·
2025-02-14 00:12
机器学习
人工智能
深度学习
算法
AI Agent智能应用从0到1定制开发Langchain+LLM全流程解决方案与落地实战
大模型微调实战:精通、指令微调、开源大模型微调、对齐与垂直领域应用29套AI全栈大模型项目实战,人工智能视频课程-多模态大模型,微调技术
训练
营,大模型多场景实战,AI图像处理,AI量化投资,OPenCV
AI知识分享官
·
2025-02-14 00:41
人工智能
langchain
算法
数据挖掘
计算机视觉
机器学习
产品经理
GPT 系列模型发展史:从 GPT 到 ChatGPT 的演进与技术细节
GPT(2018):划时代的起点:GPT(GenerativePre-trainedTransformer)首次将Transformer架构与无监督预
训练
结合,开启了大规模语言模型的新时代。
Ash Butterfield
·
2025-02-14 00:08
nlp
gpt
chatgpt
YOLO各版本原理和优缺点解析
使用单个
神经网络
直接对图像进行前向传播预测边界框和类别标签。优点:速度快,适合实时应用。模型结构简单,易于实现和
训练
。缺点:对小目标检测效果差,容易
Ash Butterfield
·
2025-02-14 00:08
计算机视觉
【AI论文】OmniHuman-1: 重新思考一阶段条件式人体动画模型的扩展升级
在本文中,我们提出了OmniHuman,一个基于扩散变换器的框架,该框架通过将运动相关条件融入
训练
阶段来扩展数据规模。为此,我们为这些混合条件引入了两种
训练
原则,以及相应的模型架构和推理策略。
东临碣石82
·
2025-02-13 23:06
人工智能
【AI系列】从零开始学习大模型GPT (2)- Build a Large Language Model (From Scratch)
简单注意力机制带
训练
权重的注意力机
Tasfa
·
2025-02-13 23:33
AI人工智能教程
人工智能
学习
gpt
自学人工智能大模型,满足7B模型的
训练
和微调以及推理,预算3万,如何选购电脑
如果你的预算是3万元人民币,希望
训练
和微调7B参数规模的人工智能大模型(如LLaMA、Mistral等),你需要一台高性能的深度学习工作站。
岁月的眸
·
2025-02-13 23:03
人工智能
多模态大模型(LMMs)与大语言模型(LLMs)的比较
本文将从基础定义、输入数据、应用场景、
训练
过程这几方面讨论下两者的区别。
大F的智能小课
·
2025-02-13 23:02
底层技术解析
人工智能
语言模型
DeepSeek与ChatGPT正在改写学历规则?2025教育革命深度解析
一、颠覆性现状:AI如何解构学历价值1.知识获取民主化随着AI技术的不断进步,知识获取的方式正在发生翻天覆地的变化:DeepSeek-R1通过仅10%的
训练
成本,实现了与GPT-4o相当的性能,技术文档的生成效率提升了
笑傲江湖2023
·
2025-02-13 23:01
人工智能
chatgpt
【Elasticsearch】分词器概述
Elasticsearch分词与
神经网络
分词的区别Elasticsearch的分词过程产生的是优化用于搜索和检索的语言学分词。这与机器学习和自然语言处理中的神经分词不同。
risc123456
·
2025-02-13 22:28
Elasticsearch
elasticsearch
DeepSeek如何用1/179的
训练
成本干到GPT-4o 98%性能
一、DeepSeek降低
训练
成本的核心方法1.1创新
训练
方法DeepSeek通过独特的
训练
方案显著降低了
训练
成本。其核心策略包括减少监督微调(SFT)步骤,仅依赖强化学习(RL)技术。
大F的智能小课
·
2025-02-13 21:51
人工智能
算法
DeepSeek R1:开启AI推理新时代,强在哪里?
DeepSeekR1:开启AI推理新时代阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的
神经网络
数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM架构专栏知乎LLM专栏知乎
·
2025-02-13 20:19
人工智能
数据库三级模式
由于大多数数据库系统用户并未受过计算机的专业
训练
,因此系统开发人员需要通过视图层、逻辑层和物理层三个层次上的抽象来对用户屏蔽系统的复杂性,简化用户与系统的交互。
iamphp
·
2025-02-13 20:16
系统架构设计师
数据库
系统架构
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度求索)是一款由杭州深度求索人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型
训练
与推理能力。
cpa007
·
2025-02-13 20:45
云计算
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
“我不喜欢Tensorflow,但这并不妨碍我使用tensorboard”上一篇文章(https://zhuanlan.zhihu.com/p/39849027),和大家简单地聊了一下关于如何在
训练
过程中有序地组织
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
具身智能
训练
新思路!将生成视频用于
训练
机器人
将生成视频用于
训练
具身智能(EmbodiedAI)确实是近年来备受关注的前沿方向,这一思路通过结合生成式AI(如扩散模型、神经辐射场等)与机器人学习,为解决真实世界数据稀缺、
训练
成本高等问题提供了新可能
天机️灵韵
·
2025-02-13 18:02
具身智能
人工智能
具身智能
从零开始大模型开发与微调:Miniconda的下载与安装
这些模型通过在海量文本数据上进行预
训练
,能够捕捉到丰富的语义和上下文信息,从而在自然语言处理任务中表现出色。
AGI大模型与大数据研究院
·
2025-02-13 18:30
DeepSeek
R1
&
大数据AI人工智能
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
如何避免交叉验证中的数据泄露?
大家好,我是小青在机器学习中,交叉验证(Cross-Validation)是一种常用的模型评估技术,目的是通过将数据集分割为多个子集,反复
训练
和验证模型,以便更好地估计模型的性能。
奋进小青
·
2025-02-13 17:25
人工智能
深度学习
机器学习
R-CNN架构
第二个模块是一个大型卷积
神经网络
,它从每个区域中提取固定长度的特征向量。第三个模块是一组特定类别的线性支持向量机(SVM)。
·
2025-02-13 16:10
人工智能
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 16:39
人工智能
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)
如何
训练
LLMs进行“思考”(如o1和DeepSeek-R1)阅读时长:19分钟发布时间:2025-02-13近日热文:全网最全的
神经网络
数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-13 16:07
人工智能
【深度学习】常见模型-GPT(Generative Pre-trained Transformer,生成式预
训练
Transformer)
GPT(GenerativePre-trainedTransformer,生成式预
训练
Transformer)是由OpenAI开发的基于Transformer解码器(Decoder)的自回归(Autoregressive
IT古董
·
2025-02-13 16:15
深度学习
人工智能
深度学习
gpt
transformer
机器翻译技术的演进与未来趋势:从规则到
神经网络
的革新
机器翻译技术经历了从基于规则的方法到统计方法,再到如今的
神经网络
方法的发展历程。本文将探讨机器翻译技术的演进过程及其未来趋势,并结合Python代码示例,展示现代机器翻译技术的应用。
Echo_Wish
·
2025-02-13 15:43
人工智能
前沿技术
机器翻译
神经网络
人工智能
微软 LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3:通过统一文本和图像掩码进行文档人工智能预
训练
LayoutLMv3应用统一的文本-图像多模态Transformer来学习跨模态表示。
·
2025-02-13 15:31
人工智能
从零开始构建一个大语言模型-第七章第一节
第七章目录7.1指令微调简介7.2为有监督的指令微调准备数据集7.3将数据整理成
训练
批次7.4为指令数据集创建数据加载器7.5加载预
训练
的大语言模型7.6在指令数据上对大语言模型进行微调7.7提取并保存回复
释迦呼呼
·
2025-02-13 15:07
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
机器学习
transformer
神经网络
常见激活函数 9-CELU函数
文章目录CELU函数+导函数函数和导函数图像优缺点pytorch中的CELU函数tensorflow中的CELU函数CELU连续可微指数线性单元:CELU(ContinuouslyDifferentiableExponentialLinearUnit),是一种连续可导的激活函数,结合了ELU和ReLU的特点,旨在解决ELU在某些情况下的梯度问题。函数+导函数CELU函数CELU(x)={xx≥0α
亲持红叶
·
2025-02-13 15:37
神经网络常见激活函数
深度学习
机器学习
人工智能
数学建模
神经网络
python
深度学习视频教程推荐
老先生娓娓道来,将
神经网络
、深度学习讲的非常透彻。由复旦大学吴立德老师教授的课程:http://www.youku.com/playlist_show/id_21508721.html
yunTrans
·
2025-02-13 14:01
Deep
Learning
深度学习
视频
神经网络
常见的深度学习模型总结
1.深度前馈
神经网络
(DeepFeedforwardNetworks)发明时间:2006年左右,随着计算能力的提升和大数据集的可用性增加,深度学习开始兴起。
编码时空的诗意行者
·
2025-02-13 13:29
深度学习
人工智能
深度学习 视频推荐
这里我们使用的是协同过滤思想结合
神经网络
的方式,借助TensorFlow和Keras库来构建模型。
小赖同学啊
·
2025-02-13 13:57
人工智能
深度学习
音视频
人工智能
基于深度学习的半导体检测与预测算法研究(二)
本文详细探讨了深度学习在半导体缺陷检测、工艺参数预测等方面的应用原理和方法,介绍了常见的深度学习模型如卷积
神经网络
(CNN)、循环
神经网络
(RNN)及其变体在半导体数据处理中的应用,分析了模型
训练
与优化的关键技术
埃菲尔铁塔_CV算法
·
2025-02-13 12:45
深度学习
人工智能
神经网络
opencv
计算机视觉
python
基于深度学习的半导体算法原理及应用
本文全面阐述了基于深度学习的半导体算法原理,涵盖卷积
神经网络
(CNN)、循环
神经网络
(RNN)及其变体长短时记忆网络(LSTM)和门控循环单元(GRU)等在半导体制造过程监测、缺陷检测、性能预测等方面的应用
埃菲尔铁塔_CV算法
·
2025-02-13 12:44
算法
机器学习
人工智能
计算机视觉
深度学习
python
模型应用管理的成功之道:策略、工具与团队协作
●
训练
与验证:使用
训练
数据
训练
模型,并通过验证集评估模型性能。●超参数调优:通过交叉验证、网格搜索等方法优化模型超参数。2.模型部署●
·
2025-02-13 11:28
项目管理工具
DeepSeek-V2 论文解读:混合专家架构的新突破
Economical,andEfficientMixture-of-ExpertsLanguageModel目录一、引言二、模型架构(一)多头部潜在注意力(MLA):重塑推理效率(二)DeepSeekMoE:经济高效的
训练
架构三
进一步有进一步的欢喜
·
2025-02-13 09:49
DeepSeek-V2
大模型
MoE
混合专家架构
Kivy教程大全之 使用 NumPy 和 Kivy 对 Android 设备进行图像分类
了解更多信息本教程的重点是构建一个调用预
训练
的ANN来对图像进行分类的Android应用程序。这里不深入讨论准备数据集、构建、
训练
和优化ANN的步骤。在本教程中将仅对它们进行简要讨论。
知识大胖
·
2025-02-13 08:48
Python源码大全
python
kivy
numpy
【人工智能】Python中的深度学习优化器:从SGD到Adam
解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界在深度学习模型的
训练
过程中,优化器起着至关重要的作用,它决定了模型的收敛速度以及最终的性能。
蒙娜丽宁
·
2025-02-13 08:13
Python杂谈
人工智能
人工智能
python
深度学习
线性回归、逻辑回归及SVM
可以简单的理解为:在给定
训练
样本点和已知的公式后,对于一个或多个未知参数,机器会自动枚举参数的所有可能取值(对于多个参数要枚举它们的不同组合),直到找到那个最符合样本点分布的参数(或参数组合)。
@迷途小书童
·
2025-02-13 07:38
机器学习
【AI】人工智能没那么神秘!
AI系统通常由算法、数据、模型和代码组成,其中代码用于实现算法,数据用于
训练
模型,最终形成智能决策能力。AI可以嵌入到应用程序中,但其本身是一个复杂的技术体系。AI为什么这么聪明?
仇辉攻防
·
2025-02-13 07:04
人工智能
ai
语言模型
自然语言处理
机器学习
深度学习
网络安全
【图像重建】基于matlab BP
神经网络
双基地SAR成像图像重建【含Matlab源码 1950期】
欢迎来到海神之光博客之家✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进;个人主页:海神之光代码获取方式:海神之光Matlab王者学习之路—代码获取方式(1)完整代码,已上传资源;需要的,在博主主页搜期号直接付费下载或者订阅本专栏赠送此代
海神之光
·
2025-02-13 07:03
matlab
大语言模型的分类及本地部署所需的硬件配置要求
简单来说,它就像一个“超级大脑”,能够处理各种语言任务,比如写文章、回答问题、翻译语言等;它通过
训练
大量的文本数据,学习语言的结构、语法、语义以及上下文关联,从而能够理解和生成与人类语言相似的文本。
Kelaru
·
2025-02-13 07:01
LLM
基础知识
语言模型
分类
人工智能
硅基流动多模型工作流应用平台,免费2000万Token来了
硅基流动是一家专注于大规模AI计算的技术公司,提供高性能LLM推理和
训练
解决方案,助力企业高效部署AI应用。目前注册可获的2000万Token,可以使用将近60种文字对话、语音、图像生成等主流大模型。
yuntianming3906
·
2025-02-13 05:53
经验分享
AnyPlace:学习机器人操作的泛化目标放置
为了解决这个问题,AnyPlace,一种完全基于合成数据
训练
的两阶段方法,能够预测现实世界任务中各种可行的放置姿势。其
硅谷秋水
·
2025-02-13 04:15
计算机视觉
大模型
智能体
机器人
机器学习
计算机视觉
人工智能
语言模型
深度学习
算法
训练
Day7| LeetCode454. 四数相加II(Map作哈希表);383.赎金信(数组作哈希表);15.三数之和(双指针);18.四数之和(双指针)
目录LeetCode454.四数相加1.思路2.代码实现3.复杂度分析4.思考Leetcode383.赎金信1.思路2.代码实现3.复杂度分析4.思考Leetcode15.三数之和方法一:双指针法1.思路2.代码实现3.复杂度分析4.思考Leetcode18.四数之和1.思路2.代码实现3.复杂度分析4.思考LeetCode454.四数相加链接:454.四数相加II-力扣(LeetCode)1.思
努力学习的牛宁西
·
2025-02-13 04:45
代码随想录训练营
算法
散列表
leetcode
代码随想录算法
训练
营Day07 | LeetCode454.四数相加II、LeetCode383.赎金信、LeetCode15.三数之和、LeetCode18.四数之和
LeetCode454.四数相加II题目链接:https://leetcode.cn/problems/4sum-ii/思路:想法是使用哈希表。定义一个哈希表unordered_map,遍历a数组与b数组,key存放a数组与b数组的元素之和,value存放a数组与b数组的元素之和出现的次数;再遍历c数组与d数组,在unordered_map中找0-(c+d),因为此时unordered_map中存
SuperYue37
·
2025-02-13 04:44
代码随想录
算法
哈希表
leetcode
【代码随想录
训练
营】Day7-哈希表
代码随想录Day7今日任务454.四数相加Ⅱ383.赎金信15.三数之和18.四数之和454.四数相加Ⅱ考点:哈希表链接:https://leetcode.cn/problems/4sum-ii/classSolution{publicintfourSumCount(int[]nums1,int[]nums2,int[]nums3,int[]nums4){HashMaprecord=newHash
Koffer-debug
·
2025-02-13 04:14
代码随想录训练营
leetcode
算法
哈希表
【python 机器学习】sklearn转换器与预估器
通俗介绍:学术解释:3.转换器与预估器的共同点4.转换器与预估器的区别5.使用`sklearn`中的转换器与预估器5.1示例:数据标准化(转换器)5.2示例:模型
训练
与预测(预估器)6.使用`Pipeline
人才程序员
·
2025-02-13 03:04
杂谈
python
机器学习
sklearn
人工智能
目标检测
深度学习
神经网络
畅游Diffusion数字人(16):由音乐驱动跳舞视频生成
目录贡献概述背景挑战贡献方法详解第一阶段:外观预
训练
第二阶段:动态触发视频生成
训练
细节贡献概述背景<
沉迷单车的追风少年
·
2025-02-13 02:59
数字人
Diffusion
Models与深度学习
人工智能
深度学习
视频生成
深度学习练手小例子——cifar10数据集分类问题
数据集被分为50,000张
训练
图像和10,000张测试图像。
☆cwlulu
·
2025-02-12 23:39
深度学习
分类
人工智能
大模型笔记:pytorch实现MOE
0导入库importtorchimporttorch.nnasnnimporttorch.nn.functionalasF1专家模型#一个简单的专家模型,可以是任何
神经网络
架构classExpert(nn.Module
UQI-LIUWJ
·
2025-02-12 23:37
pytorch学习
笔记
pytorch
人工智能
使用云计算开发AI项目,有哪些最佳实践?
使用云计算开发AI项目,可以让企业和开发者更高效地利用算力、存储和AI
训练
环境,避免高昂的硬件成本和运维压力。但如何高效、经济地利用云计算,打造一个稳定、安全、可扩展的AI项目呢?
云上的阿七
·
2025-02-12 22:01
云计算
人工智能
学习系列二:常用目标检测的格式转换脚本文件txt,json等
常用目标检测的格式转换脚本文件txt,json等文章目录常用目标检测的格式转换脚本文件txt,json等前言一、json格式转yolo的txt格式二、yolov8的关键点labelme打的标签json格式转可
训练
的
小啊磊_Vv
·
2025-02-12 21:23
目标检测
YOLO
人工智能
计算机视觉
json
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他