E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Pytorch求索
DeepSeek使用手册,其中一份是清华大学出品
DeepSeek(深度
求索
)是一款由杭州深度
求索
人工智能基础技术研究有限公司开发的人工智能平台,专注于提供高效易用的AI模型训练与推理能力。
cpa007
·
2025-02-13 20:45
云计算
免费体验!DeepSeek一键部署全攻略
自从深度
求索
团队开源了DeepSeek-R1和DeepSeek-V3,这两款模型迅速成为AI领域的焦点,引发了全球范围的热议!
·
2025-02-13 20:13
deepseek
conda 装tensorboardx_【工欲善其事】TensorboardX的使用
经过社区的努力,目前
PyTorch
也可以使用tensorboard了。在训练过程中实时地观察loss/accuracy曲
weixin_39719042
·
2025-02-13 19:08
conda
装tensorboardx
Pytorch
实现一个简单DeepSeek中的MLA多头潜在注意力架构
首先,MLA是什么?可能是指Multi-HeadLocalAttention,即多头局部注意力,这种机制通常用于减少计算量,特别是在处理长序列时,每个头只关注局部区域。比如每个token只注意其周围的一定窗口内的其他token,而不是全局。这可能与传统的Transformer中的滑动窗口或局部注意力类似。接下来,我需要考虑如何将局部注意力与多头机制结合。每个注意力头可能有不同的局部窗口,或者共享相
DukeYong
·
2025-02-13 19:38
DeepSeek
Deepseek的MOE架构中ColumnParallelLinear()是怎么实现的
我记得在
PyTorch
中,模型并行通常涉及到将模型的层分布到不同的GPU上。ColumnParallelLinear可能指的是将线性层的列(即输出神经元)分布在多个设备上。
DukeYong
·
2025-02-13 18:00
架构
小白零基础学习深度学习之张量
1.张量
PyTorch
中的张量(Tensor)就是一种用来存储数据的“盒子”,这个盒子可以有不同的形状和大小,里面可以装各种数字。
爱理科的小王子
·
2025-02-13 17:53
学习
深度学习
人工智能
深度学习-情感分析
以下将分别使用
PyTorch
和TensorFlow框架实现基于深度学习的情感分析,这里以影评的情感分析为例,数据集使用IMDB影评数据集。
小赖同学啊
·
2025-02-13 17:52
人工智能
深度学习
人工智能
神经网络常见激活函数 9-CELU函数
文章目录CELU函数+导函数函数和导函数图像优缺点
pytorch
中的CELU函数tensorflow中的CELU函数CELU连续可微指数线性单元:CELU(ContinuouslyDifferentiableExponentialLinearUnit
亲持红叶
·
2025-02-13 15:37
神经网络常见激活函数
深度学习
机器学习
人工智能
数学建模
神经网络
python
大语言模型LLM代码:
PyTorch
库与ChatGLM模型
文章目录通过阅读大语言模型的代码,熟悉并理解
PyTorch
大语言模型LLM代码:
PyTorch
库与ChatGLM模型大语言模型中的
PyTorch
ChatGLM3-6B模型代码ChatGLMModel类总览
North_D
·
2025-02-13 12:48
大语言模型LLM
语言模型
pytorch
人工智能
python
深度学习
自然语言处理
大语言模型
【GA MTSP】基于matlab遗传算法求解多旅行商问题(目标函数:最短距离 单起点多终点)【含Matlab源码 4354期】
个人主页:Matlab研究室代码获取方式:扫描文章底部QQ二维码⛳️座右铭:行百里者,半于九十;路漫漫其修远兮,吾将上下而
求索
。更多Matlab路径规划仿真内容点击①Matlab路径规划(研究室版
Matlab研究室
·
2025-02-13 11:40
matlab
使用亚马逊针对
PyTorch
和 MinIO 的 S3 连接器进行模型检查点处理
2023年11月,Amazon宣布推出适用于
PyTorch
的S3连接器。适用于
PyTorch
的AmazonS3连接器提供了专为S3对象存储构建的
PyTorch
数据集基元(数据集和数据加载器)的实现。
MinIO分布式存储
·
2025-02-13 11:37
分布式存储
MinIO
pytorch
百度云
人工智能
DeepSeek深度探索:从新手到高手的蜕变之旅
DeepSeek,作为一款由杭州深度
求索
人工智能基础技术研究有限公司开发的人工智能模型,凭借其强大的功能和灵活的应用场景,成为了众多企业和专业人士的得力助手。
古龙飞扬
·
2025-02-13 10:30
ai
人工智能
大模型笔记:
pytorch
实现MOE
0导入库importtorchimporttorch.nnasnnimporttorch.nn.functionalasF1专家模型#一个简单的专家模型,可以是任何神经网络架构classExpert(nn.Module):def__init__(self,input_size,output_size):super(Expert,self).__init__()self.fc=nn.Linear(i
UQI-LIUWJ
·
2025-02-12 23:37
pytorch学习
笔记
pytorch
人工智能
mnist数据集下载及使用
#mnist数据集在百度云盘里#链接:https://pan.baidu.com/s/1ca2rL2-0_JLtnH1YQ3otvA#提取码:uq3d#
pytorch
自带数据集的使用importtorchvisionfromtorchvision.datasetsimportMNISTmnist
小句
·
2025-02-12 21:21
pytorch
机器学习
pytorch
笔记:mm VS bmm
1bmm(batchmatrixmultiplication)批量矩阵乘法,用于同时处理多个矩阵的乘法bmm的输入是两个3D张量(batchofmatrices),形状分别为(batch_size,n,m)和(batch_size,m,p)bmm输出的形状是(batch_size,n,p)2mmmm是标准的矩阵乘法操作,用于两个二维矩阵相乘mm仅适用于2D张量,输入的形状分别是(n,m)和(m,p
UQI-LIUWJ
·
2025-02-12 20:13
pytorch学习
pytorch
笔记
人工智能
最通俗易懂的方式,由浅入深地讲讲DeepSeek(深度
求索
)
一、DeepSeek是什么?简单说,DeepSeek是一家专注做通用人工智能(AGI)的中国公司,目标就是让AI能像人类一样理解、推理、解决复杂问题。它最核心的产品是大语言模型(你可以理解为"超级聊天机器人"),比如DeepSeek-R1、DeepSeek-MoE等。二、发展历程:从成立到行业黑马成立初期(2023年前)公司早期主要在技术积累,研究如何让AI模型更聪明、更高效。他们发现传统的大模型
Jing_saveSlave
·
2025-02-12 19:07
AI
ai
chatgpt
AI编程
神经网络常见激活函数 7-ELU函数
文章目录ELU函数+导函数函数和导函数图像优缺点
pytorch
中的ELU函数tensorflow中的ELU函数ELU指数线性单元:ELU(ExponentialLinearUnit)函数+导函数ELU函数
亲持红叶
·
2025-02-12 19:30
神经网络常见激活函数
深度学习
机器学习
人工智能
数学建模
神经网络
DS缩写乱争:当小海豚撞上AI顶流,技术圈也逃不过“撞名”修罗场
DS缩写风云:从“小海豚”到“深度
求索
”的魔幻现实曾几何时,技术圈提到DS,人们脑海中浮现的是一只灵动的“小海豚”——ApacheDolphinScheduler(简称DS)。
·
2025-02-12 18:58
数据库
【
PyTorch
】transpose() 和 permute() 函数:交换张量维度
在
PyTorch
中,transpose和permute都是用于调整张量维度的函数。它们在很多深度学习任务中非常有用,尤其是在处理张量维度和进行矩阵操作时。
彬彬侠
·
2025-02-12 15:38
PyTorch基础
transpose
permute
调整张量维度
pytorch
python
【ai】李沐 动手深度学学v2 环境安装:anaconda3、pycharm、d2
cuda-toolkitcuda_12.5.0_windows_network.exe官方课程网站第二版资源下载release版本pycharm版本李沐【动手学深度学习v2
PyTorch
版】课程笔记CUDA
等风来不如迎风去
·
2025-02-12 15:05
AI入门与实战
人工智能
DeepSeek V3 两周使用总结
DeepSeekV3两周使用总结机器学习AI算法工程2025年01月25日10:10广西向AI转型的程序员都关注公众号机器学习AI算法工程2024年12月26日,杭州深度
求索
人工智能基础技术研究有限公司发布
AI生成曾小健
·
2025-02-12 11:12
LLM大语言模型
Deepseek原理与使用
人工智能
pytorch
深度学习模型推理和部署、
pytorch
&ONNX&tensorRT模型转换以及python和C++版本部署
目录1.采用
pytorch
进行推理2.采用onnx进行推理2.1
pytorch
转换为onnx2.2onnx推理3.采用tensorrt进行推理(python环境)3.1onnx转engine文件3.2tensorrt
机械心
·
2025-02-12 10:40
深度学习
python
pytorch
大模型中 .safetensors 文件、.ckpt文件和.pth以及.bin文件区别、加载和保存以及转换方式
目录模型格式介绍加载以及保存-加载.safetensors文件:-保存/加载.pth文件:-保存/加载.ckpt文件:-处理.bin文件:模型之间的互相转换
pytorch
-lightning和
pytorch
ckpt
telllong
·
2025-02-12 10:38
深度学习
python
深度学习
人工智能
基于
PyTorch
框架实现,展示如何使用ResNet50进行特征提取,并结合MMD用于领域适应,迁移学习在轴承故障诊断中的应用
基于
PyTorch
框架实现,展示如何使用ResNet50进行特征提取,并结合MMD用于领域适应,迁移学习在轴承故障诊断中的应用_迁移学习轴承诊断DAN:ResNet50-MMD以下文字及代码仅供参考。
QQ_767172261
·
2025-02-12 07:15
轴承类
pytorch
迁移学习
人工智能
DeepSeek-MoE-16b:高效稀疏架构引领大模型降本增效革命
一、模型定位与技术背景DeepSeek-MoE-16b是深度
求索
(DeepSeek)研发的混合专家模型(MixtureofExperts,MoE),参数规模160亿,旨在通过稀疏化计算架构解决传统稠密模型
热爱分享的博士僧
·
2025-02-11 18:36
架构
torch.nn.LSTM介绍
torch.nn.LSTM是
PyTorch
提供的一个高级封装,用于构建长短时记忆网络(LSTM)。
qq_27390023
·
2025-02-11 17:02
lstm
深度学习
机器学习
pytorch
python
Pytorch
学习之路(2)
(PS:请先阅读
Pytorch
学习之路(1)开篇注释)【因为我也是小菜鸟】
Pytorch
基础知识1.张量(1)简介0维张量——标量(数字)1维张量——向量2维张量——矩阵3维张量——时间序列数据股价文本数据单张彩色图片
AAAx1anyu
·
2025-02-11 14:40
Pytorch学习之旅
pytorch
学习
人工智能
DeepSeek大模型技术解析:从架构到应用的全面探索
官网:https://www.deepseek.com/1、DeepSeek大模型简介DeepSeek大模型是由北京深度
求索
人工智能基础技术研究有限公司开发的一款
模型优化师
·
2025-02-11 10:11
人工智能
语言模型
agi
deepseek
AI大模型
LLM
ai
使用rknn进行facenet部署
文章目录开源仓库pth转onnxnetron可视化onnx转rknnC++实现开源仓库https://github.com/bubbliiiing/facenet-
pytorch
pth转onnx修改facenet
点PY
·
2025-02-11 08:58
深度学习模型部署
rknn
人脸识别
【Python】成功解决ModuleNotFoundError: No module named ‘openpyxl‘
博主档案:广东某985本硕,SCI顶刊一作,深耕深度学习多年,熟练掌握
PyTorch
框架。
高斯小哥
·
2025-02-11 07:14
BUG解决方案合集
python
新手入门
学习
神经网络常见激活函数 6-RReLU函数
文章目录RReLU函数+导函数函数和导函数图像优缺点
pytorch
中的RReLU函数tensorflow中的RReLU函数RReLU随机修正线性单元:RandomizedLeakyReLU函数+导函数RReLU
亲持红叶
·
2025-02-10 22:40
神经网络常见激活函数
神经网络
人工智能
深度学习
机器学习
pytorch
激活函数
pytorch
人脸修复_修复
pytorch
数据加载器
pytorch
人脸修复黑客数据科学工作流程(Hackingdatascienceworkflows)Icameacrossaninterestingproblemrecently.AteammateandIwereworkingonaseriesofDeepLearningexperimentsthatinvolvedanimagedatasetthatspannedhundredsofgigab
weixin_26729375
·
2025-02-10 19:18
人工智能
python
java
人脸识别
DeepSeek-VL2 、 qwen2.5 vl 技术选型比较
在视觉-语言(Vision-Language,VL)多模态模型领域,DeepSeek-VL2(深度
求索
)和Qwen2.5-VL(阿里云通义千问)均是国内领先的技术方案。
天机️灵韵
·
2025-02-10 18:42
人工智能
deepseek
qwen
【
Pytorch
函数】
PyTorch
随机数生成全解析 | torch.rand()家族函数使用指南
PyTorch
随机数生成全解析|torch.rand()家族函数使用指南一、核心函数参数详解
PyTorch
提供多种随机数生成函数(注意:无直接torch.random()函数),以下是常用函数及参数:1️⃣torch.rand
深度求索者
·
2025-02-10 18:09
pytorch
人工智能
python
深度学习-医学影像诊断
以下以使用深度学习进行医学影像(如X光片)的肺炎诊断为例,为你展示基于
PyTorch
框架的代码实现。我们将构建一个简单的卷积神经网络(CNN)模型,使用公开的肺炎X光影像数据集进行训练和评估。
小赖同学啊
·
2025-02-10 18:37
人工智能
深度学习
人工智能
动手学深度学习:3.9 多层感知机的从零开始实现
importtorchimportnumpyasnpimportsyssys.path.append("..")importd2lzh_
pytorch
asd2lCopytoclipboardErrorCopied3.9.1
AI_Younger_Man
·
2025-02-10 17:36
#
深度学习
深度学习
神经网络
python
机器学习
DeepSeek与Odoo融合,赋能企业智慧运营
深度
求索
(DeepSeek)这样的前沿AI公司,凭借其强大的模型能力和丰富的行业经验,为企业提供了完善的人工智能解决方案。DeepSeek
odoo中国
·
2025-02-10 11:10
人工智能
odoo
开源软件
deep
learning
python
DeepSeek时代:百度们亟需“深度
求索
”
文:互联网江湖作者:刘致呈眼看着梁文峰被捧上中国AI神坛,科技巨头们的心情一定是复杂的。就像大刘笔下的《三体》中,当三百年后的人类太空舰队,面对水滴探测器时是五味杂陈的。当科技大佬们纷纷断言,没有人能超过OpenAI,于是DeepSeeK横空出世,一众巨头面面相觑,慌不择路。也一如那句“三体名言”:弱小和无知从来不是生存的障碍,傲慢才是。人类啊,总是要为刻在DNA里的傲慢与偏见买单。AI道路上,大
互联网江湖
·
2025-02-10 06:45
人工智能
科技
一文解释nn、nn.Module与nn.functional的用法与区别
个人主页:十二月的猫-CSDN博客系列专栏:零基础入门
PyTorch
框架_十二月的猫的博客-CSDN博客十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光目录1.前言2.Torch.nn库3
十二月的猫
·
2025-02-10 03:23
零基础入门PyTorch框架
python
pytorch
人工智能
AI学习专题(一)LLM技术路线
个月)数学基础线性代数(矩阵、特征值分解、SVD)概率论与统计(贝叶斯定理、极大似然估计)最优化方法(梯度下降、拉格朗日乘子法)编程&框架Python(NumPy、Pandas、Matplotlib)
PyTorch
王钧石的技术博客
·
2025-02-10 01:39
大模型
人工智能
学习
ai
AI大模型:一文搞懂大模型文件存储格式新宠GGUF
比如:目前最流行的AI框架
PyTorch
使用pickle格式存储模型权重文件,还有Huggingface提出的Safetensors格式。
Llama-Turbo
·
2025-02-10 01:37
人工智能
llama
自然语言处理
知识图谱
语言模型
LLM
大模型
解决
Pytorch
的cuDNN error: CUDNN_STATUS_NOT_INITIALIZED
目录1.问题报错2.可能原因2.1GPU内存不足2.2缓存问题2.3CUDA和
Pytorch
版本不兼容2.4CUDA和cuDNN版本不兼容3.验证CUDA是否可用4.参考1.问题报错在使用GPU加速模型训练的过程中经常会遇到这样的错误
Jurio.21
·
2025-02-10 00:31
Python
科研经验
Pytorch
pytorch
人工智能
python
GPU
CUDA
cuDNN
【
PyTorch
】【CUDA】深入了解
PyTorch
中的 CUDA 和 cuDNN 版本及 GPU 信息
目录引言一、环境准备1.1重要的环境依赖1.2安装CUDA和cuDNN1.3示例安装步骤1.4
PyTorch
、CUDA和cuDNN版本兼容性表二、检查CUDA和cuDNN版本三、检查GPU可用性四、测试
丶2136
·
2025-02-10 00:27
#
cuda
AI
#
pytorch
pytorch
人工智能
gpu算力
torch.nn.CrossEntropyLoss()的一些小细节(原理和数学,softmax与dim,ignore_index,报错:0D or 1D target tensor expecte)
目录关于torch.nn.CrossEntropyLoss()数学原理关于熵数学公式
pytorch
中的torch.nn.CrossEntropyLoss()torch.nn.CrossEntropyLoss
老肝犯
·
2025-02-09 22:49
人工智能
深度学习
python
机器学习
神经网络
深度学习笔记——
pytorch
构造数据集 Dataset and Dataloader
系列文章目录机器学习笔记——梯度下降、反向传播机器学习笔记——用
pytorch
实现线性回归机器学习笔记——
pytorch
实现逻辑斯蒂回归Logisticregression机器学习笔记——多层线性(回归
旺仔喔喔糖
·
2025-02-09 22:19
机器学习
笔记
pytorch
人工智能
深度学习
【
Pytorch
实战教程】让数据飞轮转起来:
PyTorch
Dataset与Dataloader深度指南
文章目录让数据飞轮转起来:
PyTorch
Dataset与Dataloader深度指南一、为什么需要数据管理组件?
若北辰
·
2025-02-09 21:41
Pytorch实战教程
pytorch
人工智能
python
解锁DeepSeek大模Q型:超实用提示词技巧大放送
DeepSeek大模型简介DeepSeek是由深度
求索
(DeepSeekInc.)团队开发的大型预训练语言模型,以其高效推理、多模态融合及对垂直领域的深度优化而著称。
计算机学长
·
2025-02-09 20:04
通用大语言模型
人工智能
TensorFlow 与
PyTorch
的直观区别
背景TensorFlow与
PyTorch
都是比较流行的深度学习框架。tf由谷歌在2015年发布,而
PyTorch
则是FacecbookAI研究团队2016年在原来Torch的基础上发布的。
Cacciatore->
·
2025-02-09 06:54
tensorflow
pytorch
人工智能
python
机器学习
深度学习
PyTorch
深度学习实战(37)——CycleGAN详解与实现
PyTorch
深度学习实战(37)——CycleGAN详解与实现0.前言1.CycleGAN基本原理2.CycleGAN模型分析3.实现CycleGAN小结系列链接0.前言CycleGAN是一种用于图像转换的生成对抗网络
盼小辉丶
·
2025-02-09 06:50
生成对抗网络
pytorch
生成模型
【ubuntu下验证下菜品识别,训练,部署,验证 CNN + TensorFlow /
PyTorch
】
下来我会详细介绍如何在Ubuntu上运行你训练和部署的菜品识别模型,确保每一步都能理解并能在你的系统中运行。环境准备1.1安装必要的软件在Ubuntu上,首先需要安装Python和相关的依赖库:更新系统:打开终端,运行以下命令:bashsudoaptupdate&&sudoaptupgrade-y安装Python及pip:确保你的系统已经安装了Python3和pip,如果没有,可以使用以下命令安装
追心嵌入式
·
2025-02-09 05:47
cnn
tensorflow
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他