E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
推理训练
STM32实战开发(172):智能体育
训练
记录系统
引言随着人们对健康和运动的关注,体育
训练
记录系统变得越来越重要。智能体育
训练
记录系统能够帮助运动员记录、分析并优化他们的
训练
数据。
嵌入式开发项目
·
2025-03-03 02:53
stm32
人工智能
深度学习
单片机
嵌入式硬件
lstm
STM32实战开发(179):智能体育
训练
计划反馈系统
引言随着现代科技的不断发展,运动科学领域也在不断取得突破,尤其是在体育
训练
中,科技的应用越来越普及。从专业运动员到普通健身爱好者,都开始使用智能设备来优化
训练
计划,提高
训练
效率。
嵌入式开发项目
·
2025-03-03 02:53
stm32
嵌入式硬件
单片机
深度学习
人工智能
【AI大模型】Transformers大模型库(九):大模型微调之计算微调参数占比
、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的大模型库,为huggingface上数以万计的预
训练
大模型提供预测
LDG_AGI
·
2025-03-03 01:45
人工智能
如何掌握deepseek的
推理
思路:3个高级AI指令技巧,小白也能轻松上手!
不是新模型发布,也不是算力升级,而是Deepseek——这类AI学会像人类一样
推理
。但是有时候,Deepseek的
推理
你会觉得还不够?
小机学AI大模型
·
2025-03-03 01:13
小机带您AI入门(提示词)
人工智能
PyTorch数据加载:实战入门
"好的数据加载是成功
训练
的第一步"一、为什么要用DataLoader?当我们刚开始学习深度学习时,常常会这样处理数据:#传统方式加载数据images=[...]#所有图片数据labels=[...]
秋.
·
2025-03-03 01:43
pytorch
人工智能
python
数据加载
大模型国产化迁移大模型到昇腾教程(Pytorch版)
已有国产AI芯片和Mindformers框架,基于昇腾910
训练
大模型,使用MindIE实现大模型服务化。本文介绍如何迅速将大型模型迁移到昇腾910B,许多入门者都是从斯坦福羊驼开始的。
科技互联人生
·
2025-03-03 01:42
科技
数码
人工智能
AIGC
语言模型
大模型微调入门(Transformers + Pytorch)
输出:我们预
训练
的名字。
训练
为了性能好下载小参数模型,普通机器都能运行。
昵称不能为null
·
2025-03-03 00:06
python
llm
机器学习
人工智能
计算机视觉实战:YOLOv8在工业质检中的应用(附完整代码+数据集)
从数据标注到模型部署,包含环境配置、数据增强、模型
训练
全流程详解,手把手教你打造高精度智能质检系统!
emmm形成中
·
2025-03-03 00:03
深度学习
人工智能
python
计算机视觉
全民AI入门清华大学 deepseek 从入门到精通 pdf 免费下载
•DeepSeek-R1是其开源的
推理
模型,擅长处理复杂任务且可免费商用。下载地址:链接:https://pan.quark.cn/s/b2e0b986332a提取码:4XNy
宇飞林海
·
2025-03-02 23:30
人工智能
pdf
小白也能十分钟打造自己的
推理
大模型!unsloth+Colab轻松上手
简介:DeepSeek-R1-Distill-Llama-8B是一个基于Llama架构的8B参数语言模型,经过深度蒸馏(distillation)处理,旨在提高
推理
效率和精度。
X.Cristiano
·
2025-03-02 23:28
DeepSeek-R1
Llama-8B
sql2text
人工智能
北京大学:2本手册,拓展AI应用深度与广度
深入剖析DeepSeek-R1在复杂逻辑
推理
、数学和编程任务中的优异表现,揭示其在
推理
密集型任务、教育、科研、知识应用和文档分析等领域的独特优势,为AIGC领域的从业者和爱好者提供了深入了解DeepSeek
2501_90766876
·
2025-03-02 21:48
pdf
如何学习
训练
大模型——100条建议(附详细说明)_如何
训练
自己的大模型_大模型如何
训练
摘要:通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步
大耳朵爱学习
·
2025-03-02 21:18
人工智能
语言模型
产品经理
大模型
AI大模型
使用深度学习模型U-Net进行
训练
基于哨兵2的作物分割数据集。PyTorch框架为例,如何构建和
训练
U-Net模型来完成基于哨兵2的作物分割检测
使用深度学习模型如U-Net进行
训练
基于哨兵2的作物分割。
计算机C9硕士_算法工程师
·
2025-03-02 20:04
分割数据
深度学习
pytorch
人工智能
DeepSeek 开源狂欢周(四)DualPipe与EPLB双弹齐发,
训练
效率的“双引擎”加速器!
在DeepSeek开源周的第四天,DualPipe和EPLB这两项全新技术一同亮相,它们不仅为DeepSeek的低成本、高效
训练
大模型提供了强大支持,还为全球AI爱好者和从业者送上了两份“技术大礼包”。
OpenCSG
·
2025-03-02 19:56
开源
人工智能
社区
算法
2022.2.10
训练
思维练习
//输出十进制1234对应的八进制和十六进制//#include//intmain()//{//printf("0%o,0x%x\n",1234,1234);//return0;//}//将一个四位数反向输出//#include//intmain()//{//intn=0;//scanf_s("%d",&n);//while(n)//{//printf("%d",n%10);//n=n/10;//
钟佩颖
·
2025-03-02 18:52
c语言
2022.2.12思维
训练
(入门c语言题)
//#include//intmain()//{////return0;//}//#include//intmain()//{//printf("%d\n",sizeof(char));//printf("%d\n",sizeof(int));////printf("%d\n",sizeof(long));//printf("%d\n",sizeof(double));//return0;//}/
钟佩颖
·
2025-03-02 18:52
c语言
2W8000字 LLM架构文章阅读指北
|自然语言处理(NLP)之建模3、LLM大模型架构之词嵌入(Part1)3、LLM大模型架构之词嵌入(Part2)3、LLM大模型架构之词嵌入(Part3)4、LLM架构从基础到精通之Word2Vec
训练
全解析
·
2025-03-02 17:24
人工智能
使用Semantic Kernel:对DeepSeek添加自定义插件
大语言模型虽然具有强大的自然语言理解和生成能力,但它们通常是基于预
训练
的模型,其功能受限于
训练
时所接触的数据和任务。为大语言模型添加插件
归-途
·
2025-03-02 16:41
机器学习
oneapi
机器学习
关于openAI接口的使用(个人学习总结)
OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己
训练
模型
暗雾飘扬
·
2025-03-02 16:38
python机器学习_实验项目
学习
人工智能
3.4.4- 先颜色后形状的方式 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.4-先颜色后形状的方式可以再试试先颜色后形状的识别方式。importsenso
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
单片机
硬件工程
51单片机
嵌入式实时数据库
3.4.5-识别形状+颜色+增加最小变化阈值 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.5-识别形状+颜色+增加最小变化阈值在形状+颜色的识别效果中,发现小球是不动,
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
硬件工程
单片机
机器学习
人工智能
基于阿里云PAI平台快速部署DeepSeek大模型实战指南
在多项国际评测中,DeepSeek-R1模型在
推理
能力、多语言支持和长上下文处理(最高128K)方面表现卓越,尤其在企业级场景中展现出以下优势:高性能
推理
:单张A10显卡即可部署7B参数模型,
推理
速度提升
硅基打工人
·
2025-03-02 14:19
AI
阿里云
云计算
经验分享
人工智能
java
spring
spring
boot
深度学习框架之主流学习框架
它们提供了构建、
训练
和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点:TensorFlow:由Google开发,是一个广泛使用的开源深度学习框架。
uu1224
·
2025-03-02 14:17
深度学习
学习
人工智能
机器学习
神经网络
Llama 2架构深度解析:Meta开源的70B参数大模型设计哲学
Llama2作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌:在预
训练
阶段融入
AI时代已来!
·
2025-03-02 14:46
llama
架构
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型摘要1引言2方法2.1模型架构2.1.1DINO-XPro2.1.2DINO-XEdge3数据集构建和模型
训练
数据收集模型
训练
摘要在本文中,我们介绍了
黄阳老师
·
2025-03-02 13:10
目标检测
目标跟踪
人工智能
指数移动平均(EMA)策略
在神经网络领域,EMA常被用于对模型参数进行平滑处理,使得网络模型在
训练
过程中能够更加稳定且泛化能力可能得到提升。
Sherry Wangs
·
2025-03-02 13:06
深度学习
深度学习
python
机器学习
Transformer预测 | 基于TCN-Transformer的股票价格预测(Pytorch)
文章目录预测效果文章概述程序设计参考资料预测效果文章概述Transformer预测|基于TCN-Transformer的股票价格预测(Python)Transformer模型本质上都是预
训练
语言模型,大都采用自监督学习
机器学习之心
·
2025-03-02 13:35
#
Transformer模型
transformer
pytorch
深度学习
TCN-Transformer
股票价格预测
SQL-o1:一种用于Text-to-SQL的自奖励启发式动态搜索方法
为了解决这些问题,我们提出了SQL-o1,一种基于自奖励的启发式搜索方法,旨在增强LLMs在SQL查询生成中的
推理
能力。SQL-o1结合了蒙特卡洛树搜索(MCTS)进行过程级
数之何
·
2025-03-02 12:25
人工智能
ai
语言模型
sql
Deepseek相关梳理
11月20日,
推理
模型DeepSeek-R1-Lite预览版上线。12月26日,DeepSeek-V3首个版本上线并开源。2025年1月20日,正式发
stars and seas
·
2025-03-02 11:50
人工智能
【AI带来的机遇】
类比房地产黄金期中介赚取信息差、移动互联网初期应用商店分发红利,当前AI领域存在三大核心机遇:基础设施重构机遇(类比域名投资)AI大模型开源浪潮下,高质量
训练
数据资产、特定领域微调模型、模型中间件将成为新时代
调皮的芋头
·
2025-03-02 11:18
人工智能
神经网络
AIGC
如何用AI写程序
一、AI写程序之工具选择(一)主流AI编程工具介绍如今市面上有诸多AI编程工具可供选择,以下为大家介绍几种常见且实用的工具:ChatGPT:由OpenAI开发的一款基于Transformer架构的预
训练
模型
Honmaple
·
2025-03-02 11:46
人工智能
模型优化之强化学习(RL)与监督微调(SFT)的区别和联系
想了解有关deepseek本地
训练
的内容可以看我的文章:本地基于GGUF部署的DeepSeek实现轻量级调优之一:提示工程(PromptEngineering)(完整详细教程)_deepseekgguf-CSDN
搏博
·
2025-03-02 10:08
深度学习
人工智能
机器学习
架构
transformer
DeepMind首席科学家最新万字访谈:模型「慢思考」,能力大幅提升!
JackRae指出,
推理
模型是AI发展的新范式,
推理
模型并非追求即时响应,而是通过增加
推理
时的思考时间来提升答案质量,这导致了一种新的ScalingLaw,“慢思考”模式是提升AI性能的有效途径。
·
2025-03-02 09:43
datawhale
大模型在心力衰竭预测及临床方案制定中的应用研究报告
1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与
训练
LCG元
·
2025-03-02 09:58
围术期危险因子
预测模型研究
人工智能
完整的 Python 数据分析案例:在线游戏玩家付费预测
目录1.案例背景代码实现2.主要的代码难点解析2.1数据清洗-缺失值处理2.2特征工程-新特征计算与独热编码2.3特征选择2.4模型
训练
与评估2.5数据可视化3.可能改进的代码3.1数据清洗与特征工程改进
萧十一郎@
·
2025-03-02 08:56
python
机器学习
人工智能
边缘AI
推理
模型更新的秘密武器——Nginx的在线升级魔法
在当今快速发展的物联网和边缘计算时代,如何确保部署于边缘节点上的AI
推理
模型能够及时、高效地进行在线更新,成为了技术团队面临的一项重要挑战。
墨夶
·
2025-03-02 08:25
Nginx学习资料1
人工智能
nginx
运维
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?
今天咱们聊聊最近在AI界引发轰动的新闻——DeepSeek和xAI相继用R1和Grok-3证明了预
训练
ScalingLaw并非OpenAI的护城河。这意味着什么呢?让我们一探究竟!
东方佑
·
2025-03-02 08:53
量子变法
chatgpt
人工智能
【大模型】fp32 和 fp16 的区别,混合精度的原理。
(仅为fp32的50%)数值范围约±3.4×10³⁸约±6.5×10⁴精度(尾数)23位(约7位有效十进制数)10位(约3位有效十进制数)用途高精度计算(如梯度更新)高效计算(如矩阵乘法)2.混合精度
训练
的原理核心思想
深度求索者
·
2025-03-02 08:20
python
pytorch
【模型部署】大模型部署工具对比:SGLang, Ollama, VLLM, LLaMA.cpp如何选择?
以下是对比分析:性能VLLM(VirtualTensorLanguage):VLLM是一个高性能的
推理
库,特别适用于长序列任务。
深度求索者
·
2025-03-02 08:19
llama
人工智能
高效空间编码技术:SPD-Conv在目标检测中的创新应用
YOLOv8中的SPD-Conv实现YOLOv8SPD-Conv代码实现代码解析性能提升SPD-Conv的优势与应用场景SPD-Conv的设计细节与优化1.空间深度转换机制的进一步优化2.SPD-Conv的
训练
技巧与改进
向哆哆
·
2025-03-02 08:17
目标检测
目标跟踪
人工智能
yolov8
pytorch与深度学习随记——AlexNet
激活函数:AlexNet使用ReLU而不是sigmoid作为其激活函数,这有助于缓解梯度消失问题并加速
训练
过程。AlexNet架构的创新点局部响应归一化(LRN):AlexNet引入LRN层,可以创建
黑色的山岗在沉睡
·
2025-03-02 08:46
深度学习随记
深度学习
pytorch
人工智能
穿越AI边界:深度集成DeepSeek API与云平台的实践之路
DeepSeek作为一款领先的大型语言生成模型,凭借其强大的
推理
和生成能力,已经被越来越多的开发者和行业专家所青睐。
云边有个稻草人
·
2025-03-02 07:45
热门文章
人工智能
DeepSeek
大数据
集成DeepSeek
API
DeepSeek算法
阿里云百炼平台集成
【大模型】什么是蒸馏版大模型
大模型蒸馏一、知识蒸馏与无监督样本
训练
1.知识蒸馏的核心原理目标:将复杂大模型(Teacher)的知识迁移到轻量化小模型(Student)中,提升小模型性能。
深度求索者
·
2025-03-02 07:12
python
人工智能
开发语言
【llm对话系统】 LLM 大模型
推理
python实现:vLLM 框架
在LLM的应用中,
推理
(Inference)阶段至关重要。它指的是利用
训练
好的LLM模型,根据输入(Prompt)生成文本的过程。
kakaZhui
·
2025-03-02 06:06
人工智能
AIGC
chatgpt
python
llama
卷积这个词在卷积神经网络中应该怎么理解
卷积核中的每个值称为权重(weights),这些权重是通过
训练
过程优化得到的。滑动窗
abments
·
2025-03-02 06:05
人工智能
cnn
深度学习
计算机视觉
卷积核在初始阶段的数据是怎么获取的
卷积核的初始化随机初始化:在大多数情况下,卷积核(滤波器)的权重在模型
训练
开始时是随机初始化的。常用的随机初始化方法包括以下几种:均匀分布初始化:权重从一个均匀分布中抽取值。
abments
·
2025-03-02 06:05
人工智能
深度学习
人工智能
Python vLLM 实战应用指南
参数说明4.实战应用场景4.1构建聊天机器人示例对话:4.2文本补全输出示例:4.3自定义模型服务启动服务调用服务5.性能优化5.1GPU加速5.2动态批处理6.总结vLLM是一种高性能的开源深度学习
推理
引擎
ghostwritten
·
2025-03-02 06:34
python
python
开发语言
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用
但当我们需要更强的语言生成能力时,往往会求助于更先进的预
训练
语言模型。OpenAI旗下的GPT系列模型(如GPT-3、GPT-3.5、GPT-4等)在生成文本方面拥有强大的表现。
山海青风
·
2025-03-02 05:29
人工智能
gpt
自然语言处理
python
DeepSeek R1 详解:思维链、强化学习和蒸馏
训练
过程较小模型基准为什么Deepseek很重要DeepSeekR1常见问题解答来自中国的新型大型语言模型DeepSeekR1的发布在人工智能研究界引起了轰动。这不仅仅是又一次渐进式改进。
前网易架构师-高司机
·
2025-03-02 05:58
2025年最新-深度学习+AI
DeepSeek和AI工具
深度学习
Deepseek
基于 langchain+ollama 创建私有化知识库
概念介绍什么是RAGRAG是retrieval-augmented-generation的缩写,直译中文的意思是检索增强生成,可以简单理解能让
训练
好的大模型LLM可以结合外部数据,可以补充或者修正大模型返回的答案
大语言模型
·
2025-03-02 02:09
langchain
知识图谱
LLM
人工智能
llama
RAG
知识库
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他