E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
vulfocus靶场训练
DeepSeek-R1:重新定义推理性能的开源人工智能
目录重新定义卓越的基准变革性应用案例技术创新后
训练
优化冷启动数据以提高可用性可扩展性蒸馏模型API集成:为开发者而生竞争定价:可及的高级人工智能开源优势DeepSeek代表的引用推动开放人工智能的边界推动边界意味着什么
知识小报童
·
2025-03-03 08:11
DeepSeek前言内容整理
开源
人工智能
深度学习
机器学习
神经网络
自然语言处理
语言模型
DeepSeek 开源周五个开源项目,引领 AI 创新?
这些项目涵盖了AI基础设施、模型
训练
和数据处理的各个方面,旨在通过透明和社区驱动的创新推动AI发展。这也解释了为什么DeepSeek可以用低成本
训练
出高质量的模型。
LaughingZhu
·
2025-03-03 08:09
开源
人工智能
产品运营
前端
经验分享
《AI大模型开发笔记》DeepSeek技术创新点
最新开源的DeepSeekV3模型不仅以顶尖基准测试成绩比肩业界SOTA模型,更以惊人的
训练
效率引发行业震动——仅耗费280万H800GPU小时(对应4e24FLOP@40%MFU)即达成巅峰性能。
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
STM32实战开发(172):智能体育
训练
记录系统
引言随着人们对健康和运动的关注,体育
训练
记录系统变得越来越重要。智能体育
训练
记录系统能够帮助运动员记录、分析并优化他们的
训练
数据。
嵌入式开发项目
·
2025-03-03 02:53
stm32
人工智能
深度学习
单片机
嵌入式硬件
lstm
STM32实战开发(179):智能体育
训练
计划反馈系统
引言随着现代科技的不断发展,运动科学领域也在不断取得突破,尤其是在体育
训练
中,科技的应用越来越普及。从专业运动员到普通健身爱好者,都开始使用智能设备来优化
训练
计划,提高
训练
效率。
嵌入式开发项目
·
2025-03-03 02:53
stm32
嵌入式硬件
单片机
深度学习
人工智能
【AI大模型】Transformers大模型库(九):大模型微调之计算微调参数占比
、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的大模型库,为huggingface上数以万计的预
训练
大模型提供预测
LDG_AGI
·
2025-03-03 01:45
人工智能
PyTorch数据加载:实战入门
"好的数据加载是成功
训练
的第一步"一、为什么要用DataLoader?当我们刚开始学习深度学习时,常常会这样处理数据:#传统方式加载数据images=[...]#所有图片数据labels=[...]
秋.
·
2025-03-03 01:43
pytorch
人工智能
python
数据加载
大模型国产化迁移大模型到昇腾教程(Pytorch版)
已有国产AI芯片和Mindformers框架,基于昇腾910
训练
大模型,使用MindIE实现大模型服务化。本文介绍如何迅速将大型模型迁移到昇腾910B,许多入门者都是从斯坦福羊驼开始的。
科技互联人生
·
2025-03-03 01:42
科技
数码
人工智能
AIGC
语言模型
大模型微调入门(Transformers + Pytorch)
输出:我们预
训练
的名字。
训练
为了性能好下载小参数模型,普通机器都能运行。
昵称不能为null
·
2025-03-03 00:06
python
llm
机器学习
人工智能
计算机视觉实战:YOLOv8在工业质检中的应用(附完整代码+数据集)
从数据标注到模型部署,包含环境配置、数据增强、模型
训练
全流程详解,手把手教你打造高精度智能质检系统!
emmm形成中
·
2025-03-03 00:03
深度学习
人工智能
python
计算机视觉
如何学习
训练
大模型——100条建议(附详细说明)_如何
训练
自己的大模型_大模型如何
训练
摘要:通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步
大耳朵爱学习
·
2025-03-02 21:18
人工智能
语言模型
产品经理
大模型
AI大模型
使用深度学习模型U-Net进行
训练
基于哨兵2的作物分割数据集。PyTorch框架为例,如何构建和
训练
U-Net模型来完成基于哨兵2的作物分割检测
使用深度学习模型如U-Net进行
训练
基于哨兵2的作物分割。
计算机C9硕士_算法工程师
·
2025-03-02 20:04
分割数据
深度学习
pytorch
人工智能
DeepSeek 开源狂欢周(四)DualPipe与EPLB双弹齐发,
训练
效率的“双引擎”加速器!
在DeepSeek开源周的第四天,DualPipe和EPLB这两项全新技术一同亮相,它们不仅为DeepSeek的低成本、高效
训练
大模型提供了强大支持,还为全球AI爱好者和从业者送上了两份“技术大礼包”。
OpenCSG
·
2025-03-02 19:56
开源
人工智能
社区
算法
2022.2.10
训练
思维练习
//输出十进制1234对应的八进制和十六进制//#include//intmain()//{//printf("0%o,0x%x\n",1234,1234);//return0;//}//将一个四位数反向输出//#include//intmain()//{//intn=0;//scanf_s("%d",&n);//while(n)//{//printf("%d",n%10);//n=n/10;//
钟佩颖
·
2025-03-02 18:52
c语言
2022.2.12思维
训练
(入门c语言题)
//#include//intmain()//{////return0;//}//#include//intmain()//{//printf("%d\n",sizeof(char));//printf("%d\n",sizeof(int));////printf("%d\n",sizeof(long));//printf("%d\n",sizeof(double));//return0;//}/
钟佩颖
·
2025-03-02 18:52
c语言
2W8000字 LLM架构文章阅读指北
|自然语言处理(NLP)之建模3、LLM大模型架构之词嵌入(Part1)3、LLM大模型架构之词嵌入(Part2)3、LLM大模型架构之词嵌入(Part3)4、LLM架构从基础到精通之Word2Vec
训练
全解析
·
2025-03-02 17:24
人工智能
使用Semantic Kernel:对DeepSeek添加自定义插件
大语言模型虽然具有强大的自然语言理解和生成能力,但它们通常是基于预
训练
的模型,其功能受限于
训练
时所接触的数据和任务。为大语言模型添加插件
归-途
·
2025-03-02 16:41
机器学习
oneapi
机器学习
关于openAI接口的使用(个人学习总结)
OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己
训练
模型
暗雾飘扬
·
2025-03-02 16:38
python机器学习_实验项目
学习
人工智能
3.4.4- 先颜色后形状的方式 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.4-先颜色后形状的方式可以再试试先颜色后形状的识别方式。importsenso
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
单片机
硬件工程
51单片机
嵌入式实时数据库
3.4.5-识别形状+颜色+增加最小变化阈值 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.5-识别形状+颜色+增加最小变化阈值在形状+颜色的识别效果中,发现小球是不动,
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
硬件工程
单片机
机器学习
人工智能
深度学习框架之主流学习框架
它们提供了构建、
训练
和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点:TensorFlow:由Google开发,是一个广泛使用的开源深度学习框架。
uu1224
·
2025-03-02 14:17
深度学习
学习
人工智能
机器学习
神经网络
Llama 2架构深度解析:Meta开源的70B参数大模型设计哲学
Llama2作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌:在预
训练
阶段融入
AI时代已来!
·
2025-03-02 14:46
llama
架构
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型摘要1引言2方法2.1模型架构2.1.1DINO-XPro2.1.2DINO-XEdge3数据集构建和模型
训练
数据收集模型
训练
摘要在本文中,我们介绍了
黄阳老师
·
2025-03-02 13:10
目标检测
目标跟踪
人工智能
指数移动平均(EMA)策略
在神经网络领域,EMA常被用于对模型参数进行平滑处理,使得网络模型在
训练
过程中能够更加稳定且泛化能力可能得到提升。
Sherry Wangs
·
2025-03-02 13:06
深度学习
深度学习
python
机器学习
Transformer预测 | 基于TCN-Transformer的股票价格预测(Pytorch)
文章目录预测效果文章概述程序设计参考资料预测效果文章概述Transformer预测|基于TCN-Transformer的股票价格预测(Python)Transformer模型本质上都是预
训练
语言模型,大都采用自监督学习
机器学习之心
·
2025-03-02 13:35
#
Transformer模型
transformer
pytorch
深度学习
TCN-Transformer
股票价格预测
【AI带来的机遇】
类比房地产黄金期中介赚取信息差、移动互联网初期应用商店分发红利,当前AI领域存在三大核心机遇:基础设施重构机遇(类比域名投资)AI大模型开源浪潮下,高质量
训练
数据资产、特定领域微调模型、模型中间件将成为新时代
调皮的芋头
·
2025-03-02 11:18
人工智能
神经网络
AIGC
如何用AI写程序
一、AI写程序之工具选择(一)主流AI编程工具介绍如今市面上有诸多AI编程工具可供选择,以下为大家介绍几种常见且实用的工具:ChatGPT:由OpenAI开发的一款基于Transformer架构的预
训练
模型
Honmaple
·
2025-03-02 11:46
人工智能
模型优化之强化学习(RL)与监督微调(SFT)的区别和联系
想了解有关deepseek本地
训练
的内容可以看我的文章:本地基于GGUF部署的DeepSeek实现轻量级调优之一:提示工程(PromptEngineering)(完整详细教程)_deepseekgguf-CSDN
搏博
·
2025-03-02 10:08
深度学习
人工智能
机器学习
架构
transformer
大模型在心力衰竭预测及临床方案制定中的应用研究报告
1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与
训练
LCG元
·
2025-03-02 09:58
围术期危险因子
预测模型研究
人工智能
完整的 Python 数据分析案例:在线游戏玩家付费预测
目录1.案例背景代码实现2.主要的代码难点解析2.1数据清洗-缺失值处理2.2特征工程-新特征计算与独热编码2.3特征选择2.4模型
训练
与评估2.5数据可视化3.可能改进的代码3.1数据清洗与特征工程改进
萧十一郎@
·
2025-03-02 08:56
python
机器学习
人工智能
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?
今天咱们聊聊最近在AI界引发轰动的新闻——DeepSeek和xAI相继用R1和Grok-3证明了预
训练
ScalingLaw并非OpenAI的护城河。这意味着什么呢?让我们一探究竟!
东方佑
·
2025-03-02 08:53
量子变法
chatgpt
人工智能
【大模型】fp32 和 fp16 的区别,混合精度的原理。
(仅为fp32的50%)数值范围约±3.4×10³⁸约±6.5×10⁴精度(尾数)23位(约7位有效十进制数)10位(约3位有效十进制数)用途高精度计算(如梯度更新)高效计算(如矩阵乘法)2.混合精度
训练
的原理核心思想
深度求索者
·
2025-03-02 08:20
python
pytorch
高效空间编码技术:SPD-Conv在目标检测中的创新应用
YOLOv8中的SPD-Conv实现YOLOv8SPD-Conv代码实现代码解析性能提升SPD-Conv的优势与应用场景SPD-Conv的设计细节与优化1.空间深度转换机制的进一步优化2.SPD-Conv的
训练
技巧与改进
向哆哆
·
2025-03-02 08:17
目标检测
目标跟踪
人工智能
yolov8
pytorch与深度学习随记——AlexNet
激活函数:AlexNet使用ReLU而不是sigmoid作为其激活函数,这有助于缓解梯度消失问题并加速
训练
过程。AlexNet架构的创新点局部响应归一化(LRN):AlexNet引入LRN层,可以创建
黑色的山岗在沉睡
·
2025-03-02 08:46
深度学习随记
深度学习
pytorch
人工智能
【大模型】什么是蒸馏版大模型
大模型蒸馏一、知识蒸馏与无监督样本
训练
1.知识蒸馏的核心原理目标:将复杂大模型(Teacher)的知识迁移到轻量化小模型(Student)中,提升小模型性能。
深度求索者
·
2025-03-02 07:12
python
人工智能
开发语言
【llm对话系统】 LLM 大模型推理python实现:vLLM 框架
它指的是利用
训练
好的LLM模型,根据输入(Prompt)生成文本的过程。然而,LLM的推理速度往往较慢,尤其是在处理长序列或高并发请求时,效率瓶颈尤为突出。为了解决这个问题,vLLM应运而生!
kakaZhui
·
2025-03-02 06:06
人工智能
AIGC
chatgpt
python
llama
卷积这个词在卷积神经网络中应该怎么理解
卷积核中的每个值称为权重(weights),这些权重是通过
训练
过程优化得到的。滑动窗
abments
·
2025-03-02 06:05
人工智能
cnn
深度学习
计算机视觉
卷积核在初始阶段的数据是怎么获取的
卷积核的初始化随机初始化:在大多数情况下,卷积核(滤波器)的权重在模型
训练
开始时是随机初始化的。常用的随机初始化方法包括以下几种:均匀分布初始化:权重从一个均匀分布中抽取值。
abments
·
2025-03-02 06:05
人工智能
深度学习
人工智能
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用
但当我们需要更强的语言生成能力时,往往会求助于更先进的预
训练
语言模型。OpenAI旗下的GPT系列模型(如GPT-3、GPT-3.5、GPT-4等)在生成文本方面拥有强大的表现。
山海青风
·
2025-03-02 05:29
人工智能
gpt
自然语言处理
python
DeepSeek R1 详解:思维链、强化学习和蒸馏
训练
过程较小模型基准为什么Deepseek很重要DeepSeekR1常见问题解答来自中国的新型大型语言模型DeepSeekR1的发布在人工智能研究界引起了轰动。这不仅仅是又一次渐进式改进。
前网易架构师-高司机
·
2025-03-02 05:58
2025年最新-深度学习+AI
DeepSeek和AI工具
深度学习
Deepseek
基于 langchain+ollama 创建私有化知识库
概念介绍什么是RAGRAG是retrieval-augmented-generation的缩写,直译中文的意思是检索增强生成,可以简单理解能让
训练
好的大模型LLM可以结合外部数据,可以补充或者修正大模型返回的答案
大语言模型
·
2025-03-02 02:09
langchain
知识图谱
LLM
人工智能
llama
RAG
知识库
硅基流动:免费领取2000万Token,畅享AI大模型盛宴!
其核心团队来自清华大学、MIT等顶尖高校,致力于为企业和开发者提供高性能的AI模型推理和
训练
解决方案。
·
2025-03-02 01:05
ai开发
sql深入学习
文章目录前言知识学习注释的两种形式字符型注入万能密码布尔盲注报错注入堆叠注入时间盲注二次注入小技巧前言这次学习建立在对数据库有基本的认识,了解基础的增删改查语句,数字型注入和字符型注入的基础上,进一步深入学习知识,并进行实战
训练
知识学习注释的两种形式
lally.
·
2025-03-01 22:38
sql
学习
数据库
实体识别处理--在给定的文本中识别特定类型的实体
它结合了字典匹配和向量相似度匹配两种方法,利用预
训练
的BERT模型来获取实体的嵌入表示,通过构建Trie树来提高字典匹配的效率。
风清扬【coder】
·
2025-03-01 21:04
自然语言分析处理
算法
深度学习
人工智能
nlp
自然语言处理
6.20CSIG腾讯云后台开发实习一面面经 C++50min
零零总总已经面了9场腾讯了,身心俱疲hr面完了一整天都是链接状态不知道有没有戏,感觉凉了AjokenevergainsaAjokenevergainsanenemybutoftenlosesafrie我在牛客笔试
训练
营第
han_xue_feng
·
2025-03-01 21:33
java
如何用 DeepSeek 进行卷积神经网络(CNN)的优化
然而,尽管CNN在这些任务中表现出色,它们通常需要大量的计算资源,并且在优化过程中可能会遇到一些挑战,如过拟合、
训练
速度慢、局部最优解等问题。
一碗黄焖鸡三碗米饭
·
2025-03-01 20:57
人工智能前沿与实践
cnn
人工智能
神经网络
机器学习
深度学习
基于RF随机森林机器学习算法的回归预测模型MATLAB代码实现了一个回归任务的决策树集成模型。
首先从Excel文件中导入数据集,并将数据划分为
训练
集和测试集。然后,对数据进行归一化处理并转置以适应模型的要求。
qq924711725
·
2025-03-01 20:22
仿真模型
机器学习
算法
随机森林
【学习】电脑上有多个GPU,命令行指定GPU进行
训练
。
CUDA_VISIBLE_DEVICES=1假设要使用第二个GPU进行
训练
。CUDA_VISIBLE_DEVICES=1pythontrain.py
超好的小白
·
2025-03-01 19:18
学习
人工智能
深度学习
深度学习开源数据集大全:从入门到前沿
在深度学习中,数据是模型
训练
的基石。本文整理了当前最常用且高质量的开源数据集,涵盖图像、视频、自然语言处理(NLP)、语音与音频等方向,帮助研究者和开发者快速定位所需资源。
念九_ysl
·
2025-03-01 19:48
AI
人工智能
图像识别-pytorch
模型可以是预
训练
的,也可以自己搭建。损失函数:用于衡量预测值与真实值之间的差距,如均方误差。损失函数越小越好。优化器:用于调整权重和偏置,使损失函数最小化。优化器决定了参数的调整方式。误差反传(
星辰瑞云
·
2025-03-01 17:08
机器学习
cnn
pytorch
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他