E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2018多校联合训练
Llama 3.2入门基础教程(非常详细),Llama 3.2微调、部署以及多模态
训练
入门到精通,收藏这一篇就够了!
然后在
训练
上变化比较大,参数变大了,400B的还没放出来
中年猿人
·
2025-03-03 17:49
llama
android
人工智能
语言模型
深度学习
学习
自然语言处理
每日新闻掌握【2025年2月28日 星期五】
手机出口额同比下降3.1%至1343.6亿美元,占货物出口总额的3.8%,较
2018
年最高值的5.7%已明显下滑。百度与
cdmt
·
2025-03-03 15:40
每日新闻掌握
科技
GPT-4.5
OpenAI团队表示,GPT-4.5是他们迄今为止最大、最强的模型,在预
训练
和后
训练
方面实现了重大突破。
开发者每周简报
·
2025-03-03 15:38
人工智能
数学建模:MATLAB极限学习机解决回归问题
一、简述极限学习机是一种用于
训练
单隐层前馈神经网络的算法,由输入层、隐藏层、输出层组成。基本原理:输入层接受传入的样本数据。
DesolateGIS
·
2025-03-03 15:05
数学建模
数学建模
matlab
开发语言
DeepSeek-R1 技术报告解读:用强化学习激发大模型的推理潜能
文章目录1.背景2.DeepSeek-R1
训练
流程2.1DeepSeek-R1-Zero:纯强化学习2.2DeepSeek-R1:冷启动+多阶段
训练
3.蒸馏小模型3.1蒸馏流程与优势3.2蒸馏vs.直接
跑起来总会有风
·
2025-03-03 14:04
ai
AI编程
论文阅读
神经进化算法(Neuroevolution) 原理与代码实例讲解
然而,传统的神经网络
训练
方法通常依赖于人工设计的网络结构和参数初始化,这往往需要大量的经验和试错,并且难以找到最优的网络结构和参数。神经进化算法(Neuroevolutio
AI大模型应用之禅
·
2025-03-03 13:25
DeepSeek
R1
&
AI大模型与大数据
java
python
javascript
kotlin
golang
架构
人工智能
DeepSeek理论利润率高达545%;谷歌
联合
创始人布林要求员工每周工作60小时;曝域名ai.com要价1亿美元|极客头条
「极客头条」——技术人员的新闻圈!CSDN的读者朋友们好,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧。整理|苏宓出品|CSDN(ID:CSDNnews)一分钟速览新闻点!字节商业化迎来新调整:仅保留技术中台,千川划归电商智谱完成一笔金额超10亿元人民币的战略融资,杭州国资参投荣耀新任CEO李健首次公开亮相,未来5年将投入100亿美元建设AI设备生态DeepSeek大胆披露:
极客日报
·
2025-03-03 13:54
人工智能
青少年编程与数学 02-010 C++程序设计基础 22课题、自定义类型
青少年编程与数学02-010C++程序设计基础22课题、自定义类型一、类(Class)定义类使用类二、结构体(Struct)定义结构体使用结构体三、枚举(Enum)定义枚举使用枚举四、
联合
体(Union
明月看潮生
·
2025-03-03 11:37
编程与数学
第02阶段
青少年编程
c++
编程与数学
开发语言
【硬核教程】DeepSeek 70B模型微调实战:打造工业级AI开发专家(附完整代码+案例)
——基于LoRA+GRPO算法,显存直降10倍,手把手教你
训练
行业大模型为什么这篇内容值得收藏?
爱吃青菜的大力水手
·
2025-03-03 11:06
人工智能
自动化
半导体
分布式多卡
训练
(DDP)踩坑
多卡
训练
最近在跑yolov10版本的RT-DETR,用来进行目标检测。
m0_54804970
·
2025-03-03 11:05
面试
学习路线
阿里巴巴
分布式
YOLO 中 SPFF 模块的优化与 Focal Modulation 替代研究
文章目录1.YOLO中的SPPF模块分析2.FocalModulation简介3.在YOLO中用FocalModulation替换SPPF4.实验与对比分析4.1代码替换YOLO模型中的SPPF4.2
训练
对比
向哆哆
·
2025-03-03 10:57
YOLO
yolov8
【WOA-CNN-LSTM】基于鲸鱼算法优化深度学习预测模型的超参数研究(Matlab代码实现)
首先,我们介绍了LSTM模型的结构和
训练
过程。然后,我们
然哥爱编程
·
2025-03-03 10:25
深度学习
cnn
lstm
基于大模型的脂肪栓塞综合征风险预测与综合治疗方案研究报告
研究目的与方法二、脂肪栓塞综合征概述2.1定义与发病机制2.2病因与危险因素2.3临床表现与分类2.4诊断标准与方法三、大模型在脂肪栓塞综合征预测中的应用3.1大模型简介3.2数据收集与预处理3.3模型
训练
与验证
LCG元
·
2025-03-03 09:50
围术期危险因子
预测模型研究
人工智能
算法
机器学习
代码随想录算法
训练
day65---图论系列9《dijkstra(堆优化版)&Bellman_ford 算法》
代码随想录算法
训练
—day64文章目录代码随想录算法
训练
前言一、47.参加科学大会-----dijkstra(堆优化版)二、94.城市间货物运输I---Bellman_ford算法总结前言今天是算法营的第
Ritsu栗子
·
2025-03-03 08:45
算法
图论
c++
DeepSeek-R1:重新定义推理性能的开源人工智能
目录重新定义卓越的基准变革性应用案例技术创新后
训练
优化冷启动数据以提高可用性可扩展性蒸馏模型API集成:为开发者而生竞争定价:可及的高级人工智能开源优势DeepSeek代表的引用推动开放人工智能的边界推动边界意味着什么
知识小报童
·
2025-03-03 08:11
DeepSeek前言内容整理
开源
人工智能
深度学习
机器学习
神经网络
自然语言处理
语言模型
DeepSeek 开源周五个开源项目,引领 AI 创新?
这些项目涵盖了AI基础设施、模型
训练
和数据处理的各个方面,旨在通过透明和社区驱动的创新推动AI发展。这也解释了为什么DeepSeek可以用低成本
训练
出高质量的模型。
LaughingZhu
·
2025-03-03 08:09
开源
人工智能
产品运营
前端
经验分享
什么是索引下推
索引下推(IndexConditionPushdown,ICP)详解1.问题背景:
联合
索引的范围查询限制假设有一个
联合
索引(age,reward),执行以下查询:SELECT*FROMusersWHEREage
不要成为根号三
·
2025-03-03 05:15
Mysql
android
mysql
数据库
java
《AI大模型开发笔记》DeepSeek技术创新点
最新开源的DeepSeekV3模型不仅以顶尖基准测试成绩比肩业界SOTA模型,更以惊人的
训练
效率引发行业震动——仅耗费280万H800GPU小时(对应4e24FLOP@40%MFU)即达成巅峰性能。
Richard Chijq
·
2025-03-03 03:57
AI大模型开发笔记
人工智能
笔记
STM32实战开发(172):智能体育
训练
记录系统
引言随着人们对健康和运动的关注,体育
训练
记录系统变得越来越重要。智能体育
训练
记录系统能够帮助运动员记录、分析并优化他们的
训练
数据。
嵌入式开发项目
·
2025-03-03 02:53
stm32
人工智能
深度学习
单片机
嵌入式硬件
lstm
STM32实战开发(179):智能体育
训练
计划反馈系统
引言随着现代科技的不断发展,运动科学领域也在不断取得突破,尤其是在体育
训练
中,科技的应用越来越普及。从专业运动员到普通健身爱好者,都开始使用智能设备来优化
训练
计划,提高
训练
效率。
嵌入式开发项目
·
2025-03-03 02:53
stm32
嵌入式硬件
单片机
深度学习
人工智能
Python 与Java 开发人形机器人远程控制APP
使用Python和Java
联合
开发可以充分利用每种语言的优势,构建一个高性能、可扩展且功能丰富的应用。
Geeker-2025
·
2025-03-03 01:17
python
java
【AI大模型】Transformers大模型库(九):大模型微调之计算微调参数占比
、计算微调参数占比2.1概述2.2模型参数结构一览2.3微调参数占比计算三、总结一、引言这里的Transformers指的是huggingface开发的大模型库,为huggingface上数以万计的预
训练
大模型提供预测
LDG_AGI
·
2025-03-03 01:45
人工智能
PyTorch数据加载:实战入门
"好的数据加载是成功
训练
的第一步"一、为什么要用DataLoader?当我们刚开始学习深度学习时,常常会这样处理数据:#传统方式加载数据images=[...]#所有图片数据labels=[...]
秋.
·
2025-03-03 01:43
pytorch
人工智能
python
数据加载
大模型国产化迁移大模型到昇腾教程(Pytorch版)
已有国产AI芯片和Mindformers框架,基于昇腾910
训练
大模型,使用MindIE实现大模型服务化。本文介绍如何迅速将大型模型迁移到昇腾910B,许多入门者都是从斯坦福羊驼开始的。
科技互联人生
·
2025-03-03 01:42
科技
数码
人工智能
AIGC
语言模型
大模型微调入门(Transformers + Pytorch)
输出:我们预
训练
的名字。
训练
为了性能好下载小参数模型,普通机器都能运行。
昵称不能为null
·
2025-03-03 00:06
python
llm
机器学习
人工智能
清华大学Deepseek第六版AIGC发展研究3.0(共186页,附PDF下载)
2024年底,清华大学新闻与传播学院与人工智能学院
联合
发布了《AIGC发展研究3.0版》,这份报告系统梳理了AIGC技术的突破性进展、应用场景及社会影响,并展望了未来的发展方向。
xiecoding.cn
·
2025-03-03 00:05
AIGC
deepseek大模型
deepseek
清华大学deepseek
deepseek使用指南
deepseek怎么用
pdf
计算机视觉实战:YOLOv8在工业质检中的应用(附完整代码+数据集)
从数据标注到模型部署,包含环境配置、数据增强、模型
训练
全流程详解,手把手教你打造高精度智能质检系统!
emmm形成中
·
2025-03-03 00:03
深度学习
人工智能
python
计算机视觉
如何学习
训练
大模型——100条建议(附详细说明)_如何
训练
自己的大模型_大模型如何
训练
摘要:通过深入了解本文中的这些细节,并在实际项目中应用相关知识,将能够更好地理解和利用大模型的潜力,不仅在学术研究中,也在工程实践中。通过不断探索新方法、参与项目和保持热情,并将其应用于各种领域,从自然语言处理到计算机视觉和自动驾驶。通过不断学习、实践和探索,可以不断提升自己在深度学习领域的技能和洞察力,同时也能为社会和行业带来创新和改进。从小规模的项目和模型开始,逐渐迭代和扩展到更大的模型,逐步
大耳朵爱学习
·
2025-03-02 21:18
人工智能
语言模型
产品经理
大模型
AI大模型
隐马尔可夫模型详解
目录引言马尔可夫模型基础马尔可夫性质马尔可夫链的
联合
分布隐马尔可夫模型(HMM)简介模型参数的表示HMM的
联合
分布HMM的三大元素与基本公式HMM的三大基本问题评估问题:前向-后向算法(Forward-Backward
DuHz
·
2025-03-02 20:10
算法
人工智能
机器学习
信号处理
信息与通信
概率论
Pulsar官方文档翻译-概念和架构-基于地理位置复制(Geo Replication)
官网原文标题《ConceptsandArchitecture--GeoReplication》翻译时间:
2018
-11-05
爱码叔
·
2025-03-02 20:37
Pulsar官方文档翻译
Pulsar
geo
replication
概念
架构
使用深度学习模型U-Net进行
训练
基于哨兵2的作物分割数据集。PyTorch框架为例,如何构建和
训练
U-Net模型来完成基于哨兵2的作物分割检测
使用深度学习模型如U-Net进行
训练
基于哨兵2的作物分割。
计算机C9硕士_算法工程师
·
2025-03-02 20:04
分割数据
深度学习
pytorch
人工智能
DeepSeek 开源狂欢周(四)DualPipe与EPLB双弹齐发,
训练
效率的“双引擎”加速器!
在DeepSeek开源周的第四天,DualPipe和EPLB这两项全新技术一同亮相,它们不仅为DeepSeek的低成本、高效
训练
大模型提供了强大支持,还为全球AI爱好者和从业者送上了两份“技术大礼包”。
OpenCSG
·
2025-03-02 19:56
开源
人工智能
社区
算法
2022.2.10
训练
思维练习
//输出十进制1234对应的八进制和十六进制//#include//intmain()//{//printf("0%o,0x%x\n",1234,1234);//return0;//}//将一个四位数反向输出//#include//intmain()//{//intn=0;//scanf_s("%d",&n);//while(n)//{//printf("%d",n%10);//n=n/10;//
钟佩颖
·
2025-03-02 18:52
c语言
2022.2.12思维
训练
(入门c语言题)
//#include//intmain()//{////return0;//}//#include//intmain()//{//printf("%d\n",sizeof(char));//printf("%d\n",sizeof(int));////printf("%d\n",sizeof(long));//printf("%d\n",sizeof(double));//return0;//}/
钟佩颖
·
2025-03-02 18:52
c语言
2W8000字 LLM架构文章阅读指北
|自然语言处理(NLP)之建模3、LLM大模型架构之词嵌入(Part1)3、LLM大模型架构之词嵌入(Part2)3、LLM大模型架构之词嵌入(Part3)4、LLM架构从基础到精通之Word2Vec
训练
全解析
·
2025-03-02 17:24
人工智能
使用Semantic Kernel:对DeepSeek添加自定义插件
大语言模型虽然具有强大的自然语言理解和生成能力,但它们通常是基于预
训练
的模型,其功能受限于
训练
时所接触的数据和任务。为大语言模型添加插件
归-途
·
2025-03-02 16:41
机器学习
oneapi
机器学习
关于openAI接口的使用(个人学习总结)
OpenAIOpenAI的三种使用方法1、使用OpenAIAPI2、使用第三方库3、自己
训练
模型
暗雾飘扬
·
2025-03-02 16:38
python机器学习_实验项目
学习
人工智能
3.4.4- 先颜色后形状的方式 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.4-先颜色后形状的方式可以再试试先颜色后形状的识别方式。importsenso
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
单片机
硬件工程
51单片机
嵌入式实时数据库
3.4.5-识别形状+颜色+增加最小变化阈值 STM32串口通信 openmv+STM32串口通信 openmv串口通信openmv识别物体 openmv神经网络
训练
openmv数字识
非常详细的视频和文字教程,讲解常见的openmv教程包括巡线、物体识别、圆环识别、阈值自动获取等。非常适合学习openmv、K210、K230等项目视频合集链接在:openmv教程合集openmv入门到项目开发openmv和STM32通信openmv和opencv区别openmv巡线openmv数字识别教程LCD3.4.5-识别形状+颜色+增加最小变化阈值在形状+颜色的识别效果中,发现小球是不动,
好家伙VCC
·
2025-03-02 15:25
stm32
神经网络
嵌入式硬件
硬件工程
单片机
机器学习
人工智能
NASA 宇航员太空惊魂 30 天!波音飞船 5 大致命漏洞曝光:美国航天帝国正在崩塌?...
波音与NASA的
联合
声明背后,一场动摇美国航天霸权的系统性危机正在爆发…第一章太空惊变72小时去年6月5日,那本应是一次充满荣耀与探索的太空之旅,星际客机载着两位精英宇航员冲天而起,冲破大气层,向着浩瀚宇宙进发
思快奇
·
2025-03-02 15:50
人工智能
深度学习框架之主流学习框架
它们提供了构建、
训练
和部署神经网络所需的各种功能和库。以下是一些主流的深度学习框架及其特点:TensorFlow:由Google开发,是一个广泛使用的开源深度学习框架。
uu1224
·
2025-03-02 14:17
深度学习
学习
人工智能
机器学习
神经网络
Llama 2架构深度解析:Meta开源的70B参数大模型设计哲学
Llama2作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌:在预
训练
阶段融入
AI时代已来!
·
2025-03-02 14:46
llama
架构
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型摘要1引言2方法2.1模型架构2.1.1DINO-XPro2.1.2DINO-XEdge3数据集构建和模型
训练
数据收集模型
训练
摘要在本文中,我们介绍了
黄阳老师
·
2025-03-02 13:10
目标检测
目标跟踪
人工智能
指数移动平均(EMA)策略
在神经网络领域,EMA常被用于对模型参数进行平滑处理,使得网络模型在
训练
过程中能够更加稳定且泛化能力可能得到提升。
Sherry Wangs
·
2025-03-02 13:06
深度学习
深度学习
python
机器学习
Transformer预测 | 基于TCN-Transformer的股票价格预测(Pytorch)
文章目录预测效果文章概述程序设计参考资料预测效果文章概述Transformer预测|基于TCN-Transformer的股票价格预测(Python)Transformer模型本质上都是预
训练
语言模型,大都采用自监督学习
机器学习之心
·
2025-03-02 13:35
#
Transformer模型
transformer
pytorch
深度学习
TCN-Transformer
股票价格预测
【AI带来的机遇】
类比房地产黄金期中介赚取信息差、移动互联网初期应用商店分发红利,当前AI领域存在三大核心机遇:基础设施重构机遇(类比域名投资)AI大模型开源浪潮下,高质量
训练
数据资产、特定领域微调模型、模型中间件将成为新时代
调皮的芋头
·
2025-03-02 11:18
人工智能
神经网络
AIGC
如何用AI写程序
一、AI写程序之工具选择(一)主流AI编程工具介绍如今市面上有诸多AI编程工具可供选择,以下为大家介绍几种常见且实用的工具:ChatGPT:由OpenAI开发的一款基于Transformer架构的预
训练
模型
Honmaple
·
2025-03-02 11:46
人工智能
模型优化之强化学习(RL)与监督微调(SFT)的区别和联系
想了解有关deepseek本地
训练
的内容可以看我的文章:本地基于GGUF部署的DeepSeek实现轻量级调优之一:提示工程(PromptEngineering)(完整详细教程)_deepseekgguf-CSDN
搏博
·
2025-03-02 10:08
深度学习
人工智能
机器学习
架构
transformer
大模型在心力衰竭预测及临床方案制定中的应用研究报告
1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与
训练
LCG元
·
2025-03-02 09:58
围术期危险因子
预测模型研究
人工智能
完整的 Python 数据分析案例:在线游戏玩家付费预测
目录1.案例背景代码实现2.主要的代码难点解析2.1数据清洗-缺失值处理2.2特征工程-新特征计算与独热编码2.3特征选择2.4模型
训练
与评估2.5数据可视化3.可能改进的代码3.1数据清洗与特征工程改进
萧十一郎@
·
2025-03-02 08:56
python
机器学习
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他