E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
【思维训练合集】
C++基础系列【26】排序和查找算法
游戏开发入门级选手《C++20高级编程》《C++23高级编程》等多本书籍著译者更多原创精品文章,首发gzh,见文末记得订阅专栏,以防走丢C++基础系列专栏C语言基础系列专栏C++大佬养成攻略专栏C++
训练
营排序与查找算法的重要性不用过多介绍了吧
程序喵大人
·
2025-03-22 23:15
C++基础系列
c语言
算法
开发语言
c++
深入解析深度学习中的过拟合与欠拟合诊断、解决与工程实践
二、核心概念与通熟易懂解释简单而言,欠拟合是指模型不能在
训练
集上获得足够低的误差。换句换说,就是模型复杂度低,模型在
古月居GYH
·
2025-03-22 22:43
深度学习
人工智能
CBNet--一种新的目标检测的复合骨干网体系结构
一、Introduction一般来说,在一个典型的基于CNN的目标检测器中,使用主干网络来提取检测对象的基本特征,该网络通常是为图像分类任务而设计的,并在ImageNet上预
训练
。
weixin_45963617
·
2025-03-22 22:43
深度学习系列
【纯职业小组——
思维
】
题目思路第十五届蓝桥杯省赛PythonB组H题【纯职业小组】题解(AC)_蓝桥杯纯职业小组-CSDN博客代码#includeusingnamespacestd;usingll=longlong;intmain(){ios::sync_with_stdio(0);cin.tie(0);intt;cin>>t;while(t--){intn;llk;cin>>n>>k;unordered_maph;f
Kent_J_Truman
·
2025-03-22 22:11
蓝桥杯
算法
深入探讨盘古大模型的高精度多尺度能力
一、盘古模型概述盘古模型是华为推出的中文预
训练
大模型系列,拥有数十亿甚至千亿级的参数规模。它以Transformer架构为基础,通过海量文本数据进行
训练
,表现出优异的自然语言理解和生成能
Hardess-god
·
2025-03-22 22:40
WRF
人工智能
算法
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
用上该算法后,Qwen2.5-32B模型只经过RL
训练
,不引入蒸馏等其他技术,在AIME2024基准上拿下50分,优于相同setting下使用GRPO算法的DeepSeek-R1-Zero-Qwen,且
·
2025-03-22 22:24
量子位
清华出品DeepSeek教程1-7版:前沿技术学习的黄金资源库
https://pan.quark.cn/s/b8d8760976ca「DeepSeek使用手册大全」链接:https://pan.quark.cn/s/52c234062a2e「DeepSeek资料
合集
你好ITgg
·
2025-03-22 22:08
pdf
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、
训练
和评估模型以及构建GUI应用程序展示检测
如何使用YOLOv8在AI-TOD数据集上进行遥感目标检测,从安装依赖项、准备数据集、配置YOLOv8、
训练
和评估模型以及构建GUI应用程序展示检测文章目录1.安装依赖2.数据准备3.配置YOLOv83.1
计算机C9硕士_算法工程师
·
2025-03-22 22:08
人工智能
YOLO
目标检测
遥感
MSE分类时梯度消失的问题详解和交叉熵损失的梯度推导
前文请移步笔者的另一篇博客:大模型
训练
为什么选择交叉熵损失(Cross-EntropyLoss):均方误差(MSE)和交叉熵损失的深入对比MSE分类时梯度消失的问题详解我们深入探讨MSE(均方误差)的梯度特性
阿正的梦工坊
·
2025-03-22 21:34
Machine
Learning
Deep
Learning
分类
人工智能
深度学习
机器学习
SQL优化思想——不优化或许是最好的优化⓵哈哈,其实我几乎什么都没做
首先就是要有批判性
思维
,我将告诉大家:不优化或许是最好的优化!故事从L老师的一次优化经历说起,希望给大家带来新的启发。⓵啥没做就搞定Q:L老师,自从您为XXX平台做了SQL优化后,运行非常顺畅,您是做
梁敬彬
·
2025-03-22 20:59
sql
数据库
一文说清楚什么是预
训练
(Pre-Training)、微调(Fine-Tuning),零基础小白建议收藏!!
前言预
训练
和微调是现代AI模型的核心技术,通过两者的结合,机器能够在处理复杂任务时表现得更为高效和精准。预
训练
为模型提供了广泛的语言能力,而微调则确保了模型能够根据特定任务进行细化和优化。
小城哇哇
·
2025-03-22 20:26
人工智能
语言模型
AI大模型
大模型微调
预训练
agi
LLM
anythingLLM 使用教程
与同类模型相比,anythingLLM具有
训练
数据丰富、模型优化程度高的优势,能够生成更符合逻辑、更具实用性的文本内容。
惟贤箬溪
·
2025-03-22 19:24
穷玩Ai
AIGC
人工智能
深度解析大模型推理框架:原理、应用与实践
该框架通过对海量数据进行高效的
训练
和推理,能够快速地对各种复杂场景进行分析
百度_开发者中心
·
2025-03-22 19:24
人工智能
大模型
自然语言处理
大模型推理框架:从理论到实践的全面解析
然而,深度学习模型的
训练
和推理过程往往涉及大量数据和复杂计算,传统的计算框架难以满足需求。因此,大模型推理框架应运而生,成为解决这一问题的关键。
百度_开发者中心
·
2025-03-22 19:23
人工智能
大模型
自然语言处理
《破局项目延期魔咒:构建全周期风险防控体系》
当项目计划屡屡失控、风险频发时,管理者需要以系统化
思维
重构项目管理体系。
玩转数据库管理工具FOR DBLENS
·
2025-03-22 19:50
数据库
甘特图
项目管理
数据库开发
大数据
回归任务
训练
--MNIST全连接神经网络(Mnist_NN)
importtorchimportnumpyasnpimportloggingfromtorch.utils.dataimportTensorDataset,DataLoaderfromtorch.utils.dataimportDataLoader#配置日志logging.basicConfig(level=logging.INFO,format='%(asctime)s-%(levelname
豆芽819
·
2025-03-22 18:10
深度学习框架PyTorch
pytorch
深度学习
人工智能
机器学习
回归
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造”
在江宁开发区,机器人已不再是科幻电影里的遥远想象,他们就像人类的“同事”,在工地上忙着贴砖、刷墙、搬运、检测;在体育
训练
场上帮助运动员矫正姿势;在医院里帮助医生发现帕金森早期征兆,在智慧工厂里与人类分工协作
耘瞳科技
·
2025-03-22 17:04
科技
大规异构集群 混合并行分布式
训练
系统,解决算力不均衡问题 HETHUB
视频教程在这:3.2大规模异构集群,混合并行分布式系统,解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因:同一种GPU数量有限难以构建大规模集群:
训练
大规模模型依赖于大量的计算资源
爱串门的小马驹
·
2025-03-22 16:29
万卡大规模集群大模型训练
异构集群
大规模集群
分布式
大模型训练
MiniMind:完全从 0
训练
自己的大模型
其目标是把上手LLM的门槛无限降低,直接从0开始
训练
一个极其轻量的语言模型,最低仅需2G显卡即可推理
训练
!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
minimind2学习:(1)
训练
1、数据下载参考:https://github.com/jingyaogong/minimind/tree/master2、预
训练
训练
6个epochspythontrain_pretrain.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
Stacking算法:集成学习的终极武器
1.Stacking算法原理探秘Stacking算法的核心思想是
训练
多个不同的基模型,并将它们的预测结果作为新模型的输入特征,以此来
civilpy
·
2025-03-22 14:16
算法
集成学习
机器学习
MiniMind
数据集分类:tokenizer
训练
集:这个数据集用于
训练
分词器(tokenizer),是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
直方图梯度提升:大数据时代的极速决策引擎
但当数据量突破百万级时,传统梯度提升树(GBDT)面临三大致命瓶颈:
训练
耗时剧增:每个特征的分割点计算都需要全量数据排序内存消耗爆炸:存储排序后的特征值需要额外空间处理效率低下:无法有效利用现代CPU的多核特性而梯度提升决策树
万事可爱^
·
2025-03-22 14:14
大数据
机器学习
深度学习
直方图梯度提升
GBDT
算法
【集成学习】:Stacking原理以及Python代码实现
总体来说,stacking集成算法主要是一种基于“标签”的学习,有以下的特点:用法:模型利用交叉验证,对
训练
集进行预测,从而实现二次学习优点:可以结合不同的模型缺点:增加了时间开销,容
Geeksongs
·
2025-03-22 14:14
机器学习
python
机器学习
深度学习
人工智能
算法
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
windows使用ssh-copy-id命令的解决方案
双985硕士毕业,现担任全栈工程师一职,热衷于将数据
思维
应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。
爱编程的喵喵
·
2025-03-22 14:40
Windows实用技巧
windows
ssh
ssh-copy-id
解决方案
DeepSpeed-Chat:Reward Model【奖励模型】
但是,RM和SFT微调之间存在几个关键差异:
训练
数据差异:对于SFT微调,数据是查询(query)和答案(answer)拼接在一起。
u013250861
·
2025-03-22 13:31
#
LLM/训练
RL/强化学习
排序
强化学习
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
本文深入探讨了幻觉问题的成因,包括
训练
数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象,我们分析了其在解
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
思维
导图 代码示例(java 架构)
CALL_FORM,NEW_FORM和OPEN_FORM之间的区别在OracleForms中,CALL_FORM、NEW_FORM和OPEN_FORM是用于管理和启动表单的不同命令。每个命令的行为和用途都有所不同,理解它们的区别对于正确构建和管理Forms应用程序非常重要。1.CALL_FORM定义:调用并运行另一个表单,但不会关闭当前表单。被调用的表单以模式对话框的形式显示,即用户必须完成或取消
用心去追梦
·
2025-03-22 12:24
java
架构
开发语言
从零搭建Pytorch模型教程(七)单机多卡和多机多卡
训练
前言本文主要介绍单机多卡
训练
和多机多卡
训练
的实现方法和一些注意事项。其中单机多卡
训练
介绍两种实现方式,一种是DP方式,一种是DDP方式。
AI大模型探索者
·
2025-03-22 12:50
pytorch
人工智能
python
transformer
深度学习
ai
机器学习
PyTorch基础知识讲解(一)完整
训练
流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型
训练
、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存
训练
好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
【机会约束、鲁棒优化】机会约束和鲁棒优化研究优化【ccDCOPF】研究(Matlab代码实现)
个人主页欢迎来到本博客❤️❤️博主优势:博客内容尽量做到
思维
缜密,逻辑清晰,为了方便读者。⛳️座右铭:行百里者,半于九十。
科研_G.E.M.
·
2025-03-22 11:48
matlab
概率论
开发语言
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统(参考论文(约7000字)+环境配置+完整部署代码+代码使用说明+
训练
好的模型)
基于pyqt5-yolov8实现车牌识别系统,包括图片车牌识别,视频车牌识别,视频流车牌识别。效果展示(图片检测,检测到的内容添加到历史记录):效果展示(视频检测,视频车辆只会添加一条记录,下文更多实际应用中的优化策略):新增功能:批量图片检测(2024/5/7更新代码)
学术菜鸟小晨
·
2025-03-22 11:48
yolov8实战100天
python
YOLO
pyqt5
车牌识别
毕业设计
论文
基于交替方向乘法(ADMM)的PAPR约束下传输波束成形器设计的方法研究(Matlab代码实现)
欢迎来到本博客❤️❤️博主优势:博客内容尽量做到
思维
缜密,逻辑清晰,为了方便读者。⛳️座右铭:行百里者,半于九十。
创新优化代码学习
·
2025-03-22 11:47
matlab
前端
算法
TensorFlow和Pytorch在功能上的区别以及优势
优点是性能优化更高效,适合大规模分布式
训练
和生产环境部署。缺点是调试相对复杂,因为计算图的构建和运行是分离的。PyTorch:使用动态计算图(DynamicGraph)。
Honeysea_70
·
2025-03-22 10:09
#
算法
tensorflow
pytorch
人工智能
Java复习路线
Java复习1、Java基础2、Java多线程3、Javaweb的复习4、MySql复习数据库常用的代码:
思维
导图:5、计算机组成原理6、网络编程7、Java注解和反射8、计算机网络9、html/css
Code good g
·
2025-03-22 10:31
面试准备
java
mysql
数据库
美团-测开
而且
思维
要活跃,能够构建一些测试体系。分析产品需求,参考技术方案,指定合理高效的测试方案,编写清晰的测试用例发现、定位、跟踪产品缺陷,协同开发解决问题开发高效的自动化测试工具
陈陈爱java
·
2025-03-22 09:29
postman
【C++】C++类
文章目录面向对象程序设计思想类概述类的声明与定义类的实现对象的声明面向对象程序设计思想面向对象是一种符合人类
思维
习惯的程序设计思想。现实生活中存在各种形态不同的事物,这些事物之间存在着各种各样的联系。
梵刹古音
·
2025-03-22 09:55
C++学习笔记
c++
开发语言
Pytorch使用手册-DCGAN 指南(专题十四)
我们将
训练
一个生成对抗网络(GAN),在给它展示大量真实名人照片后,它能够生成新的“名人”图片。
AI专题精讲
·
2025-03-22 08:43
Pytorch入门到精通
pytorch
人工智能
python
用故事与视觉化打造“高光“统计报告:5个实战技巧
本文将带你用叙事经济学+视觉设计
思维
,把冷冰冰的数据变成让人欲罢不能的"数据故事会",掌握让数据开口说话的秘密。
梦想画家
·
2025-03-22 07:03
数据分析工程
数据工程
分析工程
Microsoft Visual C++ Redistributable 各版本安装包
合集
MicrosoftVisualC++Redistributable2019x86:https://aka.ms/vs/16/release/VC_redist.x86.exex64:https://aka.ms/vs/16/release/VC_redist.x64.exeMicrosoftVisualC++Redistributable2017x86:https://go.microsoft.c
Eric Woo X
·
2025-03-22 06:24
C++
Windows
microsoft
c++
开发语言
蓝桥杯动态规划实战:从数字三角形到砝码称重
适合人群:蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形:经典DP首战告捷2.砝码称重:背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项
训练
题四、备考建议一
藍海琴泉
·
2025-03-22 06:22
蓝桥杯
动态规划
职场和发展
【AI大模型应用开发】【RAG评估】0. 综述:一文了解RAG评估方法、工具与指标
微信公众号也可搜【同学小张】本站文章一览:前面我们学习了RAG的基本框架并进行了实践,我们也知道使用它的目的是为了改善大模型在一些方面的不足:如
训练
数据不全、无垂直领域数据、容易出现幻觉等。
同学小张
·
2025-03-22 05:43
大模型
人工智能
笔记
经验分享
gpt
agi
AIGC
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题:SAM是一个基于大规模数据预
训练
的强大提示框架,推动了分割领域的发展。
s1ckrain
·
2025-03-22 04:42
计算机视觉
论文阅读
计算机视觉
人工智能
DeepSeek-R1核心技术深度解密:动态专家网络与多维注意力融合的智能架构实现全解析
DeepSeek-R1智能架构核心技术揭秘:从动态路由到分布式
训练
的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE(MixtureofExperts
Coderabo
·
2025-03-22 04:41
DeepSeek
R1模型企业级应用
架构
DeepSeek-R1
代码随想录算法
训练
营第八天| 344 反转字符串、541 反转字符串II
这两天开的是字符串专题,我准备在做题的时候用C++做一遍,再用C做一遍,因为一直刷leetcode用的都是C++,导致C的基础太薄弱了,之后工作中有可能用到C,相当于再复习复习一、Leetcode344反转字符串题目链接:Leetcode344反转字符串这道题很简单,这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
Anjoubecoding
·
2025-03-22 04:33
算法
数据结构
c++
c语言
leetcode
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析
随着深度学习技术的飞速发展,通过构建和
训练
神经网络模型,手写数字识别的精度已经可以达到99%以上。
快撑死的鱼
·
2025-03-22 02:45
Python算法精解
python
深度学习
开发语言
【致100位技术同路人:代码无边界,GIS×编程的双向奔赴!】
作为穿梭在GIS与通用编程之间的开发者,我始终相信:空间算法是经纬度的代码诗,而工程
思维
是让地理智能落地的坐标系。未来会继续用PostGIS的严谨写空间索引,用React/Vue的
喆星时瑜
·
2025-03-22 00:31
留言
感谢你们的关注
AI学习教程DeepSeek使用教程
合集
免费下载
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
oneboxai
·
2025-03-21 23:23
学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他