E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
svm训练完保存权重
Eclipse 快捷键
1.基础操作1.1打开文件Ctrl+O:快速打开文件Ctrl+Shift+O:查找类或文件1.2
保存
文件Ctrl+S:
保存
当前文件1.3运行程序Ctrl+F
lsx202406
·
2025-03-22 17:05
开发语言
《南京日报》专题报道 | 耘瞳科技“工业之眼”加码“中国智造”
在江宁开发区,机器人已不再是科幻电影里的遥远想象,他们就像人类的“同事”,在工地上忙着贴砖、刷墙、搬运、检测;在体育
训练
场上帮助运动员矫正姿势;在医院里帮助医生发现帕金森早期征兆,在智慧工厂里与人类分工协作
耘瞳科技
·
2025-03-22 17:04
科技
大规异构集群 混合并行分布式
训练
系统,解决算力不均衡问题 HETHUB
视频教程在这:3.2大规模异构集群,混合并行分布式系统,解释算力不均衡问题HETHUB_哔哩哔哩_bilibili一、大规模异构集群出现的原因:同一种GPU数量有限难以构建大规模集群:
训练
大规模模型依赖于大量的计算资源
爱串门的小马驹
·
2025-03-22 16:29
万卡大规模集群大模型训练
异构集群
大规模集群
分布式
大模型训练
android音频概念解析
/audio_policy_configuration.xml:分别有primary,a2dp,usb,r_submix(用于音频数据回环);配置文件中的每一个module都被描述为HwModule,
保存
在
yyc_audio
·
2025-03-22 16:57
android
音视频
MiniMind:完全从 0
训练
自己的大模型
其目标是把上手LLM的门槛无限降低,直接从0开始
训练
一个极其轻量的语言模型,最低仅需2G显卡即可推理
训练
!
三花AI
·
2025-03-22 15:49
三花AI
人工智能
LLM大模型
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
MiniMind:3小时完全从0
训练
一个仅有26M的小参数GPT,最低仅需2G显卡即可推理
训练
!
哈罗·沃德
·
2025-03-22 15:19
LLM
gpt
minimind2学习:(1)
训练
1、数据下载参考:https://github.com/jingyaogong/minimind/tree/master2、预
训练
训练
6个epochspythontrain_pretrain.py--epochs6
溯源006
·
2025-03-22 14:47
minimind学习
学习
深度学习
生成模型
Stacking算法:集成学习的终极武器
1.Stacking算法原理探秘Stacking算法的核心思想是
训练
多个不同的基模型,并将它们的预测结果作为新模型的输入特征,以此来
civilpy
·
2025-03-22 14:16
算法
集成学习
机器学习
MiniMind
数据集分类:tokenizer
训练
集:这个数据集用于
训练
分词器(tokenizer),是文本处理中的一个重要步骤。它可以帮助模型更好地理解文本数据的结构。
亚伯拉罕·黄肯
·
2025-03-22 14:46
大模型
人工智能
直方图梯度提升:大数据时代的极速决策引擎
但当数据量突破百万级时,传统梯度提升树(GBDT)面临三大致命瓶颈:
训练
耗时剧增:每个特征的分割点计算都需要全量数据排序内存消耗爆炸:存储排序后的特征值需要额外空间处理效率低下:无法有效利用现代CPU的多核特性而梯度提升决策树
万事可爱^
·
2025-03-22 14:14
大数据
机器学习
深度学习
直方图梯度提升
GBDT
算法
【集成学习】:Stacking原理以及Python代码实现
总体来说,stacking集成算法主要是一种基于“标签”的学习,有以下的特点:用法:模型利用交叉验证,对
训练
集进行预测,从而实现二次学习优点:可以结合不同的模型缺点:增加了时间开销,容
Geeksongs
·
2025-03-22 14:14
机器学习
python
机器学习
深度学习
人工智能
算法
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的大规模语言模型预
训练
及wandb监控—支持余弦退火学习率调度/分布式预
训练
/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
关于AI OS那点事
上下文感知与切换:通过上下文管理器实现智能体交互状态的快照
保存
与恢复,解决LLM生
大囚长
·
2025-03-22 13:34
科普天地
大模型
人工智能
在WPF中把Canvas
保存
为图片,文本文件,xps文件
把xaml
保存
为图片、字符串、XPS等等。这里我写了一些方法,以供大家参考.。注意:以下
保存
操作前,一定要确保参数中的canvas有高和宽。
Anticlimax丶
·
2025-03-22 13:33
WPF
Canvas转图片
Canvas转文本文件
Canvas转xps文件
关于 2>/dev/null 的作用以及机理
/dev/null作为一个字符设备,所有写入它的数据都会被丢弃,不会
保存
在任何地方,因此执行命令时产生的错误信息就不会显示出来,也不会
保存
在日志文件中。重定向符号功能典型示例>覆盖式写入文
深耕半夜
·
2025-03-22 13:02
java
开发语言
DeepSpeed-Chat:Reward Model【奖励模型】
但是,RM和SFT微调之间存在几个关键差异:
训练
数据差异:对于SFT微调,数据是查询(query)和答案(answer)拼接在一起。
u013250861
·
2025-03-22 13:31
#
LLM/训练
RL/强化学习
排序
强化学习
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
本文深入探讨了幻觉问题的成因,包括
训练
数据的偏差、推理过程中的过度泛化以及缺乏外部验证机制。以DeepSeek系列模型为研究对象,我们分析了其在解
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
WPF 控件
保存
图片显示不全的问题,和后台代码添加控件不能显示的问题
这几天研究自动生成货物标签,想着在WPF中做一个自定义标签生成控件,然后点击那个标签控件生成打印,本来是个挺简单的功能,WPF控件
保存
图片有现成的API方法。没想到是个坑。
lijiaweizuishuai
·
2025-03-22 13:58
WPF
WPF
控件截图
WPF把Canvas另存为
把xaml
保存
为图片、字符串、XPS等等。这里我写了一些方法,以供大家参考.。注意:以下
保存
操作前,一定要确保参数中的canvas有高和宽。
baijing7600
·
2025-03-22 13:56
ui
wooyun知识库爬虫(自动整理
保存
为pdf)
#!C:\Python27\python.exe#coding=utf8importosimportpdfkitimporturllib2frombs4importBeautifulSoupfrommultiprocessingimportPoolimportsocketsocket.setdefaulttimeout(60)importsysreload(sys)sys.setdefaulten
大囚长
·
2025-03-22 13:55
编程人生
黑客帝国
spider
python
Python Excel操作新玩法:从零到高手掌握openpyxl
目录安装和导入创建和
保存
Excel文件读取Excel文件写入Exc
xuefeng_210
·
2025-03-22 12:51
python
自动化
java
从零搭建Pytorch模型教程(七)单机多卡和多机多卡
训练
前言本文主要介绍单机多卡
训练
和多机多卡
训练
的实现方法和一些注意事项。其中单机多卡
训练
介绍两种实现方式,一种是DP方式,一种是DDP方式。
AI大模型探索者
·
2025-03-22 12:50
pytorch
人工智能
python
transformer
深度学习
ai
机器学习
PyTorch基础知识讲解(一)完整
训练
流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型
训练
、模型评价4.模型
保存
、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和
保存
训练
好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统(参考论文(约7000字)+环境配置+完整部署代码+代码使用说明+
训练
好的模型)
基于pyqt5-yolov8实现车牌识别系统,包括图片车牌识别,视频车牌识别,视频流车牌识别。效果展示(图片检测,检测到的内容添加到历史记录):效果展示(视频检测,视频车辆只会添加一条记录,下文更多实际应用中的优化策略):新增功能:批量图片检测(2024/5/7更新代码)
学术菜鸟小晨
·
2025-03-22 11:48
yolov8实战100天
python
YOLO
pyqt5
车牌识别
毕业设计
论文
kafka 的 message 包括哪些信息
当magic的值为1的时候,会在magic和crc32之间多一个字节的数据:attributes(
保存
一些相关属性,比如是否压缩、压缩格式等等);如果magic的值为0,那么不存在attributes
weixin-80213251
·
2025-03-22 11:47
javaweb
java
kafka
hadoop
TensorFlow和Pytorch在功能上的区别以及优势
优点是性能优化更高效,适合大规模分布式
训练
和生产环境部署。缺点是调试相对复杂,因为计算图的构建和运行是分离的。PyTorch:使用动态计算图(DynamicGraph)。
Honeysea_70
·
2025-03-22 10:09
#
算法
tensorflow
pytorch
人工智能
Pytorch使用手册-DCGAN 指南(专题十四)
我们将
训练
一个生成对抗网络(GAN),在给它展示大量真实名人照片后,它能够生成新的“名人”图片。
AI专题精讲
·
2025-03-22 08:43
Pytorch入门到精通
pytorch
人工智能
python
MDK(Keil μVision 5)的编译过程及文件类型全解
以下是详细流程:预处理(Preprocessing)工具:armcc(ARMC/C++编译器)输入文件:.c(C源文件)、.h(头文件)输出文件:.i(预处理后的临时文件,默认不
保存
)作用:展开宏、处理条件编译指令
froxy
·
2025-03-22 07:07
工具
arm
stm32
面试题:session和cookie的区别?客户端禁用cookie, session还能用吗?
session和cookie的区别区别一:存放位置不同cookie数据
保存
在客户端,session数据
保存
在服务端。
来之前不会起名字
·
2025-03-22 07:04
面试题
java
服务器
javascript
面试
七天免登录 为什么不能用seesion,客户端的http请求自动携带cookei的机制(比较重要)涉及HTTP规范
如果是七天免登录,和session肯定没关系,因为session不能持久化,主要是客户端一旦关闭,seesion就失效了///所以必须是能持久化的,这就清晰了,要莫在的服务器
保存
,要摸在客户端设置cook
哥谭居民0001
·
2025-03-22 06:28
java
tomcat
http
蓝桥杯动态规划实战:从数字三角形到砝码称重
适合人群:蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形:经典DP首战告捷2.砝码称重:背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项
训练
题四、备考建议一
藍海琴泉
·
2025-03-22 06:22
蓝桥杯
动态规划
职场和发展
vue使用el-select下拉框匹配不到值的优化方案,el-select显示,当选择框的选项无法与选择框的value值匹配时,不显示value值的处理办法
复现步骤:数据字典新增一条【数据项】新添加一条工单数据绑定这个新增的【数据项】,提交
保存
操作。
保存
成功后,删除数据字典新增的【数据项】。然后点击当前新添加的工单数据编辑,操作,查看工单数据字典这一
Kingsaj
·
2025-03-22 06:51
项目实操
vue.js
elementui
javascript
微信小程序 uni-app解决旧页面缓存问题
constupdateManager=wx.getUpdateManager()//小程序版本更新管理器updateManager.onCheckForUpdate(function(res){//请求
完
新版本信息的回调
catino
·
2025-03-22 05:48
微信小程序
微信小程序
uni-app
前端
element plus table树形数据,增、删、改子节点数据时,进行局部刷新,而不刷新整个页面
...constlistLoading=ref(false)//
保存
节点映射的Mapconstmaps=reactive(newMap())constload=async(row,treeNode,resolve
catino
·
2025-03-22 05:48
vue.js
javascript
elementui
【AI大模型应用开发】【RAG评估】0. 综述:一文了解RAG评估方法、工具与指标
微信公众号也可搜【同学小张】本站文章一览:前面我们学习了RAG的基本框架并进行了实践,我们也知道使用它的目的是为了改善大模型在一些方面的不足:如
训练
数据不全、无垂直领域数据、容易出现幻觉等。
同学小张
·
2025-03-22 05:43
大模型
人工智能
笔记
经验分享
gpt
agi
AIGC
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题:SAM是一个基于大规模数据预
训练
的强大提示框架,推动了分割领域的发展。
s1ckrain
·
2025-03-22 04:42
计算机视觉
论文阅读
计算机视觉
人工智能
DeepSeek-R1核心技术深度解密:动态专家网络与多维注意力融合的智能架构实现全解析
DeepSeek-R1智能架构核心技术揭秘:从动态路由到分布式
训练
的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE(MixtureofExperts
Coderabo
·
2025-03-22 04:41
DeepSeek
R1模型企业级应用
架构
DeepSeek-R1
Docker国内设置镜像加速下载地址
正好在简书上看到有个老铁发了其他docker加速地址,试了下挺管用,就转载
保存
下分享给大家,如果使用阿里云镜像服务无法拉起镜像的话,可以试试下面的镜像地址1、目的国内的镜像很容易被屏蔽,导致dockerpull
黯然神伤888
·
2025-03-22 04:08
docker
docker
代码随想录算法
训练
营第八天| 344 反转字符串、541 反转字符串II
这两天开的是字符串专题,我准备在做题的时候用C++做一遍,再用C做一遍,因为一直刷leetcode用的都是C++,导致C的基础太薄弱了,之后工作中有可能用到C,相当于再复习复习一、Leetcode344反转字符串题目链接:Leetcode344反转字符串这道题很简单,这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
Anjoubecoding
·
2025-03-22 04:33
算法
数据结构
c++
c语言
leetcode
C语言【文件操作】详解上
如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的
保存
,我们可以使用文件。二、什么是文件?
Run_Teenage
·
2025-03-22 04:01
C语言基础
c语言
开发语言
挑战20天学
完
JavaSE第四天——方法的定义、调用和方法重载
方法的命名规则:首字母小写驼峰命名方法的定义Java的方法类似于其它语言的函数,是一段用来
完
呆呆why care
·
2025-03-22 04:01
挑战20天学完javaSE
java
笔记
改行学it
程序人生
Java File 类与文件操作
无论是读取配置文件、
保存
用户数据,还是进行日志记录,都离不开对文件的操作。Java提供了File类来表示文件和目录的抽象路径名,通过该类可以对文件和目录进行创建、删除、重命名等操作。
代码先锋者
·
2025-03-22 03:21
java开发
java
开发语言
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析
随着深度学习技术的飞速发展,通过构建和
训练
神经网络模型,手写数字识别的精度已经可以达到99%以上。
快撑死的鱼
·
2025-03-22 02:45
Python算法精解
python
深度学习
开发语言
Ubuntu 系统下如何搭建 ROS 工程
及其源代码目录src:mkdir-p~/catkin_ws/srccd~/catkin_ws2.初始化并构建工作空间:在~/catkin_ws目录下执行catkin_make该命令会生成以下目录:build/:
保存
编译过程中生成的中间文件和构建文件
阿斯顿的风格
·
2025-03-22 00:30
ubuntu
linux
运维
python
bash
DeepSeek-R1大模型微调技术深度解析:架构、方法与应用全解析
Transformer框架增强基于改进型Transformer架构,结合多头注意力机制(MLA)与动态
权重
分配技术,优化了长程依
大势下的牛马
·
2025-03-22 00:58
搭建本地gpt
架构
deepseek
微调
java基础--序列化与反序列化的概念是什么?
这样做的主要目的是
保存
对象的状态,以便以后可以恢复。反序列化则是把这些字节流重新变回Java对象,恢复对象的状态,方便程序继续使用它。详情内容1.什么是序列化?
阿硕的技术时间
·
2025-03-21 22:46
【学习笔记】
java
开发语言
【AI 天才研究院】从 MoE 架构到 AGI:DeepSeek 将给未来带来哪些影响?
FP8低精度
训练
:DeepSeek采用了FP8
AI天才研究院
·
2025-03-21 22:40
DeepSeek
R1
&
大数据AI人工智能大模型
人工智能
架构
agi
DeepSeek
分享Python7个爬虫小案例(附源码)
以下是每个案例的简介和源代码:1.爬取豆瓣电影Top250这个案例使用BeautifulSoup库爬取豆瓣电影Top250的电影名称、评分和评价人数等信息,并将这些信息
保存
到CSV文件中。
人工智能-猫猫
·
2025-03-21 21:06
爬虫
python
开发语言
《线程池:线程池资源回收策略修改》
当线程池出ThreadPool出作用域析构时,此时任务队列里如果还有任务,是等任务执行
完
再结束,还是不执行剩下的任务了?这其实是两种设计,线程池都析构了,任务也就不需要了。
郭源潮1
·
2025-03-21 21:04
基于可变参模板的线程池项目
线程池
C++11
C++17
c++
解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”
训练
数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理
·
2025-03-21 21:56
算法大数据人工智能图表表格
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他