E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
图像分类训练细节
LLM的MoE架构的“动态路由”为什么能
训练
出来?
互联网各领域资料分享专区(不定期更新):Sheet正文大型语言模型(MoE)架构中的“动态路由”之所以能够被有效
训练
,关键在于其设计融合了可微分的路由机制、专家协同优化以及负载均衡约束。
互联网之路.
·
2025-02-24 09:46
知识点
架构
适用于呼叫中心质检的离线ASR模型
优势:预
训练
模型基于AIShell等中文数据集,准确率高。低延迟,适合实时处理(如质检中的实时监控)。支持GPU/CPU部署,提供Python和C++接口。部署
狂爱代码的码农
·
2025-02-24 08:07
VOIP那些事
容器
DeepSeek模型微调的原理和方法
预
训练
模型在大规模通用数据上进行了无监督或有监督的
训练
,学习到了丰富的语言知识、语义表示和通用模式。这些知识和模式具有一定的通用性,可以迁移到其他相关的任务中。
alankuo
·
2025-02-24 07:01
人工智能
垂类大模型微调(二):使用LLaMA-Factory
上一篇博文和大家一起安装了LLaMA-Factory工具,并下载了大模型在上面进行了简单的加载和推理,今天尝试通过LoRa技术对大模型进行微调;一、
训练
集准备1.1介绍
训练
集结构这里演示对Qwen2.5
CITY_OF_MO_GY
·
2025-02-24 07:00
从零到亿大模型微调
llama
Yolov8-pose:从零开始
训练
Yolov8关键点检测模型
/ultralytics#创建预
训练
模型文件夹,并下载关键点检测预
训练
模型mkdirweightscd.
CITY_OF_MO_GY
·
2025-02-24 07:00
YOLO
深度学习
人工智能
RAG+LLM和直接将整理的知识
训练
到模型中去有什么区别,各自有什么优缺点
1.RAG(Retrieval-AugmentedGeneration)+LLM(LargeLanguageModel)概念RAG是将信息检索与生成模型相结合的一种方法。具体来说,RAG会从一个知识库(如数据库、文档库、向量数据库等)中检索相关的信息片段或条目,然后将这些信息与输入的查询一起传递给一个生成模型(如GPT、T5、BERT等)进行回答生成。这个过程通常包括以下步骤:检索:从一个知识库中
MonkeyKing.sun
·
2025-02-24 06:54
RAG+LLM
训练模型
麻将开发那些事儿:从搭建到防护,聊聊背后的技术
细节
我是一个在游戏开发圈子里摸爬滚打了十五年的老兵,市面上大多数棋牌类游戏基本都接触过。最近,有朋友提到海南、湖南、湖北的麻将市场,说这块儿需求挺旺,但做好其实挺难,不少新手开发者一开始就栽在了搭建和安全防护上。今天索性和大家分享一些我在这方面的经验。希望能帮到正打算做这块儿项目的朋友,当然,大家有问题也可以随时沟通交流,毕竟技术圈子就是靠分享和碰撞才能有进步。麻将开发的基础:从服务器到功能的稳定性先
264玫瑰资源库
·
2025-02-24 06:52
游戏
源代码管理
cocos creator 项目总结二(战斗帧同步解析)
这个原理看上去一句话很简单,但是其实内部涉及的
细节
却很多,影响到游戏的卡顿,同步是否完全同步等问题,接下来我一一列举我制作过程中遇到的问题和解决方案。
xzben
·
2025-02-24 06:20
cocos
creator
帧同步
如何使用 Postman 自动化 API 测试
有许多不同的方法可以测试您的API,您选择的任何方法或方法组合最终将取决于您当前的业务需求、可用资源和实施
细节
。在本文中,我们将探讨如何为将在CI/CD管道中运行
pxr007
·
2025-02-24 06:50
postman
自动化
java
探索动态追踪的新边界——《DTrace与SystemTap实战》开源项目
DTrace与SystemTap实战》开源项目去发现同类优质开源项目:https://gitcode.com/1、项目介绍在软件开发和系统监控的领域中,动态追踪是一个强大的工具,它让我们能够深入了解程序执行的
细节
齐游菊Rosemary
·
2025-02-24 05:44
覆盖从供应、生产、销售到运营的全过程,引领行业数智化转型新方向的智慧快消开源了
基于多年的深度学习技术研究和业务应用为基础,集深度学习核心
训练
和推理框架、基础模型库、端到端开发套件、丰富的工具组件于一体,是中国首个自主研发、功能完备、开源开放的产业级深度学习平台。基
AI服务老曹
·
2025-02-24 04:39
开源
人工智能
自动化
音视频
能源
GPU与FPGA加速:硬件赋能AI应用
然而,
训练
和部署AI模型需要大量计算资源,这对传统的CPU架构提出了巨大挑战。1.2硬件加速的必要性为满足AI算法对计算能力的巨大需求,硬件加速技术应运而生。专用硬件如GPU(图形
AI天才研究院
·
2025-02-24 01:20
DeepSeek
R1
&
大数据AI人工智能大模型
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
LLaMA-Factory|微调大语言模型初探索(3),qlora微调deepseek记录
QLoRA通过反量化到BF16进行
训练
,在保持计算精度的同时,进一步节省显存和提高效率。QLoRA在加载、
训练
、以及权重
闻道且行之
·
2025-02-24 01:49
自然语言处理
语言模型
人工智能
qlora微调
llama
deepseek
手撸 chatgpt 大模型:单词向量化编码和绝对位置编码算法
最初,向量中的各个字段会被初始化为随机数,然后通过大量的数据和深度学习模型来
训练
这些向量。
训练
过程逐步改变向量字段的值,从而使这些字段包含某种“知识”。
coding 迪斯尼
·
2025-02-24 00:11
chatgpt
算法
人工智能
大语言模型
TikTok运营的思路和思维
一是舍不得用好的设备
训练
营里我推荐用苹果7及以上手机,不要用安卓,并用astrill作为上网环境,我自己在用,很O
TIKTOKHEZI
·
2025-02-23 23:37
新媒体运营
产品运营
内容运营
流量运营
用户运营
【Hive】学习路线:架构、运维、Hsql实战、源码分析
性能调优四.Hive源码分析一.Hive基础学习1.基础知识hive简介架构说明【hive-design】hive架构详解:描述了hive架构,hive主要组件的作用、hsql在hive执行过程中的底层
细节
roman_日积跬步-终至千里
·
2025-02-23 22:25
#
hive
hive
学习
架构
【5. C++ 数据抽象:理解与实践】
+中的数据抽象类与对象示例:简单的加法器类输出:数据抽象的好处访问控制与封装示例:封装与访问控制输出:设计策略总结前言数据抽象是面向对象编程中的一个重要概念,它指的是通过只暴露关键信息来隐藏数据的实现
细节
涛ing
·
2025-02-23 21:55
C++
面向对象
c++
开发语言
linux
ubuntu
c语言
vscode
人工智能
Hutool - Http:基于 HttpUrlConnection 的 Http 客户端封装
Java标准库中的HttpUrlConnection提供了基本的HTTP请求功能,但使用起来较为繁琐,需要处理很多
细节
,如连接管理、请求头设置、响应处理等。
五行星辰
·
2025-02-23 21:22
业务系统应用技术
hive
大数据
hadoop
java
后端
立体匹配常用数据集整理
文章目录前言一、常用数据集1.SceneFlow数据集2.KITTI数据集3.Middlebury数据集二、关于自己构建数据集
训练
的一些问题前言本文主要对立体匹配算法常用的公开数据集进行整理,包括数据集的简要介绍和下载链接
Scurry﹉
·
2025-02-23 21:18
人工智能
深度学习
计算机视觉
目前(2025年2月)计算机视觉(CV)领域一些表现优异的深度学习模型
按任务类型分类介绍:
图像分类
CoCa:结合对比学习和生成学习,通过对比损失对齐图像和文本嵌入,并使用标题生成损失预测文本标记。
空空转念
·
2025-02-23 20:18
深度学习系列
计算机视觉
深度学习
人工智能
小白购买莆田鞋时怎么辨别莆田鞋是顶级纯原还是普货?
速览观察外观
细节
,纯原级鞋子外观精致,仿真度高;而普货做工粗糙,
细节
处理不足3。闻气味辨材质,纯原级鞋子材质好,无刺鼻气味7。查看卖家信誉和产品介绍,靠谱卖家会提供详细
细节
图和材质说明2。
MM老狼爱吃肉
·
2025-02-23 20:16
生活
当你给大模型一段输入之后,它是怎么得到答案的
2.动用毕生所学(模型“回想”知识)大模型并不是真有一个“数据库”,而是依靠
训练
时海量的知识联结:(类似人类的经验积累)内在规律:从上学过的教材、论文、百科中记住过“地球自转导致太阳视运动”这个常识。
牛不才
·
2025-02-23 19:37
000-大模型
chatgpt
AIGC
文心一言
gpt
llama
agi
prompt
图像处理:模拟色差的生成
但在实际生产环境中,瓷砖色差检测的数据量较少,无法直接获取足够的数据来
训练
和优化深度学习模型。于是就考虑通过人为生成色差数据的方式来扩充数据集,进行色差的模拟。1.什么是色差?
何以为皇
·
2025-02-23 18:33
图像处理
人工智能
大学生创新
训练
项目经验分享
前几天有同学问我能不能写一个科研竞赛什么的经验贴,给新生们分享一下,正好最近事情不是很多,所以打算写一个关于大创申报的帖子,供有需要的同学参考。本人计算机学院22级的学生,大二下学期的时候申报的大创项目,然后顺利拿到了2024年大创国家级重点立项,(PS:学校共立项481项,其中仅2个国家级重点项目。一、回顾本人的准备过程(仅供参考)大一下学期的时候,了解到有大创这个平台,也希望自己本科阶段,能够
菜就多练@Jade
·
2025-02-23 18:32
创业创新
如何在 Hugging Face 上下载和使用模型—全面指南
无论你是从事学术研究还是在工业中应用NLP技术,HuggingFace都为你提供了丰富的预
训练
模型和工具库,这些资源大大加速了NLP任务的开发和部署。
Hello.Reader
·
2025-02-23 18:01
人工智能
python语言
运维
人工智能
机器学习
ai
谁掌握了体育数据的密码就是胜利者
这种转变不仅改变了球队的
训练
和比赛策略,更深刻地影响着体育产业的发展方向。一、数据采集:竞技体育的数字化基础现代体育数据的采集已经形成了完整的生态系统。在NBA赛场上,每块场地安装的6个追踪摄
翱翔的猪脑花
·
2025-02-23 17:54
服务器
运维
前端
AI如何预测比赛结果:体育预测技术全解析
一、系统架构设计1.整体架构数据采集层数据处理层模型
训练
层预测服务层应用展示层2.技术选型Python3.8+TensorFlow/PyTorchScikit-learnPandas/NumpyFlask
翱翔的猪脑花
·
2025-02-23 17:54
人工智能
Python+Spark地铁客流数据分析与预测系统 地铁大数据 地铁流量预测
本系统基于大数据设计并实现成都地铁客流量分析系统,使用网络爬虫爬取并收集成都地铁客流量数据,运用机器学习和时间序列分析等方法,对客流量数据进行预处理和特征选择,构建客流量预测模型,利用历史数据对模型进行
训练
和优化
qq_79856539
·
2025-02-23 16:16
javaweb
大数据
python
spark
大语言模型
训练
数据集格式
1.SFT(有监督微调)的数据集格式对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落
香菜烤面包
·
2025-02-23 16:13
#
AI
大模型
语言模型
人工智能
深度学习
大模型
训练
&& 微调数据格式
对于大语言模型的
训练
中,SFT(SupervisedFine-Tuning)的数据集格式可以采用以下方式:输入数据:输入数据是一个文本序列,通常是一个句子或者一个段落。
comli_cn
·
2025-02-23 16:43
大模型笔记
人工智能
大模型
细分数字货币钱包的不同种类
文章目录一、中心化钱包1.1中心化钱包架构1.2中心化钱包业务
细节
流程二、去中心化钱包(HD钱包)2.1去中心化钱包架构2.2去中心化钱包
细节
业务流程三、硬件钱包3.1硬件钱包架构3.2硬件钱包
细节
业务流程四
杰哥的技术杂货铺
·
2025-02-23 16:13
Web3
区块链
通俗理解Test time Scaling Law、RL Scaling Law和预
训练
Scaling Law
一、ScalingLaw解释1、预
训练
阶段的ScalingLaw(打地基阶段)通俗解释:就像建房子时,地基越大、材料越多、施工时间越长,房子就能盖得越高越稳。
老A的AI实验室
·
2025-02-23 16:12
#
【LLM】
人工智能
chatgpt
深度学习
LLM
agi
算法
RL
Python基础
训练
100题(带答案)
文末有彩蛋!!!Python3100例实例001:数字组合题目有四个数字:1、2、3、4,能组成多少个互不相同且无重复数字的三位数?各是多少?程序分析遍历全部可能,把有重复的剃掉。total=0foriinrange(1,5):forjinrange(1,5):forkinrange(1,5):if((i!=j)and(j!=k)and(k!=i)):print(i,j,k)total+=1pri
乔代码嘚
·
2025-02-23 16:12
python
开发语言
算法
大语言模型:从开发到运行的深度解构
一、LLM开发
训练
的全流程解析1.数据工程的炼金术数据采集:构建涵盖网页文本(CommonCrawl)、书籍、论文、代码等领域的超大规模语料库,典型规模可达数十TB。
nbsaas-boot
·
2025-02-23 15:38
语言模型
人工智能
自然语言处理
GPT和BERT的异同
BidirectionalEncoderRepresentationsfromTransformers)都是基于Transformer架构的语言模型,但它们的设计理念、使用的Transformer部分、
训练
方式
彬彬侠
·
2025-02-23 15:04
自然语言处理
gpt
bert
Transformer
解码器
编码器
NLP
自然语言处理
探秘 DeepSeek-V3:低成本
训练
铸就的 AI 大模型传奇
在人工智能大模型的激烈竞争赛道上,DeepSeek-V3宛如一匹黑马,凭借其卓越的性能和令人惊叹的低
训练
成本,迅速吸引了全球AI领域的目光。
道亦无名
·
2025-02-23 15:34
人工智能
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly
关键词长度泛化位置编码数据格式核心结论1.实验结论:十进制加法任务上的长度泛化最佳组合:FIRE位置编码随机化位置编码反向数据格式索引提示(indexhints,辅助定位)2.在适当的配置下,Transformer模型可以泛化到
训练
序列长度的
Zhouqi_Hua
·
2025-02-23 14:30
大模型论文阅读
论文阅读
语言模型
自然语言处理
深度学习
笔记
2025年Java高级工程师面试题精选:30道高频问题深度解析
答案:封装:隐藏对象的属性和实现
细节
,仅对外提供公共访问方式。继承:子类继承父类的属性和
emmm形成中
·
2025-02-23 13:52
java
开发语言
面试
基于Roboflow平台的数据集导出与YOLOv8目标检测
训练
实战
专栏订阅地址:https://blog.csdn.net/mrdeam/category_12804295.html文章目录基于Roboflow平台的数据集导出与YOLOv8目标检测
训练
实战1.什么是Roboflow
步入烟尘
·
2025-02-23 12:49
YOLO系列创新涨点超专栏
YOLO
目标检测
人工智能
Roboflow
YOLOv8
代码随想录
训练
营第二十三天| 39. 组合总和 40.组合总和II 131.分割回文串
39.组合总和题目链接/文章讲解:代码随想录视频讲解:带你学透回溯算法-组合总和(对应「leetcode」力扣题目:39.组合总和)|回溯法精讲!_哔哩哔哩_bilibili//组合问题要考虑是不是在一个集合里操作//最常见的就是递归回溯法//再考虑考虑剪枝classSolution{publicList>combinationSum(int[]candidates,inttarget){List
chengooooooo
·
2025-02-23 12:17
算法
DeepSeek引爆递归开发大爆炸!
DeepSeekR1的发布意味着AI的普及是必然的,因为它让人们能轻松创建新的推理数据集,并用这些数据
训练
强大的AI模型。
极道Jdon
·
2025-02-23 12:47
javascript
reactjs
人工智能
训练
师如何做图像数据标注,从情感分析和实体分析两个个场景分析
在人工智能
训练
中,图像情感分析和图像实体分析是两个重要的应用场景。高质量的图像数据标注对于
训练
情感识别模型和目标检测/语义分割模型至关重要。
小宝哥Code
·
2025-02-23 12:47
人工智能训练师
人工智能
TensorFlow 2 来
训练
一个线性回归模型
本节将通过一个简单的示例,带领大家了解如何使用TensorFlow2来
训练
一个线性回归模型。这个例子将帮助大家掌握如何从数据处理、模型构建、
训练
到评估等步骤,逐步实现一个基础的机器学习任务。
大数据张老师
·
2025-02-23 11:42
tensorflow
线性回归
人工智能
深度学习框架与边缘计算融合驱动医疗金融模型优化新路径
当前,TensorFlow、PyTorch等主流框架通过轻量化改造(如TensorFlowLite与PyTorchMobile)逐步适应边缘设备的资源限制,同时结合联邦学习技术构建分布式
训练
网络。
智能计算研究中心
·
2025-02-23 11:10
其他
边缘计算与联邦学习驱动医疗金融预测及模型可解释性技术突破
通过将计算资源下沉至终端设备,边缘计算有效缓解了传统中心化架构的延迟与带宽压力,而联邦学习则在保障数据隐私的前提下,实现了跨机构模型的分布式
训练
。
智能计算研究中心
·
2025-02-23 11:10
其他
人工智能学习框架
这些框架提供了强大的工具和库,使得开发者能够更高效地构建、
训练
和部署模型。目前市面上有许多流行的AI学习框架,每种框架都有其独特的特点和适用场景。
静默.\\
·
2025-02-23 10:36
人工智能
学习
NVIDIA A100 SXM4与NVIDIA A100 PCIe版本区别深度对比:架构、性能与场景解析
NVIDIAA100SXM4与PCIe版本深度对比:架构、性能与场景解析作为NVIDIAAmpere架构的旗舰级数据中心GPU,A100系列凭借强大的计算能力和显存带宽,已成为人工智能
训练
、高性能计算(
ASI人工智能
·
2025-02-23 09:55
人工智能
架构
机器人
AIGC
gpt
文心一言
palm
数字人源头厂商-源码出售源码交付-OEM系统贴牌
本文将深入剖析数字人源码搭建的技术开发
细节
,为开发者提供全面且深入的技术指南。技术体系架构感知层语音识别:技术选型:采用Kaldi语音识别框架,它是一个开源且灵活的工具包,支持多种语言和声学模型
余~~18538162800
·
2025-02-23 08:16
音视频
线性代数
网络
人工智能
从环境搭建到数据
训练
全流程实战
DeepSeek作为国产优秀大模型,支持本地化部署和私有数据
训练
,可完美解决:数据不出内网:医疗/金融等敏感行业刚需垂直领域定制:用自有数据打造专属AI助手算力自由掌控:灵活调配GPU资源,成本可控本文将带你从零完成
菜鸟养成_记
·
2025-02-23 08:16
人工智能
如何将DeepSeek集成到自己的项目中:从入门到精通
无论你是想构建一个
图像分类
系统,还是开发一个自然语言处理应用,DeepSeek都能帮助你快速实现目标。
木觞清
·
2025-02-23 08:43
人工智能
上一页
26
27
28
29
30
31
32
33
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他