E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
LLM训练
XGBoost系列文章(四):参数调优与模型
训练
XGBoost系列文章(四):参数调优与模型
训练
本文是XGBoost系列的第四篇,聚焦参数调优与模型
训练
实战,从参数分类到调优技巧,结合代码示例解析核心方法。
什么都想学的阿超
·
2025-03-05 14:13
原理概念
#
机器学习
机器学习
xgboost
【图像去噪】论文复现:真实噪声转高斯噪声,提升高斯噪声
训练
的模型性能!Learning to Translate Noise的Pytorch源码复现,跑通流程,框架结构和损失函数详解!
图像去噪(ImageDenoising)】关于【图像去噪】专栏的相关说明,包含适配人群、专栏简介、专栏亮点、阅读方法、定价理由、品质承诺、关于更新、去噪概述、文章目录、资料汇总、问题汇总(更新中)完整代码和
训练
好的模型权重文件下载链接见本文底部
十小大
·
2025-03-05 13:01
pytorch
人工智能
python
图像去噪
图像处理
深度学习
计算机视觉
大模型
训练
内存预估计算方法
方法论大模型在
训练
过程中,需要预估需要多少显存进行参数的存储,需要进行预估.来方便GPU的购买.举例以DeepSeek-V3模型为例,总共有671B个参数.B=Billion(十亿),因此,671B模型指拥有
junjunzai123
·
2025-03-05 13:29
人工智能
深度学习
机器学习
零基础也能看懂的ChatGPT等大模型入门解析!大模型入门到精通,看这篇就够了!
近两年,大语言模型
LLM
(LargeLanguageModel)越来越受到各行各业的广泛应用及关注。对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。
大模型微调实战
·
2025-03-05 12:27
chatgpt
百度
人工智能
大数据
wps
学习
大模型
曝罗永浩挖走小米前50号员工要做AIOS;谷歌呼吁美国政府不要拆分公司;Copilot+PC能本地运行DeepSeek|极客头条
AAAI2025杰出论文奖出炉,南大周志华团队获奖字节跳动以约3150亿美元估值启动新一轮股票回购计划消息称vivoOS部门新成立AI领域,大模型
训练
重心向端侧转移为“AIOS”招兵买马:消息称罗永浩挖来小
极客日报
·
2025-03-05 12:55
资讯
DeepSeek 各版本的区别
训练
数据:14.8万亿Token预
训练
,推理速度较快(每秒
dushky
·
2025-03-05 12:25
ai
语言模型
AI编程
智能模型轻量化:知识蒸馏技术如何重塑AI部署格局
一、技术本质的解构与重构知识蒸馏颠覆了传统模型
训练
的范式,构建了"师生传承"的新型学习
·
2025-03-05 11:10
人工智能
探秘Mixup:数据增强的新利器
这个项目的目标是通过混合不同样本的数据点生成新的
训练
样本,从而帮助模型更好地学习数
荣正青
·
2025-03-05 10:42
大模型研究:DeepSeek版本比较说明
截至2024年11月,DeepSeek已发布了多个版本的大模型,主要包括DeepSeek-Coder、DeepSeek-
LLM
等,各版本在不同方面各有优劣:各版本简介及对比1.DeepSeek-Coder
程序猿学长
·
2025-03-05 09:33
语言模型
dify、open-webui、chatbox 对比
Dify、Open-WebUI和Chatbox是当前主流的开源
LLM
应用工具,但在功能定位、技术架构和适用场景上有显著差异。
dushky
·
2025-03-05 09:31
语言模型
ai
AI编程
Efficient Large Language Models: A Survey
本文是
LLM
系列文章,针对《EfficientLargeLanguageModels:ASurvey》的翻译。
UnknownBody
·
2025-03-05 09:00
Survey
Paper
语言模型
人工智能
自然语言处理
深度学习代码分析——自用
tab=readme-ov-file借助了一些人工智能1_train_stage1.py代码功能总览该代码是弱监督语义分割(WSSS)流程的Stage1
训练
与测试脚本,核心任务是通过多标签分类模型生成图像级标签
肆——
·
2025-03-05 08:28
深度学习
人工智能
笔记
PyTorch 中结合迁移学习和强化学习的完整实现方案
迁移学习可以利用预
训练
模型的知识加速
训练
,而强化学习则通过与环境的交互优化策略。以下是如何在PyTorch中结合迁移学习和强化学习的完整实现方案。
小赖同学啊
·
2025-03-05 07:54
人工智能
pytorch
迁移学习
人工智能
pytorch 模型测试
在使用PyTorch进行模型测试时,一般包含加载测试数据、加载
训练
好的模型、进行推理以及评估模型性能等步骤。以下为你详细介绍每个步骤及对应的代码示例。
小赖同学啊
·
2025-03-05 07:24
人工智能
pytorch
人工智能
python
大模型在高血压预测及围手术期管理中的应用研究报告
目录一、引言1.1研究背景与意义1.2研究目的1.3国内外研究现状二、大模型预测高血压的原理与方法2.1常用大模型介绍2.2数据收集与预处理2.3模型
训练
与验证三、术前风险预测与手术方案制定3.1术前风险因素分析
LCG元
·
2025-03-05 07:21
围术期危险因子
预测模型研究
人工智能
算法
机器学习
Pytorch实现之基于相对平均生成对抗网络的人脸图像超分辨率
简介简介:改进SRGAN,并使用相对平均生成对抗网络的人脸图像超分辨率
训练
自己的数据集论文题目:FaceImageSuper-resolutionBasedOnRelativeAverageGenerativeAdversarialNetworks
这张生成的图像能检测吗
·
2025-03-05 07:49
优质GAN模型训练自己的数据集
生成对抗网络
人工智能
神经网络
计算机视觉
深度学习
python
pytorch
【论文笔记】3DGS压缩相关工作2篇
这一解决方案为新视图合成(NVS)带来了前所未有的视觉质量,但代价是
训练
多层感知机的优化过程极为耗时,且渲染速度很慢。
AndrewHZ
·
2025-03-05 06:11
深度学习新浪潮
论文阅读
3DGS
计算机图形学
算法
三维高斯飞溅
压缩方法
【大模型开源实战】10 分钟,教你如何用 LLama-Factory
训练
和微调大模型
在这个AI快速发展的时代,我们很高兴为大家带来LlamaFactory-一个为AI开发者和爱好者量身打造的实用工具平台。作为非计算机专业出身的开发者,我们深深受益于计算机世界的开放共享精神。今天,我们希望通过LlamaFactory为这个社区贡献我们的一份力量。LlamaFactory能为您提供什么?英文文档的AI翻译:利用大语言模型将英文文档翻译成中文,助您更便捷地获取最新技术信息。快速获取主流
Langchain
·
2025-03-05 06:40
llama
人工智能
自然语言处理
大模型
LLaMA
Factory
LLM
大语言模型
AI大语言模型(
LLM
):电商行业的搜索革命与未来趋势
大语言模型在电商搜索中的应用1.提升搜索精准度2.改善搜索召回率3.虚拟购物助手二、大语言模型与生成性AI的结合1.生成性AI:从搜索到对话式购物体验2.提升个性化推荐三、大语言模型的未来展望1.电商与
LLM
搞技术的妹子
·
2025-03-05 05:04
人工智能
语言模型
智能电视
Scaling Laws(缩放法则)详解
ScalingLaws(缩放法则)详解1.定义与核心概念ScalingLaws(缩放法则)描述的是模型性能(如准确率、任务表现)与计算资源(模型参数量、
训练
数据量、
训练
时间)之间的数学关系。
天一生水water
·
2025-03-05 05:00
人工智能
人工智能
LLM
OS 系统架构详细设计
LLMOS系统架构详细设计1.背景介绍近年来,大型语言模型(LargeLanguageModel,
LLM
)取得了飞速发展,在自然语言处理、对话系统、文本生成等领域展现出卓越的性能。
AI天才研究院
·
2025-03-05 03:45
AI大模型企业级应用开发实战
系统架构
LangChain链与记忆处理[10]:四种基础内置链、四种文档处理链,以及链的自定义和五种运行方式,让你的大模型更加智能
LangChain链与记忆处理[10]:四种基础内置链、四种文档处理链,以及链的自定义和五种运行方式,让你的大模型更加智能参考文章可以使用国产
LLM
进行下述项目复现:初识langchain[1]:Langchain
汀、人工智能
·
2025-03-05 03:15
AI
Agent
langchain
LangGraph
人工智能
大模型
智能问答
chain
Agent
tensorflow Serving架构详解和代码示例
tensorflowServing的原理和代码实现,并提供简要的代码阅读指导.如何serve一个模型具体的步骤可以参考官方文档.主要包括两个部分:1.导出模型1.启动服务需要说明的是导出模型部分.如果要把我们
训练
的模型拿来提供服务
lloyd_chou
·
2025-03-05 03:44
算法
ml
机器翻译
智慧城市
边缘计算
人工智能
Langchain解锁
LLM
大语言模型的结构化输出能力(多种实现方案)
在LangChain解锁
LLM
大语言模型的结构化输出能力:调用with_structured_output()方法这篇博客中,我们了解了格式化
LLM
输出内容的必要性以及如何通过调用langchain框架中提供的
晨欣
·
2025-03-05 02:33
langchain
语言模型
人工智能
DeepSeek 提示词技巧深度解析:从原理到实践
统计数据显示,经过专业提示词
训练
的用户,其获取有效答案的成功率可提升300%以上。要实现这种质的飞跃,需要掌握以下核心认知:1.信息解码机制:AI通过token化处理理解文本,
悠悠空谷1615
·
2025-03-05 02:00
经验分享
深度学习
语言模型
2025年初-值得关注的几款推理模型
这款模型被定位为“迄今最智能的模型”,并首次引入了混合推理功能,结合了普通大型语言模型(
LLM
)和专门的推理模型能力。
数据分析能量站
·
2025-03-05 01:24
机器学习
人工智能
什么是预
训练
?
一、介绍预
训练
模型诞生背景:对于某种特殊任务只存在少量的相关
训练
数据,以至于模型不能从中学习到有用的规律(标注资源稀缺,无大数据支持)举例:想对一批法律领域的文件进行关系抽取,就需要投入大量的精力(意味着时间和金钱的大量投入
卡卡大怪兽
·
2025-03-04 23:44
自然语言处理
MLM: 掩码语言模型的预
训练
任务
MLM:掩码语言模型的预
训练
任务掩码语言模型(MaskedLanguageModel,MLM)是一种用于
训练
语言模型的预
训练
任务,其核心目标是帮助模型理解和预测语言中的上下文关系。
XianxinMao
·
2025-03-04 23:41
语言模型
人工智能
自然语言处理
预
训练
模型微调与下游任务迁移学习技术
1.背景介绍机器学习技术近年来在计算机视觉、自然语言处理等领域取得了飞速发展,这离不开大规模预
训练
模型的贡献。
AGI大模型与大数据研究院
·
2025-03-04 22:37
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
什么是预
训练
语言模型下游任务?
问题:Word2Vec模型是预
训练
模型吗?由于
训练
的特性,word2Vec模型一定是与
训练
模型。给定一个词先使用独热编码然后使用预
训练
好的Q矩阵得到这个词的词向量。
衣衣困
·
2025-03-04 22:36
语言模型
人工智能
自然语言处理
大语言模型原理与工程实践:大语言模型推理工程推理加速:算子优化
1.背景介绍近年来,大语言模型(LargeLanguageModel,
LLM
)在自然语言处理(NLP)领域取得了显著的进展。其中,推理(Inference)过程是大语言模型的核心环节之一。
AI天才研究院
·
2025-03-04 22:32
计算
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
代码随想录算法
训练
营第五十六天| 图论02
99.岛屿数量注意深搜的两种写法,熟练掌握这两种写法以及知道区别在哪里,才算掌握的深搜。注意广搜的两种写法,第一种写法为什么会超时,如果自己做的录友,题目通过了,也要仔细看第一种写法的超时版本,弄清楚为什么会超时,因为你第一次幸运没那么想,第二次可就不一定了。代码随想录深度搜索,定义上下左右四个方向,找到一个第一个邻接矩阵就递归该点的上下左右,避免重复计算。版本一:direction=[[0,1]
Rachela_z
·
2025-03-04 21:00
算法
图论
微调(Fine-tuning)
微调(Fine-tuning)是自然语言处理(NLP)和深度学习中的一种常见技术,用于将预
训练
模型(Pre-trainedModel)适配到特定任务上。
路野yue
·
2025-03-04 20:49
人工智能
深度学习
大模型应用开发简易指南:Git教程助力亲自动手微调大型模型
LLM
正逐步成为信息世界的新革命力量,其通过强大的自然语言理解、自然语言生成能力,为开发者提供了新的、更强大的应用开发选择。
大模型官方资料
·
2025-03-04 19:11
人工智能
深度学习
云计算
chatgpt
javascript
《DataWorks:为人工智能算法筑牢高质量数据根基》
而在这一系列AI应用的背后,高质量的
训练
数据是其能够发挥强大效能的关键所在。就如同巧妇难为无米之炊,没有优质的数据,再先进的AI算法也难以施展拳脚。
·
2025-03-04 19:16
人工智能深度学习
我的2024年总结
【坚持健身,不用私教自己
训练
】这个也做到了,虽然做不到一周三四练,但基本上还是保证一周可以两练,同时尝试自己去健身房进行健身,感觉效果也不错。后面
XiyouLinux_Kangyijie
·
2025-03-04 18:36
小小总结
个人开发
大模型学习笔记-基于《Deep Dive into LLMs like ChatGPT》
构建数据集对于大语言模型(
LLM
)的
训练
而言,首先需要构建
XiyouLinux_Kangyijie
·
2025-03-04 18:33
学习
笔记
chatgpt
软件设计和软件架构之间的区别
并且深耕深度学习和数据集
训练
,提供商业化的视觉人工智能检测和预警系统(煤矿,工厂,制造业,消防等领域的工业化产品),合
前网易架构师-高司机
·
2025-03-04 17:56
软件架构
软件设计
系统架构
代码随想录算法
训练
营第十天|1. 两数之和,第454题.四数相加II
文档讲解:代码随想录难度:一般嗷~~1.两数之和力扣题目链接(opensnewwindow)给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定nums=[2,7,11,15],target=9因为nums[0]+nums[1]=2+7=9所以返回[0,1
火车叨位去1949
·
2025-03-04 17:54
算法
哈希算法
数据结构
java
散列表
大模型|
LLM
|Agent
大模型|
LLM
|Agent一、为何选择Agent?二、工具三、需求:基于Agent构建的聊天式数据查询应用四、Agent主要内容提示词:上下文工具五、效果测试一、为何选择Agent?
厦门德仔
·
2025-03-04 15:39
AI
人工智能
服务器
运维
BERT 和 Milvus 构建智能问答系统的全面技术解析,涵盖从原理到实践的完整流程
下面Python代码示例和优化策略:一、技术栈协作原理BERT的语义编码能力BERT作为预
训练
语言模型,通过双向Transformer结构将文本转换为高维向量(如768维),捕捉上下文语义信息。
·
2025-03-04 14:28
AI大模型-提示工程学习笔记22-元提示(meta-prompting)
的解决方案2.Meta-Prompting的工作流程(1)元提示输入(2)提示生成(3)提示评估(可选)(4)提示选择(可选)(5)任务执行3.Meta-Prompting的关键组件(1)大语言模型(
LLM
9命怪猫
·
2025-03-04 13:22
AI
人工智能
机器学习
ai
prompt
详解
LLM
核心技能-大文本分块技术
在构建
LLM
相关应用程序的背景下,分块是将大段文本分解成较小片段的过程。这是一项必不可少的技术,有助于优化我们使用
LLM
嵌入内容后从[矢量数据库]获取的内容的相关性。
大模型入门学习
·
2025-03-04 13:21
人工智能
大模型
学习
AI大模型
ai
Helix 是开源的私有 GenAI 堆栈,用于构建具有声明性管道、知识 (RAG)、API 绑定和一流测试的 AI 应用程序。
通过编写helix.yaml来构建和部署
LLM
应用程序。正在寻找私人GenAI平台?
2301_78755287
·
2025-03-04 13:50
人工智能
python流水线自动化项目教程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言1.项目环境准备Python安装选择Python开发环境安装必要库2.数据获取与理解4.模型
训练
流水线6.模型保存7.模型部署
小白教程
·
2025-03-04 12:46
python
python
自动化
开发语言
python自动化
python学习教程
python基础教程
SFT与RLHF的关系
在大模型
训练
中,SFT(监督微调)和RLHF(基于人类反馈的强化学习)是相互关联但目标不同的两个阶段,通常需要结合使用以优化模型性能,而非互相替代。
一只积极向上的小咸鱼
·
2025-03-04 11:12
人工智能
python 请求 流式
importrequestsimportjsonimportdatetimeasyncdefllm_qa_generator_stream(text,num_faq):url='http://172.16.2.45:6162/
llm
_qa_generator_stream'payload
Toky Zhu
·
2025-03-04 10:32
python
开发语言
AI大模型与区块链技术的结合
模型可信度:区块链记录模型的
训练
和使用过程,确保模型的透明性和
小赖同学啊
·
2025-03-04 10:31
人工智能
人工智能
区块链
深度学习
蚂蚁技术研究院发布推理大模型强化学习框架,邀请开发者共同助力 AGI 生态
AReaL源自开源项目ReaLHF,旨在
训练
每个人都可以复现和贡献的大型推理模型(LRM)。AReaL是蚂蚁技术研究院为开发一个完全开放和包容的AGI世界迈出的一步。
·
2025-03-04 10:52
开源开源项目介绍
本地
LLM
部署--Open WebUI(多媒体工具FFMPEG安装)
FFmpeg是一个功能强大的多媒体处理工具,支持音频、视频的编解码、转码、流媒体处理等。以下是Windows系统上安装FFmpeg的详细步骤,包括如何选择适合的版本以及Shared类型和Static类型的区别。1.下载FFmpegFFmpeg提供了多个预编译版本,您可以根据需求选择合适的版本。Windows64-bit版本GPL许可证(含共享库)ffmpeg-master-latest-win64
JerryGW
·
2025-03-04 06:02
LLM本地部署
ffmpeg
windows
上一页
13
14
15
16
17
18
19
20
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他