E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
大规模预训练语言模型
【集成学习】:Stacking原理以及Python代码实现
总体来说,stacking集成算法主要是一种基于“标签”的学习,有以下的特点:用法:模型利用交叉验证,对
训练
集进行预测,从而实现二次学习优点:可以结合不同的模型缺点:增加了时间开销,容
Geeksongs
·
2025-03-22 14:14
机器学习
python
机器学习
深度学习
人工智能
算法
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的
大规模
语言模型
预
训练
及wandb监控—支持余弦退火学习率调度/分布式
预
训练
/自动混
LLMs之minimind:minimind源码解读(pretrain.py)——实现基于Transformer架构的
大规模
语言模型
预
训练
及wandb监控—支持余弦退火学习率调度/分布式
预
训练
/自动混合精度优化
一个处女座的程序猿
·
2025-03-22 14:43
NLP/LLMs
CaseCode
transformer
minimind
预训练
DeepSpeed-Chat:Reward Model【奖励模型】
但是,RM和SFT微调之间存在几个关键差异:
训练
数据差异:对于SFT微调,数据是查询(query)和答案(answer)拼接在一起。
u013250861
·
2025-03-22 13:31
#
LLM/训练
RL/强化学习
排序
强化学习
摄影工作室预约管理系统基于Spring BootSSM
然而,传统的摄影工作室
预
QQ1978519681计算机程序
·
2025-03-22 13:00
spring
boot
后端
java
毕业设计
计算机毕设
【人工智能】大模型的幻觉问题:DeepSeek 的解决策略与实践
解锁Python编程的无限可能:《奇妙的Python》带你漫游代码世界大
语言模型
(LLM)的“幻觉”问题,即模型生成与事实不符或脱离上下文的内容,是限制其广泛应用的关键挑战之一。
蒙娜丽宁
·
2025-03-22 13:29
Python杂谈
人工智能
人工智能
RRU 软件中 DPD(数字
预
失真)的全面测试方案
RRU软件中DPD(数字
预
失真)的全面测试方案一、DPD原理在无线通信系统中,功率放大器(PA)用于放大射频信号以满足通信距离和覆盖范围的要求。
youngerwang
·
2025-03-22 12:52
测试验证之禅道
移动
5G
信息与通信
测试覆盖率
模块测试
从零搭建Pytorch模型教程(七)单机多卡和多机多卡
训练
前言本文主要介绍单机多卡
训练
和多机多卡
训练
的实现方法和一些注意事项。其中单机多卡
训练
介绍两种实现方式,一种是DP方式,一种是DDP方式。
AI大模型探索者
·
2025-03-22 12:50
pytorch
人工智能
python
transformer
深度学习
ai
机器学习
PyTorch基础知识讲解(一)完整
训练
流程示例
文章目录Tutorial1.数据处理2.网络模型定义3.损失函数、模型优化、模型
训练
、模型评价4.模型保存、模型加载、模型推理Tutorial大多数机器学习工作流程涉及处理数据、创建模型、优化模型参数和保存
训练
好的模型
苏雨流丰
·
2025-03-22 12:20
机器学习
pytorch
人工智能
python
机器学习
深度学习
yolov8实战第七天——pyqt5-yolov8实现车牌识别系统(参考论文(约7000字)+环境配置+完整部署代码+代码使用说明+
训练
好的模型)
基于pyqt5-yolov8实现车牌识别系统,包括图片车牌识别,视频车牌识别,视频流车牌识别。效果展示(图片检测,检测到的内容添加到历史记录):效果展示(视频检测,视频车辆只会添加一条记录,下文更多实际应用中的优化策略):新增功能:批量图片检测(2024/5/7更新代码)
学术菜鸟小晨
·
2025-03-22 11:48
yolov8实战100天
python
YOLO
pyqt5
车牌识别
毕业设计
论文
用 pytorch 从零开始创建大
语言模型
(零):汇总
用pytorch从零开始创建大
语言模型
(零):汇总本系列官方代码库:https://github.com/rasbt/LLMs-from-scratch/tree/main官方书籍:BuildaLargeLanguageModel
墨绿色的摆渡人
·
2025-03-22 11:12
用
pytorch
从零开始创建大语言模型
pytorch
语言模型
人工智能
TensorFlow和Pytorch在功能上的区别以及优势
优点是性能优化更高效,适合
大规模
分布式
训练
和生产环境部署。缺点是调试相对复杂,因为计算图的构建和运行是分离的。PyTorch:使用动态计算图(DynamicGraph)。
Honeysea_70
·
2025-03-22 10:09
#
算法
tensorflow
pytorch
人工智能
大
语言模型
学习路线:从入门到实战
大
语言模型
学习路线:从入门到实战在人工智能领域,大
语言模型
(LargeLanguageModels,LLMs)正迅速成为一个热点话题。
大模型官方资料
·
2025-03-22 10:05
语言模型
学习
人工智能
产品经理
自然语言处理
搜索引擎
Pytorch使用手册-DCGAN 指南(专题十四)
我们将
训练
一个生成对抗网络(GAN),在给它展示大量真实名人照片后,它能够生成新的“名人”图片。
AI专题精讲
·
2025-03-22 08:43
Pytorch入门到精通
pytorch
人工智能
python
使用 Milvus 进行向量数据库管理与实践
Milvus是一个开源向量数据库,专门用于存储、索引和管理深度神经网络以及其他机器学习模型生成的
大规模
嵌入向量。它的高性能和易用性使其成为处理向量数据的理想选择。
qahaj
·
2025-03-22 08:43
milvus
数据库
python
搜广推校招面经五十五
腾讯搜推面经一、双塔模型有什么缺点双塔模型(Two-TowerModel)是一种常见的推荐系统或检索系统架构,尤其在处理
大规模
用户-物品交互数据时表现出色。
Y1nhl
·
2025-03-22 07:07
搜广推面经
深度学习
机器学习
python
推荐算法
搜索算法
广告算法
人工智能
蓝桥杯动态规划实战:从数字三角形到砝码称重
适合人群:蓝桥杯备考生|算法竞赛入门者|DP学习实践者目录一、我的动态规划入门之路1.数字三角形:经典DP首战告捷2.砝码称重:背包问题的变形二、蓝桥杯高频算法考点三、蓝桥杯DP专项
训练
题四、备考建议一
藍海琴泉
·
2025-03-22 06:22
蓝桥杯
动态规划
职场和发展
微软Data Formulator:用AI重塑数据可视化的未来
DataFormulator是一款基于大
语言模型
(LLM)的AI工具,旨在帮助用户通过自然语言和界
几道之旅
·
2025-03-22 06:51
人工智能
智能体及数字员工
人工智能
信息可视化
如何使用百度云Qianfan进行AI应用开发
作为开发者,Qianfan支持多种AI应用开发组件,包括大
语言模型
(LLMs)、对话模型、嵌入模型和向量存储等。本文将重点介绍如何利用这些组件进行实际的AI应用开发。
dgay_hua
·
2025-03-22 05:47
百度云
人工智能
云计算
python
【大
语言模型
_5】xinference部署embedding模型和rerank模型
一、安装xinferencepipinstallxinference二、启动xinference./xinference-local--host=0.0.0.0--port=5544三、注册本地模型1、注册embedding模型curl-XPOST"http://localhost:5544/v1/models"\-H"Content-Type:application/json"\-d'{"mod
没枕头我咋睡觉
·
2025-03-22 05:14
大语言模型
语言模型
embedding
人工智能
向量检索、检索增强生成(RAG)、大
语言模型
及相关系统架构——典型面试问题及简要答案
1.什么是向量检索?它与传统基于关键字的检索相比有什么不同?答案要点:向量检索是将文本、图像、音频等数据映射为向量,在高维向量空间中基于相似度或距离进行搜索。与传统基于关键字的检索(如倒排索引)相比,向量检索更关注“语义”或“特征”,能找出语义上相似但未必包含相同关键词的内容。向量检索非常适合多模态场景(例如“以图搜图”)或自然语言问答(同义词、上下文关联等)。2.什么是检索增强生成(RAG)?核
快撑死的鱼
·
2025-03-22 05:13
算法工程师宝典(面试
学习最新技术必备)
语言模型
系统架构
面试
使用LangSmith追踪LLM令牌使用情况的指南
技术背景介绍在大
语言模型
(LLM)的应用中,令牌使用计数是估算模型调用成本的基础。LangSmith提供了一种有效的方式来帮助跟踪应用程序中的令牌使用。
dgay_hua
·
2025-03-22 05:13
java
服务器
前端
python
如何评估一个RAG系统(RAGas评测框架)-下篇
RAGas是一个用于评测RAG系统的评测框架,它支持与不同大
语言模型
的集成,并与langchain生态打通,能够很方便的构建评测系统。
写程序的小火箭
·
2025-03-22 05:13
大语言模型
人工智能
语言模型
chatgpt
langchain
gpt
【AI大模型应用开发】【RAG评估】0. 综述:一文了解RAG评估方法、工具与指标
微信公众号也可搜【同学小张】本站文章一览:前面我们学习了RAG的基本框架并进行了实践,我们也知道使用它的目的是为了改善大模型在一些方面的不足:如
训练
数据不全、无垂直领域数据、容易出现幻觉等。
同学小张
·
2025-03-22 05:43
大模型
人工智能
笔记
经验分享
gpt
agi
AIGC
一步到位!7大模型部署框架深度测评:从理论到DeepSeek R1:7B落地实战
本文在掘金同步发布:文章地址更多优质文章,请关注本人掘金账号:人肉推土机的掘金账号随着大
语言模型
(LLM)的广泛应用,如何高效部署和推理模型成为开发者关注的核心问题。
人肉推土机
·
2025-03-22 05:12
人工智能
python
【论文阅读】PERSONALIZE SEGMENT ANYTHING MODEL WITH ONE SHOT
PERSONALIZESEGMENTANYTHINGMODELWITHONESHOT原文摘要研究背景与问题:SAM是一个基于
大规模
数据
预
训练
的强大提示框架,推动了分割领域的发展。
s1ckrain
·
2025-03-22 04:42
计算机视觉
论文阅读
计算机视觉
人工智能
DeepSeek-R1核心技术深度解密:动态专家网络与多维注意力融合的智能架构实现全解析
DeepSeek-R1智能架构核心技术揭秘:从动态路由到分布式
训练
的完整实现指南一、DeepSeek-R1架构设计原理1.1动态专家混合系统DeepSeek-R1采用改进型MoE(MixtureofExperts
Coderabo
·
2025-03-22 04:41
DeepSeek
R1模型企业级应用
架构
DeepSeek-R1
代码随想录算法
训练
营第八天| 344 反转字符串、541 反转字符串II
这两天开的是字符串专题,我准备在做题的时候用C++做一遍,再用C做一遍,因为一直刷leetcode用的都是C++,导致C的基础太薄弱了,之后工作中有可能用到C,相当于再复习复习一、Leetcode344反转字符串题目链接:Leetcode344反转字符串这道题很简单,这才是真正的简单题voidreverseString(char*s,intsSize){intleft=0,right=sSize-
Anjoubecoding
·
2025-03-22 04:33
算法
数据结构
c++
c语言
leetcode
便民服务一体化的智慧园区开源了
充分利用现有的摄像头设备,无需
大规模
更换,降低成本同时提升系统的实施效率。用户只需在界面上进行简单的操作,就可以实现全视频的接入及布控。项目搭建地址基础项目搭建地址:yihecode
AI服务老曹
·
2025-03-22 03:52
音视频
人工智能
自动化
运维
能源
开源
MCP协议
MCP(ModelContextProtocol,模型上下文协议)是由Anthropic推出的一种开放标准,旨在统一大型
语言模型
(LLM)与外部数据源和工具之间的通信协议。
zhurui_xiaozhuzaizai
·
2025-03-22 03:21
入口集锦
人工智能
自然语言处理
使用Aim追踪LangChain执行
通过Aim,你可以轻松地追踪LangChain中
语言模型
(LLM)和工具的输入输出,以及代理的动作,从而在执行过程中快速定位和解决问题。
bavDHAUO
·
2025-03-22 02:17
langchain
python
利用Python和深度学习方法实现手写数字识别的高精度解决方案——从数据预处理到模型优化的全流程解析
随着深度学习技术的飞速发展,通过构建和
训练
神经网络模型,手写数字识别的精度已经可以达到99%以上。
快撑死的鱼
·
2025-03-22 02:45
Python算法精解
python
深度学习
开发语言
一个后端工程师对前端云 Vercel 的体验和探索
借助集成的CI/CD功能,开发者可以
预
·
2025-03-22 01:02
程序员
Open WebUI – 本地化部署大模型仿照 ChatGPT用户界面
OpenWebUI介绍:OpenWebUI是一个仿照ChatGPT界面,为本地大
语言模型
提供图形化界面的开源项目,可以非常方便的调试、调用本地模型。
m0_74824845
·
2025-03-22 01:37
chatgpt
ui
使用DeepEval进行LLM的单元测试
在构建大
语言模型
(LLM)时,测试是确保模型行为和性能的关键步骤。ConfidentAI推出的DeepEval提供了一套完整的工具包,帮助开发者进行LLM的单元测试和集成测试。
VYSAHF
·
2025-03-22 00:34
单元测试
log4j
python
DeepSeek-R1大模型微调技术深度解析:架构、方法与应用全解析
1.DeepSeek-R1大模型架构设计与技术特性1.1架构设计DeepSeek-R1作为超
大规模
语言模型
,其核心架构设计包含以下创新:专家混合架构(MoE)采用6710亿参数的混合专家架构(MoE),
大势下的牛马
·
2025-03-22 00:58
搭建本地gpt
架构
deepseek
微调
分享12个国内AI对话聊天的免费网站(含DeepSeek大模型)
在人工智能领域,基于对话的
语言模型
已成为当前研究的热点,其中以ChatGPT为代表的模型凭借其卓越的语言理解与交互能力备受瞩目。
码上飞扬
·
2025-03-21 23:20
人工智能
语言模型
DeepSeek
【AI 天才研究院】从 MoE 架构到 AGI:DeepSeek 将给未来带来哪些影响?
FP8低精度
训练
:DeepSeek采用了FP8
AI天才研究院
·
2025-03-21 22:40
DeepSeek
R1
&
大数据AI人工智能大模型
人工智能
架构
agi
DeepSeek
解析稳定率达99.99%!合合信息“大模型加速器2.0”助力AI打破“幻觉”
训练
数据是影响大模型“认知能力”的关键要素,近期,上海合合信息科技股份有限公司(简称“合合信息”)TextIn“大模型加速器2.0”版本正式上线,基于领先的智能文档处理技术,对复杂文档的版式、布局和元素进行精准解析及结构化处理
·
2025-03-21 21:56
算法大数据人工智能图表表格
nextjs 实现rag知识库检索增强的ai问答app
AI-Chat-一个基于LLM大
语言模型
的知识库问答系统项目源码:https://github.com/goliter/ai-chat项目简介AI-Chat是一个基于Next.js和React开发的现代化大
语言模型
的知识库问答系统
*goliter *
·
2025-03-21 20:55
web开发学习
人工智能
使用大
语言模型
API在AI应用中的实现
随着人工智能技术的迅速发展,大
语言模型
(LLM)在自然语言处理(NLP)领域的应用越来越广泛。
qq_37836323
·
2025-03-21 19:47
人工智能
语言模型
自然语言处理
python
国外7个最佳大
语言模型
(LLM) API推荐
大型
语言模型
(LLM)API将彻底改变我们处理语言的方式。在深度学习和机器学习算法的支持下,LLMAPI提供了前所未有的自然语言理解能力。
幂简集成
·
2025-03-21 19:15
API新理念
语言模型
人工智能
自然语言处理
【深度学习】DeepSeek模型介绍与部署
原文链接:DeepSeek-V31.介绍DeepSeek-V3,一个强大的混合专家(MoE)
语言模型
,拥有671B总参数,其中每个token激活37B参数。
Nerous_
·
2025-03-21 19:15
深度学习
深度学习
人工智能
【NLP】 API在大
语言模型
中的应用
大
语言模型
(LargeLanguageModels,LLMs)通过API(应用程序接口)为开发者提供了便捷的调用方式,使其能够快速集成自然语言处理能力到各类应用中。
Nerous_
·
2025-03-21 18:13
深度学习
自然语言处理
语言模型
人工智能
【nnUnetv2】Code复现
相反的,把重心放在:预处理(resampling和normalization)、
训练
(loss,optimizer设置、数据增广)、推理(patch-based策略、test-time-augmentations
是Winky啊
·
2025-03-21 18:35
#
项目nnUnet
人工智能
深度学习
决策树算法及其python实例
每个内部节点表示在属性上的一个测试,每个分支代表一个测试输出,每个叶节点代表一种类别二、决策树的构造1、决策树的构造步骤输入:
训练
集D={(21,11),(z2,32),
m0_74831463
·
2025-03-21 17:57
算法
决策树
python
大模型在冠心病风险预测及临床方案制定中的应用研究
国内外研究现状1.3研究方法与创新点二、大模型预测冠心病风险原理与方法2.1数据收集与预处理2.1.1数据来源2.1.2数据清洗与整理2.2特征工程2.2.1特征提取2.2.2特征选择与优化2.3模型选择与
训练
LCG元
·
2025-03-21 17:27
围术期危险因子
预测模型研究
人工智能
机器学习
python
【赵渝强老师】达梦数据库MPP集群的架构
为了支持海量数据存储和处理等方面的需求,为高端数据仓库提供解决方案,达梦数据库提供了
大规模
并行处理MPP架构,以极低的成本代价,提供高性能的并行计算。
·
2025-03-21 16:12
数据库信创
目标检测中归一化的目的?
这使得模型在
训练
和推理时能够处理任意尺寸的图像,而不需要关心图像的具体像素尺寸。2.位置和尺寸的相对性归一化后的坐标和尺寸是相对于图像尺寸的,而不是绝对像素值。这种相对性使得
林语微光
·
2025-03-21 14:37
kaggle
目标检测
目标跟踪
人工智能
关于神经网络中的正则化
神经网络
训练
中的正则化正则化(Regularization)是神经网络
训练
中的一个关键技术,主要用于防止模型过拟合(overfitting),提高泛化能力。1.为什么需要正则化?
文弱_书生
·
2025-03-21 14:07
乱七八糟
神经网络
人工智能
深度学习
谷歌:对比学习将LLM转为嵌入模型
GeneralizableEmbeddingsfromGemini来源:arXiv,2503.07891摘要在本报告中,我们介绍了Gemini嵌入,这是一种最先进的嵌入模型,它利用了Gemini、Google最有能力的大型
语言模型
的力量
大模型任我行
·
2025-03-21 13:59
大模型-成熟基座
人工智能
自然语言处理
语言模型
论文笔记
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他