E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预检
【重磅】2024国内主流AI 大模型架构及应用场景深度分析———————————————— 版权声明:本文为博主原创文章,遵循 CC 4.
经过大规模
预
训练的大模型,能够在各种任务中达到更高的准确性、降低应用的开发门槛、增强模型泛化能力等,是AI领域的一项重大进步。
m0_68282957
·
2025-05-04 07:26
人工智能
架构
百度
了解大模型 RAG :大模型外挂知识库 (检索增强技术)
Retrieval-AugmentedGeneration):大模型外挂知识库(检索增强技术)前言了解大模型RAG(Retrieval-AugmentedGeneration):大模型外挂知识库(检索增强技术)为了弥补通用的
预
训练大模型在某些专业领域的短板
程序员二飞
·
2025-05-04 06:47
人工智能
语言模型
学习
pdf
1.1探索 LLaMA-Factory:大模型微调的一站式解决方案
探索LLaMA-Factory:大模型微调的一站式解决方案引言在大模型的时代,微调技术是将
预
训练模型适配到特定任务的关键。
陈奕昆
·
2025-05-04 03:57
大模型微调教程
llama
人工智能
大模型微调
JavaScript性能优化实战(7):代码分割与懒加载实战
目录代码分割基础与原理现代打包工具中的代码分割配置动态import()实现按需加载路由级别与组件级别的代码分割策略预加载与
预
获取资源Tree-shaking深度应用大型SPA
程序员查理
·
2025-05-03 21:21
#
Javascript
javascript
开发语言
ecmascript
Large Language Models Could Be Rote Learners
研究方法
预
调查:将MMLU基准测试集的MCQ分为记忆和非记忆子集,通过对比模型在不同子集上的准确率,发现LLMs在记忆的MCQ上表现更差,表明存在死记硬背和真正能力学习两种现象。
UnknownBody
·
2025-05-03 19:33
LLM
Daily
语言模型
人工智能
自然语言处理
Loss-Free Balancing MoE论文解读:无损负载均衡的突破
论文解读:无损负载均衡的突破《AUXILIARY-LOSS-FREELOADBALANCINGSTRATEGYFORMIXTURE-OF-EXPERTS》是一篇由LeanWang等人于2024年发表的
预
印本论文
阿正的梦工坊
·
2025-05-03 18:31
DL
Papers
LLM
负载均衡
人工智能
语言模型
自然语言处理
分布式事务:深度解析TCC分布式事务(原理、优缺点与潜在问题)
)是一种基于业务补偿的分布式事务解决方案,通过将事务拆分为三个阶段实现最终一致性:成功失败开始Try阶段:资源预留Confirm阶段:提交Cancel阶段:回滚完成2.三阶段详解(1)Try阶段(资源
预
占
fjkxyl
·
2025-05-03 18:30
分布式
CVPR王炸组合:特征融合+目标检测!想发高分就看这篇
这主要得益于,特征融合在目标检测中整合了不同层或尺度的特征信息(既包含低层的细节信息,也包含高层的语义信息),这样不仅可以提高检测的准确性,增强模型对复杂场景和目标的鲁棒性,减少误
检
和漏检,还可以降低计算复杂度
深度之眼
·
2025-05-03 18:28
深度学习干货
人工智能干货
计算机视觉
目标跟踪
人工智能
特征融合
通过带有FLASK的REST API在PYTHON中部署PYTORCH
特别是,我们将部署
预
训练的DenseNet121模型来检测图像。
孙琪翔
·
2025-05-03 18:55
ArcGIS+GPT:多领域地理分析与决策新方案
助力二次开发AI助力科研绘图ArcGIS+AI综合应用了解更多———————————————————————————————————————前言综述在数字化和智能化快速发展的时代,地理信息系统(GIS)与生成式
预
训练模型
zm-v-15930433986
·
2025-05-03 15:37
arcgis
ChatGPT
arcgis
gpt
大语言模型原理基础与前沿 语言模型和分词
在深度学习框架中,语言模型通常通过神经网络实现,并使用大规模语料库进行
预
训练,以学习语言的统计规
杭州大厂Java程序媛
·
2025-05-03 14:03
java
python
javascript
kotlin
golang
架构
人工智能
【深度学习】LoRA: Low-Rank Adaptation of Large Language Models,论文解读
低秩适应矩阵被注入到
预
训练模型的每一层Transformer结构中,这一步是如何做到的?摘要自然语言处理的一个重要范式是在通用领域数据上进行大规模
预
训练,并适应特定任务或领域。
XD742971636
·
2025-05-03 13:54
深度学习机器学习
深度学习
语言模型
人工智能
深度学习芯片的数据
预
取机制与片上缓存交错策略研究
数据
预
取机制和片上缓存交错策略是解决这一瓶颈的重要手段。数据
预
取机制通过预测处理器未来需要的数据并提前加
学习ing1
·
2025-05-03 12:19
深度学习
缓存
智能电视
深入解析Transformer:LLM大模型的核心架构
大量的研究从n元语言模型(n-gramLanguageModels)、神经语言模型(NeuralLanguageModels,NLM)以及
预
训练语言模型(Pre-trainedLan
bishedaima_com_q
·
2025-05-03 10:39
transformer
深度学习
人工智能
让我们用 PyTorch 从头开始构建我们自己的 GPT 模型
今天,我们将离开VisionTransformer系列,并讨论构建生成
预
训练Transformer(GPT)的基本变体。
AI技术学长
·
2025-05-03 08:20
PyTorch
GPT
大模型
机器学习
深度学习
计算机视觉
人工智能
IPSec动态隧道主模式
在R1上配置ipsec加密转换集名称为myset;动态ipsec加密图名称为dymymap;
预
共享密钥为明文123456;静态的ipsec加密图mymapcryptoisakmppolicy1//创建新的
春生黎至1005
·
2025-05-03 08:49
网络
笔记
Spring Gateway的入门概述简介
但是在请求到这些正式的服务的时候一般会有一些
预
前的处理,比如:权限校验,流量控制,灰度发布等。如果这些都在各自的服务中去做,势必会增加这些基础功能的维护成本。
易秋之
·
2025-05-03 03:16
spring
gateway
java
World of Warcraft [CLASSIC] 80 WLK [Unit Transfer Team]
1)按I或者点击【队伍查找器】2)弹出【地下城和团队副本】窗口3)【
预
创建队伍】-【地下城】4)选中【地下城】,点击【创建队伍】5)填写队伍【名称】(本例子随便写得“如何一个人转团队呢”),点击【列出队伍
spencer_tseng
·
2025-05-03 01:03
game
WoW
80
WLK
RAID
基于自然语言处理的情感对话系统设计
方法上,结合了深度学习中的循环神经网络(RNN)及其变体长短期记忆网络(LSTM),对大量的情感文本数据进行训练,构建情感分类模型,同时利用
预
训练语言模型如BERT
赵谨言
·
2025-05-03 00:57
论文
经验分享
毕业设计
小米开源Xiaomi-MiMo-7B 详情
为充分挖掘语言模型的推理潜力,既要关注后训练策略,也要优化
预
训练方法。MiM
Panesle
·
2025-05-02 23:49
前沿
人工智能
大模型
文本生成
PyTorch 保存和加载模型参数,从
预
训练模型中加载部分参数,包括
预
训练模型中某些参数不匹配的情况
文章目录0前言1state_dict2保存和加载用于推理的模型参数3保存和加载整个模型4保存和加载用于推理或者继续训练的generalcheckpoing5将多个模型参数保存在一个文件中6使用来自不同模型的参数进行WarmstartingModel★\bigstar★参考资料0前言 这篇博客主要是对使用PyTorch保存和加载训练模型参数的一个学习记录。第1-5小节是比较常规的模型参数保存操作,
亚里随笔
·
2025-05-02 20:58
平台工具类
从预训练模型中加载部分参数
scGPT-spatial:持续
预
训练scGPT用于空间转录组
然而,现有的基础模型大多是在scRNA-seq数据上进行
预
训练的,无法解析样本之间的空间关系,也无法捕捉来自不同测序协议的独特分布特征。
tzc_fly
·
2025-05-02 16:00
单细胞多组学分析
人工智能
GPU虚拟化技术在分布式训练中的落地难题与解决方案
一、实验室场景下的四大核心痛点1.1资源碎片化与利用率失衡高校实验室常面临多用户、多任务类型的混合负载:长时训练任务(如大模型
预
训练)占用GPU数天甚至数周,
学术猿之吻
·
2025-05-02 12:08
高校
GPU
人工智能
分布式
人工智能
transformer
深度学习
机器学习
矩阵
gpu算力
真实的Linux故障诊断场景 07 网络配置问题
防火墙设置:查看防火墙规则:firewall-cmd--list-all场景85:SSH连接问题故障排除步骤:SSH服务状态:
检
山岚的运维笔记
·
2025-05-02 09:49
Linux
运维
linux
网络
运维
电子秤检测管理系统开发实战:从数据采集到可视化大屏
一、电子秤通信协议对接与数据采集电子秤
检
Android洋芋
·
2025-05-02 09:14
运维
电子秤
Django框架
RS232串行通信协议
SPU/SKU模型
数据报表
Docker容器
前端基础入门三大核心之HTML篇 —— HTML页面性能优化:15个秘籍解锁速度与激情【附代码】
前端基础入门三大核心之HTML篇——HTML页面性能优化:15个秘籍解锁速度与激情【附代码】1.减肥计划:精简HTML代码2.缓存利用:合理设置HTTP缓存策略3.静态分离:CDN加速静态资源4.预加载与
预
读取
DTcode7
·
2025-05-02 01:49
HTML网站开发
#
前端优化
前端
html
性能优化
深入实践:从零开始掌握GPT的应用开发
相比传统算法和模型,GPT有以下显著优势:强大的生成能力:基于
预
训练模型,无需大量数据即可生成高质量内容。适应多任务场景:通过设计提示(Prompts),灵活完成多种任务。
一位小说男主
·
2025-05-01 19:46
人工智能入门
深度学习
gpt
人工智能
神经网络
vitejs相关用法及原理
一、核心用法依赖
预
构建与解析裸模块处理:Vite会将import'vue'等裸模块路径重写为浏览器可识别的URL(如/node_modules/.vite/vue.js),并通过esbuild将CommonJS
agenIT
·
2025-05-01 17:00
javascript
ecmascript
typescript
前端框架
InternLM2-Math-Plus全面升级,全尺寸最强的开源数学模型
升级后的InternLM2-Math-Plus在
预
训练和微调数据方面进行了全面的优化,显著提高了其在自然语言推理、代码解题以及形式化数学语言上的性能。
OpenMMLab
·
2025-05-01 09:07
人工智能
大模型
语言模型
llm
十六章:
预
解析和对象
一、
预
解析JavaScript代码是由浏览器总的解析器来执行的,JavaScript解析器在运行JavaScript代码的时候分为两部:
预
解析和代码执行1.1
预
解析js引擎会把js里面所有的var还有function
ᖰ・◡・ᖳ
·
2025-05-01 06:50
javascript
前端
开发语言
学习
ecmascript
基于机器学习的电影票房预测
机器学习相关理论介绍与分析2.1机器学习算法理论2.1.1卷积神经网络2.2电影票房预测技术概览2.3机器学习技术介绍2.3.1基于机器学习的预测模型2.3.2机器学习在电影票房预测中的应用3数据集引入与
预
洲洲不是州州
·
2025-05-01 06:17
机器学习
人工智能
电影票房预测
神经网络
大模型训练从零到精通:详解如何训练大模型的完整指南
但还有一个很直观的情况,随着
预
训练样本的质量不断提升,训练手段的优化。新的模型,往往效果能轻松反超参数量两倍于它的模型。例如,最新出的minicpm,微信内部评测效果也是非常棒的。
AGI大模型老王
·
2025-04-30 21:54
人工智能
学习
大模型
程序员
AI大模型
大模型训练
大模型教程
C++ 内存访问模式优化:从架构到实践
目录内存架构概览:CPU与内存的“速度博弈”层级结构:从寄存器到主存带宽与延迟:性能的隐形杀手C++开发者的视角缓存工作原理:局部性的魔法缓存的核心逻辑命中与未命中缓存的组织方式
预
取技术:未卜先知缓存一致性
大模型大数据攻城狮
·
2025-04-30 21:53
c++
C++面试
嵌入式面经
内联函数
内存架构
内存对齐
C++优化
相机-IMU联合标定:相机-IMU外参标定
标定数据录制相机-IMU外参标定简介在VINS(视觉惯性导航系统)中,相机-IMU外参标定是确保多传感器数据时空统一的核心环节,其作用可概括为以下关键点:坐标系对齐(空间同步),外参误差会导致视觉特征点投影与IMU
预
积分轨迹不匹配
吃水果不削皮
·
2025-04-30 19:40
视觉组合导航
ROS
VIO
【计算机视觉】深度解析MediaPipe:谷歌跨平台多媒体机器学习框架实战指南
深度解析MediaPipe:谷歌跨平台多媒体机器学习框架实战指南技术架构与设计哲学核心设计理念系统架构概览核心功能与
预
构建解决方案1.人脸检测2.手势识别3.姿势估计4.物体检测与跟踪实战部署指南环境配置基础环境准备获取源码构建第一个示例
白熊188
·
2025-04-30 15:41
计算机视觉
计算机视觉
机器学习
人工智能
Postman接口测试工具Windows版本下载
用户还可以利用
预
请求脚本、测试脚本以
西域情歌
·
2025-04-30 15:41
【大模型解惑】大模型如何在 Supervised Fine‑Tuning (SFT) 之后进行 PPO 强化学习微调?
近年来主流的大模型对齐流程已趋于“三段式”:
预
训练→SFT(监督微调)→RLHF(强化学习阶段,常用PPO)。
云博士的AI课堂
·
2025-04-30 08:27
大模型技术开发与实践
哈佛博后带你玩转机器学习
深度学习
大模型
强化学习
SFT
PPO
预训练
监督学习
机器学习
C++ 线程池
工作线程:线程池中
预
真是猜不透你啊
·
2025-04-29 18:48
C++
基础知识
c++
增强版wps-plugin-deepseek开源插件是DeepSeek 支持的 WPS 插件,在您的办公工作流程中提供智能文档自动化和 AI 驱动的生产力增强
虽然官方提供了TypeScript扩展包,但支持程度有限,因此本项目选择使用JavaScript进行开发二、模板特点WPS集成:
预
配置OfficeJSAPI开箱即用:包含插件manifest配置示例API
struggle2025
·
2025-04-29 18:17
wps
自动化
运维
人工智能
开源
deepseek
【C++】线程池
它通过
预
创建一组线程,并将任务提交到队列中,由空闲线程自动执行,从而提升多线程程序的性能和资源利用率。为什么需要线程池?降低开销:线程创建/销毁成本高(涉及系统调用、内存分配)。
CodeWithMe
·
2025-04-29 18:13
C/C++
c++
开发语言
基于
预
训练模型Bart的英文文本摘要summary生成
环境python==3.7transformers==4.9.2rouge-score==0.0.4数据准备将数据放在一个txt中,每行为一条,文章正文跟label的摘要用\t分割构建数据集fromdatasetsimportDatasetclassData:def__init__(self,data_path,tokenizer):self.path=data_pathself.max_inpu
yuhengshi
·
2025-04-29 12:25
NLP
python
开发语言
后端
【机器学习】使用BART技术自动提取文章内容摘要
1.引言1.1认识BART人工智能中的BART是一个
预
训练的序列到序列模型,全称为“BidirectionalandAuto-RegressiveTransformers”,即“兼有双向语言建模和自回归机制的
MUKAMO
·
2025-04-29 12:51
AI
Python应用
机器学习
人工智能
DNN
自然语言处理
Hanko:身份验证和用户管理解决方案,Clerk & Auth0 的开源替代
易于集成:借助
预
构建的组件和
开源项目精选
·
2025-04-29 11:19
web
零门槛部署Flair实体识别服务:从模型封装到智能增强的全链路实践
###1.1Flair框架的独特优势-**上下文感知**:基于双向LSTM捕获长距离依赖-**零样本学习**:支持少样本/零样本实体识别-**多语言支持**:
预
训练模型覆盖53种语言-**领域自适应**
Loving_enjoy
·
2025-04-29 09:07
计算机学科论文创新点
自然语言处理
python19-if和match的美
..elif...else多重条件分支嵌套也能在else语句中嵌套还能在elif语句中嵌套猜拳游戏成绩判断计算器模拟乘车过程匹配语句match语法的基本结构如下:|组合多个匹配值匹配模式绑定变量实践是
检
文人sec
·
2025-04-29 07:21
python自动化
python
adoptopenjdk相当于现在的java JDK版本比较好用的一款JDK
免费
预
构建的OpenJDK二进制文件!Java™是世界上领先的编程语言和平台。
Mr.小怪
·
2025-04-29 05:06
javaweb
巧用DeepSeek提升自我学习能力(上):学习加速器的多样玩法
论文精读秘籍——三阶速读法
预
判提问(5分钟):面对一篇学术论文,在深入阅读前,借助DeepSeek快速把握核心要点并提出疑问。输入指令“请用200字概括《[
t0_54coder
·
2025-04-29 00:35
大数据与人工智能
学习
如何评价 DeepSeek 的 DeepSeek-V3 模型?
从多个方面来看,DeepSeek-V3的表现令人印象深刻,具体评价如下:性能卓越DeepSeek-V3拥有6710亿参数和370亿激活参数,采用MoE(混合专家)架构,并在14.8万亿token上进行了
预
训练
关于NLP那些你不知道的事
·
2025-04-29 00:59
deepseek
大模型LLMs
强化学习
人工智能
自然语言处理
深度学习
大模型微调:技术迭代与实践指南
微调是深度学习中用于改进
预
训练模型性能的重要技术。通过在特定任务的数据集上继续训练,模型的权重被更新以更好地适应该任务。微调的量取决于
预
训练语料库和任务特定语料库之间的相似性。
人工智能培训咨询叶梓
·
2025-04-28 15:07
人工智能前沿
语言模型
人工智能
微调
提示工程
调优
性能优化
大模型培训
Transformers之环境安装
Transformers安装指南使用pip安装源码安装开发模式安装docker安装自定义dockerfile缓存设置离线模式获取离线时使用的模型和分词器参考Transformers提供了数以千计的
预
训练模型
AIVoyager
·
2025-04-28 10:06
transformers
深度学习
transformer
nlp
人工智能
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他