E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2018暑假训练
巨兽的阴影:大型语言模型的挑战与伦理深渊
这些挑战并非技术进步的偶然副作用,而是深植于LLM的运作本质、
训练
数据来源以及其与社会交互的复杂性之中。它们警示我们,在追逐能力
田园Coder
·
2025-07-08 05:57
人工智能科普
人工智能
科普
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting
这两个组件都是在一组基础类别上
训练
的,我们为这些类别准备了大量
训练
数据。
Bosenya12
·
2025-07-08 05:56
论文阅读
扩散模型中的 Transformer:图像生成及其延展应用询问 ChatGPT
我们首先简要介绍扩散模型的基础知识以及它们的
训练
方式,从而建立基本背景。接着,我们讲解曾是扩散模型事实标准的基于UNet的网络架构,这将帮助我们理解引入Transformer架构并推动其发展的动因。
DeepSeek大模型官方教程
·
2025-07-08 05:26
transformer
chatgpt
深度学习
自然语言处理
人工智能
ai
大模型学习
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models
首先,扩散模型在N样本数据集和指导下的
训练
。接着,模型生成一个增强的数据集,并进一步优化以提高保真度。最后,这些合成数据与少量样本
训练
数据集结合,用于基准模型的
训练
和评估。
Bosenya12
·
2025-07-08 05:25
论文阅读
【零基础学AI】第29讲:BERT模型实战 - 情感分析
接口使用情感分析任务的完整实现流程模型微调(Fine-tuning)技巧开始之前环境要求Python3.8+需要安装的包:pipinstalltorchtransformersdatasetspandastqdmGPU推荐(可加速
训练
1989
·
2025-07-08 05:54
0基础学AI
bert
人工智能
深度学习
神经网络
cnn
python
自然语言处理
TensorFlow图神经网络(GNN)入门指南
我们将从图数据的基本概念开始,深入探讨GNN的核心原理,包括图卷积网络(GCN)、图注意力网络(GAT)等流行架构,并通过TensorFlow代码示例展示如何构建和
训练
GNN模型。文章还将涵盖
AI天才研究院
·
2025-07-08 05:23
AI人工智能与大数据
tensorflow
神经网络
人工智能
ai
【机器学习笔记 Ⅲ】4 特征选择
特征选择(FeatureSelection)系统指南特征选择是机器学习中优化模型性能的关键步骤,通过筛选最相关、信息量最大的特征,提高模型精度、降低过拟合风险并加速
训练
。
巴伦是只猫
·
2025-07-08 04:17
机器学习
机器学习
笔记
人工智能
AI LLM架构与原理 - 预
训练
模型深度解析
一、引言在人工智能领域,大型语言模型(LLM)的发展日新月异,预
训练
模型作为LLM的核心技术,为模型的强大性能奠定了基础。
陈乔布斯
·
2025-07-08 04:46
AI
人工智能
大模型
人工智能
架构
机器学习
深度学习
大模型
Python
AI
【AI论文】GLM-4.1V-思考:借助可扩展强化学习实现通用多模态推理
在本报告中,我们分享了在以推理为核心的
训练
框架开发过程中的关键发现。我们首先通过大规模预
训练
开发了一个具备显著潜力的高性能视觉基础模型,可以说该模型为最终性能设定了上限。
东临碣石82
·
2025-07-08 04:43
人工智能
【AI论文】FineWeb2:一个管道,规模适配所有语言——使预
训练
数据处理适应每一种语言
摘要:预
训练
最先进的大型语言模型(LLMs)需要大量干净且多样的文本数据。
东临碣石82
·
2025-07-08 04:43
人工智能
深度学习
机器学习
深入解析 SAE
训练
输出文件:结构与意义
深入解析SAE
训练
输出文件:结构与意义在利用SAELens框架进行稀疏自编码器(SparseAutoencoder,SAE)
训练
时,
训练
完成后会生成一组关键文件,这些文件记录了模型的权重、状态以及相关信息
阿正的梦工坊
·
2025-07-08 02:31
LLM
语言模型
人工智能
自然语言处理
AIGC视觉生成革命:文生图、图生图与视频生成垂直模型发展全景报告(2025)
这一进程的核心驱动力在于架构创新、数据优化与场景深耕的三重突破:扩散模型与Transformer的融合催生了更高保真度的图像生成;十亿级多模态数据
训练
解决了复杂语义理解难题;而面向影视、电商
Liudef06小白
·
2025-07-08 01:50
AIGC
人工智能
AI作画
语言模型
暑假算法日记第三天
目标:刷完灵神专题
训练
算法题单阶段目标:【算法题单】滑动窗口与双指针LeetCode题目:3439.重新安排会议得到最多空余时间I2134.最少交换次数来组合所有的1II1297.子串的最大出现次数2653
·
2025-07-07 23:39
60天python
训练
营打卡day46
学习目标:60天python
训练
营打卡学习内容:DAY46通道注意力(SE注意力)知识点回顾:1.不同CNN层的特征图:不同通道的特征图2.什么是注意力:注意力家族,类似于动物园,都是不同的模块,好不好试了才知道
·
2025-07-07 23:35
Python
训练
营打卡 Day 46
通道注意力一、什么是注意力注意力机制是一种让模型学会「选择性关注重要信息」的特征提取器,就像人类视觉会自动忽略背景,聚焦于图片中的主体(如猫、汽车)。transformer中的叫做自注意力机制,他是一种自己学习自己的机制,他可以自动学习到图片中的主体,并忽略背景。我们现在说的很多模块,比如通道注意力、空间注意力、通道注意力等等,都是基于自注意力机制的。从数学角度看,注意力机制是对输入特征进行加权求
2401_86382089
·
2025-07-07 23:03
Python打卡
python
Python
训练
营打卡 Day53
对抗生成网络知识点回顾:对抗生成网络的思想:关注损失从何而来生成器、判别器nn.sequential容器:适合于按顺序运算的情况,简化前向传播写法leakyReLU介绍:避免relu的神经元失活现象对抗生成网络(GAN)知识点回顾对抗生成网络的思想思想:就像在餐厅中,有一个厨师(生成器)负责制作假菜,一个评论家(判别器)负责区分真菜和假菜。厨师的目标是制作出评论家无法区分的假菜,而评论家的目标是找
yunvwugua__
·
2025-07-07 22:03
python自学打卡
python
开发语言
Python
训练
营打卡 Day 50
预
训练
模型CBAM注意力现在我们思考下,是否可以对于预
训练
模型增加模块来优化其效果,这里我们会遇到一个问题:预
训练
模型的结构和权重是固定的,如果修改其中的模型结构,是否会大幅影响其性能。
2401_86382089
·
2025-07-07 22:28
Python打卡
python
Python
训练
营打卡 Day50
预
训练
模型+CBAM模块知识点回顾:resnet结构解析CBAM放置位置的思考针对预
训练
模型的
训练
策略差异化学习率三阶段微调预
训练
模型+CBAM模块知识点回顾ResNet结构解析残差块:ResNet的核心是残差块
·
2025-07-07 22:58
自然语言处理-基于预
训练
模型的方法-笔记
自然语言处理-基于预
训练
模型的方法-笔记【下载地址】自然语言处理-基于预
训练
模型的方法-笔记《自然语言处理-基于预
训练
模型的方法》由哈尔滨工业大学出版,深入探讨了NLP领域的前沿技术与预
训练
模型的应用。
·
2025-07-07 18:05
深度模型
训练
,加速数据读取遇到显卡跑不满的问题
后来直接用钞能力,加了内存条,将数据缓存后一次性读到内存中终于可以跑满了,然后后面就一直没管这个了,唯一的缺点就是每次开始
训练
不是吧这都有重名
·
2025-07-07 18:30
遇到的问题
llama
人工智能
LLM
python
模型微调方法Prefix-Tuning
随着大规模预
训练
语言模型(如GPT系列、BERT等)的广泛应用,如何高效、经济地针对特定任务对这些模型进行微调(Fine-Tuning)成为研究热点。
ballball~~
·
2025-07-07 18:30
大模型
人工智能
算法
大数据
yolov5
训练
失败总结
yolov5
训练
失败总结版本原因:在进行
训练
时,出现如下报错:UserWarning:Detectedcalloflr_scheduler.step()beforeoptimizer.step().InPyTorch1.1.0andlater
BTU_YC
·
2025-07-07 16:52
深度学习
python
pytorch
样本量计算:配对样本定量资料——平均值法
一、案例为明确某种新的
训练
计划是否能显著提高运动员的100米短跑成绩,欲招募一批志愿者,分别记录运动员在进行新
训练
计划前后的100米短跑成绩(秒)。
·
2025-07-07 13:34
Logistic回归预测模型2:R语言实现模型的内部和外部验证
前面我们讲了logistic回归预测模型的建立,今天介绍的是模型的验证,可以在
训练
集和验证集中通过ROC曲线、校准曲线和决策曲线分别进行验证。
·
2025-07-07 13:34
【机器学习笔记Ⅰ】13 正则化代价函数
过拟合问题:当模型过于复杂(如高阶多项式回归、深度神经网络)时,可能完美拟合
训练
数据但泛化性能差。解决方案:在代价函数中增加对参数的惩罚,抑制不重要的特征权重。2.
·
2025-07-07 12:23
机器学习笔记——支持向量机
支持向量机参数模型对分布需要假设(这也是与非参数模型的区别之一)间隔最大化,形式转化为凸二次规划问题最大化间隔间隔最大化是意思:对
训练
集有着充分大的确信度来分类
训练
数据,最难以分的点也有足够大的信度将其分开间隔最大化的分离超平面的的求解怎么求呢
star_and_sun
·
2025-07-07 12:23
机器学习
笔记
支持向量机
网络安全相关专业总结(非常详细)零基础入门到精通,收藏这一篇就够了
该专业培养具备计算机科学与技术学科理论基础,掌握网络技术领域专业知识和基本技能,在计算机、网络及人工智能领域的工程实践和应用方面受到良好
训练
,具有深厚通信背景、可持续发展、能力较强的高水平工程技术人才。
网络安全工程师教学
·
2025-07-07 12:21
兼职副业
黑客技术
网络安全
web安全
安全
人工智能
网络
运维
大语言模型应用指南:ReAct 框架
尤其是大语言模型(LargeLanguageModels,LLMs),如BERT、GPT系列等,通过在大规模无标签数据上进行预
训练
,获得了强大的语言理解和生成能力。然而,预
AI大模型应用实战
·
2025-07-07 11:44
java
python
javascript
kotlin
golang
架构
人工智能
PyTorch 的 torch.nn 模块学习
torch.nn是PyTorch中专门用于构建和
训练
神经网络的模块。
·
2025-07-07 11:10
【网络安全基础】第七章---无线网络安全
仅供参考文章目录一、无线安全二、移动设备安全三、IEEE802.11四、IEEE802.11i五、习题
训练
一、无线安全严重威胁无线网络安全的关键因素:信道、移动性、资源、可访问性无线网络环境由三部分组成
薄荷椰果抹茶
·
2025-07-07 10:36
信息安全与网络安全
web安全
网络
安全
大模型
训练
与微调(1)——优化器选择总结
大模型
训练
与微调(1)——优化器选择总结一、AdamW优化器:成熟稳定的主流选择二、Lion优化器:谷歌提出的高效替代方案三、其他优化器的补充应用四、优化器选择趋势与实验对比五、未来发展方向当前最新的大模型在优化器的选择上
John_今天务必休息一天
·
2025-07-07 10:32
人工智能
机器学习
深度学习
10.2 ChatGPT自动生成
训练
数据实战:37.2%准确率提升秘籍
ChatGPT自动生成
训练
数据实战:37.2%准确率提升秘籍使用ChatGPT自动设计生成
训练
数据的Prompt在大模型微调场景中,高质量
训练
数据的获取往往是制约模型效果的核心瓶颈。
少林码僧
·
2025-07-07 09:30
掌握先机!从
0
起步实战
AI
大模型微调
打造核心竞争力
chatgpt
人工智能
机器学习
语言模型
SFT(监督微调)详解:零基础入门到精通,一篇详细的入门教程!
文章目录具体步骤如下:应用场景优点举例步骤1:预
训练
模型的选择步骤2:数据收集与标注步骤3:数据预处理步骤4:数据集划分步骤5:加载预
训练
模型步骤6:数据编码步骤7:创建数据加载器步骤8:定义
训练
过程步骤
AGI大模型老王
·
2025-07-07 08:23
人工智能
程序员
大模型
学习
AI大模型
大模型微调
SFT
四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
这些大型预
训练
模型,如GPT-3、BERT和T5,拥有卓越的自然语言处理能力,但要使它们在特定任务上表现出色,就需要进行微调,以使其适应特定的数据和任务需求。
·
2025-07-07 08:22
Longformer: The Long-Document Transformer(2020-4-10)
模型介绍目前基于Transformer的预
训练
模型在各项NLP任务纷纷取得更好的效果,这些成功的部分原因在于Self-Attention机制,它运行模型能够快速便捷地从整个文本序列中捕获重要信息。
不负韶华ღ
·
2025-07-07 08:21
深度学习(NLP)
transformer
深度学习
人工智能
Python 数据分析与可视化 Day 14 - 建模复盘 + 多模型评估对比(逻辑回归 vs 决策树)
✅今日目标回顾整个本周数据分析&建模流程学会
训练
第二种模型:决策树(DecisionTree)掌握多模型对比评估的方法与实践输出综合对比报告:准确率、精确率、召回率、F1等指标为后续模型调优与扩展打下基础一
蓝婷儿
·
2025-07-07 08:21
python
python
数据分析
逻辑回归
60天python
训练
计划----day59
在之前的学习中,我们层层递进的介绍了时序模型的发展,从AR到MA到ARMA,再到ARIMA。本质就是把数据处理的操作和模型结合在一起了,实际上昨天提到的季节性差分也可以合并到模型中,让流程变得更加统一。季节性差分用S来表示,所以这个模型叫做SARIMA模型一、SARIMA模型SARIMA(SeasonalAutoRegressiveIntegratedMovingAverage)是标准ARIMA模
·
2025-07-07 07:46
机器学习18-强化学习RLHF
在
训练
过程中,人类会对智能体的行为或输
坐吃山猪
·
2025-07-07 05:01
机器学习
机器学习
人工智能
线性回归 python代码
下面是一个线性回归模型的Python代码示例:importnumpyasnpfromsklearn.linear_modelimportLinearRegression#
训练
数据x=np.array([
黄涵奕
·
2025-07-07 03:21
python
线性回归
numpy
机器学习
开发语言
python实现多元线性回归算法 (附完整源码)
这个实现利用了numpy进行矩阵运算,并展示了如何
训练
模型、进行预测以及评估模型性能。为了更全面,代码中还包含了一个使用梯度下降法(GradientDescent)优化参数的实现。多元
源代码大师
·
2025-07-07 03:20
python算法完整教程
算法
python
线性回归
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程,包括数据准备、模型构建、
训练
和部署,不依赖任何深度学习框架,仅使用NumPy进行数值计算。
·
2025-07-07 03:20
RNN案例人名分类器(完整步骤)
自然语言处理)中的一个小案例,本案例讲解了RNN、LSTM、GRU模型是如何使用并进行预测的,一、案例架构人名分类器的实现可分为以下五个步骤:第一步:导入必备的工具包第二步:对data文件中的数据进行处理,满足
训练
要求第三步
AI扶我青云志
·
2025-07-07 01:11
rnn
人工智能
深度学习
nlp
lstm
gru
Teacher Forcing--------一种用于序列生成任务的
训练
技巧
好的,我们来详细介绍一下TeacherForcing,这是一种在
训练
序列生成模型(如循环神经网络RNN、长短期记忆网络LSTM、门控循环单元GRU、以及后来的Transformer)时常用的重要技术。
AI扶我青云志
·
2025-07-07 01:11
自然语言处理
人工智能
Chat Model API
它利用预
训练
的语言模型,如GPT(生成预
训练
转换器),以自然语言对用户输入生成类似人类的响应。
虾条_花吹雪
·
2025-07-07 00:36
Spring
AI
java
Python 库 包 sentence-transformers
它基于Transformer架构(如BERT、RoBERTa、DistilBERT等)的预
训练
模型,并在大量语义相似性数据上进行了微调,能够捕捉句子之间的深层语义关系。
音程
·
2025-07-07 00:35
机器学习
人工智能
python
开发语言
代码随想录算法
训练
营第十一天
LeetCode.150逆波兰表达式求值题目链接逆波兰表达式求值题解classSolution{publicintevalRPN(String[]tokens){Stackcstack=newStackset=newHashSetdeque=newLinkedListdeque.getLast()){deque.removeLast();}deque.add(val);}intpeek(){ret
天天开心(∩_∩)
·
2025-07-06 22:50
算法
【图像超分】论文复现:密集残差链接Transformer!DRCT的Pytorch源码复现,跑通超分源码,获得指标、模型复杂度、结果可视化,核心模块拆解与源码对应,注释详细!
【超分辨率(Super-Resolution)】关于【超分辨率重建】专栏的相关说明,包含专栏简介、专栏亮点、适配人群、相关说明、阅读顺序、超分理解、实现流程、研究方向、论文代码数据集汇总等)完整代码和
训练
好的模型权重文件下载链接见本文底部
十小大
·
2025-07-06 22:18
超分辨率重建(理论+实战
科研+应用)
pytorch
深度学习
超分辨率重建
图像处理
计算机视觉
python
transformer
【技术派专享】并行智算云:RTX 5090 免费算力深度评测 + 实战指南▎ 为什么开发者需要关注云端算力?
在微调Llama3、
训练
扩散模型或跑Kaggle比赛时,本地显卡(比如RTX3090/4090)常面临显存不足、
训练
慢、散热差等问题。
山顶望月川
·
2025-07-06 20:01
人工智能
云计算
深度学习实验:GPU加速,突破性能瓶颈
深度学习实验:GPU加速,突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大,传统的CPU已经无法满足
训练
和推理的计算需求。
AI天才研究院
·
2025-07-06 20:57
Agentic
AI
实战
计算
AI人工智能与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
大模型在蛛网膜下腔出血预测与诊疗方案制定中的应用研究
大模型技术原理与应用现状3.1大模型基本原理3.2在医疗领域的应用案例3.3应用于蛛网膜下腔出血预测的可行性分析四、大模型预测蛛网膜下腔出血的具体方案4.1术前风险预测4.1.1数据收集与预处理4.1.2模型构建与
训练
·
2025-07-06 20:25
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他