E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
GMM训练
【动手学深度学习】4.10 实战Kaggle比赛:预测房价
目录4.10实战Kaggle比赛:预测房价1)数据预处理2)模型定义与
训练
3)模型评估与预测4)模型
训练
与预测提交5)示例超参数(可调)4.10实战Kaggle比赛:预测房价数据来源:Kaggle房价预测比赛
XiaoJ1234567
·
2025-07-10 18:07
《动手学深度学习》
深度学习
人工智能
大型语言模型中的提示工程系统综述:技术与应用
与更新模型参数不同,prompt仅通过给定指令即可引出所需的模型行为,从而实现预
训练
模型在下游任务中的无缝集成。
AI专题精讲
·
2025-07-10 17:33
Paper阅读
语言模型
人工智能
自然语言处理
神经网络初步学习3——数据与损失
区别这里不妨以图像识别为例子:(1)在传统的机器学习视角中:我们需要人工手动去设置并提取我们的特征量,例如常见的SIFT、SURF和HOG等,随后需要我们选择合适的分类器(例如:SVM、KNN等分类器),接着把我们的参数
训练
出来
X Y O
·
2025-07-10 12:33
神经网络
学习
人工智能
【目标检测】Yolov7 的 ELAN 和 E-ELAN 模块演进(涉及到分组卷积,cardinality,梯度路径)
YOLOv7的工作:新的bagoffreebies(有效的
训练
技巧,不会增加推理的计算量)有规划的重参数化模型(不同边缘设备架构,不同的重参数化方法)新的动态标签分配方法为了更好的理解YOLOv
Jiangnan_Cai
·
2025-07-10 11:55
深度学习
目标检测
YOLO
人工智能
ResNet:深度卷积神经网络的里程碑
然而,随着网络层数的增加,传统CNN面临着梯度消失、梯度爆炸以及退化等棘手问题,
训练
变得愈发困难。
心想事“程”
·
2025-07-10 10:18
小知识点
cnn
人工智能
神经网络
卷积神经网络架构的演进:从AlexNet到EfficientNet
回溯到2012年,AlexNet在ImageNet上的Top-1准确率仅为63.3%,而如今,借助EfficientNet架构和师生
训练
法,我们已经能达到超过90%的准确率。
t0_54manong
·
2025-07-10 10:47
大数据与人工智能
cnn
架构
人工智能
个人开发
【AI大模型】PyTorch Lightning 简化工具
PyTorchLightning是一个轻量级的PyTorch封装库,它通过抽象
训练
循环的工程细节,让研究人员可以专注于模型设计和实验。以下是PyTorchLightning的核心概念和实战指南。
我爱一条柴ya
·
2025-07-10 09:44
学习AI记录
人工智能
pytorch
python
ai
AI编程
【AI大模型】深入解析预
训练
:大模型时代的核心引擎
预
训练
已成为现代人工智能,尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式,催生了BERT、GPT等革命性模型。本文将系统阐述预
训练
的核心概念、原理、方法、应用及挑战。
我爱一条柴ya
·
2025-07-10 09:43
学习AI记录
深度学习
人工智能
ai
python
AI编程
算法
MiniMind:3小时
训练
26MB微型语言模型,开源项目助力AI初学者快速入门
这个项目让初学者能够在3小时内从零开始
训练
出一个仅26.88MB大小的微型语言模型,体积仅为GPT-3的七千分之一,却完整覆盖了从数据处理到模型
nine是个工程师
·
2025-07-10 08:33
关注
人工智能
语言模型
开源
数字化时代练歌神器:卡拉OK点唱机应用全解析
高级版本还提供专业音效处理功能,使得卡拉OK点唱机成为业余爱好者和专业歌手的理想
训练
工具。1.网络点播功能的实现与应用网络点播功能改变了我们获取媒体内容的方式,赋予了用户前所未有的主动性
·
2025-07-10 06:27
2025B卷 - 华为OD机试七日集训第5期 - 按算法分类,由易到难,循序渐进,玩转OD
目录推荐刷题方法:一、适合人群二、本期
训练
时间三、如何参加四、七日集训第5期五、精心挑选21道高频100分经典题目,作为入门。
哪 吒
·
2025-07-10 04:38
搬砖工逆袭Java架构师
华为od
算法
华为OD机试
2025B卷
java
2025B卷 - 华为OD机试七日集训第4期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)
目录推荐刷题方法:一、适合人群二、本期
训练
时间三、如何参加四、七日集训第4期五、精心挑选21道高频100分经典题目,作为入门。
哪 吒
·
2025-07-10 04:08
搬砖工逆袭Java架构师
华为od
算法
python
华为OD机试
2025B卷
人工智能 开源的大模型
训练
微调框架LLaMA-Factory
LLaMA-Factory是一个开源的大模型
训练
微调框架,具有模块化设计和多种高效的
训练
方法,能够满足不同用户的需求。用户可以通过命令行或Web界面进行操作,实现个性化的语言模型微调。
·
2025-07-10 04:37
2025B卷 - 华为OD机试七日集训第2期 - 按算法分类,由易到难,循序渐进,玩转OD(Python/JS/C/C++)
目录推荐刷题方法:一、适合人群二、本期
训练
时间三、如何参加四、七日集训第2期五、精心挑选21道高频100分经典题目,作为入门。
·
2025-07-10 04:36
基于大模型的急性出血坏死性胰腺炎预测技术方案
目录一、算法实现伪代码1.数据预处理与特征工程2.大模型
训练
(以Transformer为例)3.实时预测与动态调整二、模块流程图1.术前预测流程2.术中动态决策流程3.术后护理流程三、系统集成方案1.系统架构图
LCG元
·
2025-07-10 02:22
人工智能
python
NCCL 核心集体通信操作深度解析:从原理到优化实践
目录引言:NCCL——分布式
训练
的通信引擎一、NCCL基础:GPU通信的“加速器”1.1NCCL与MPI的协同1.2集体通信的价值二、NCCL核心操作深度解析2.1AllGather:全局数据聚合2.1.1
清风 001
·
2025-07-10 00:13
AI大模型底层建设
gpu算力
ai
【零基础学AI】第30讲:生成对抗网络(GAN)实战 - 手写数字生成
本节课你将学到GAN的基本原理和工作机制使用PyTorch构建生成器和判别器DCGAN架构实现技巧
训练
GAN模型的实用技巧开始之前环境要求Python3.8+需要安装的包:pipinstalltorchtorchvisionmatplotlibnumpyGPU
1989
·
2025-07-10 00:41
0基础学AI
人工智能
生成对抗网络
神经网络
python
机器学习
近邻算法
深度学习
【深度学习第六期深度学习中的归一化与正则化技术:原理、实践与应用】
详细阐述它们的基本原理,包括如何调整数据分布、控制模型复杂度等;通过丰富的实例和对应代码,展示在不同网络架构中这些技术的具体实现方式,以及对模型
训练
和性能的影响;同时,对比分析各项技术的特点和
码上有前
·
2025-07-09 23:08
Python
深度学习
Pytorch
深度学习
人工智能
cnn
深度神经网络课程设计:从理论到实践
学生将通过源代码示例学习从网络架构设计、数据预处理到模型
训练
与评估的完整流程,并掌握深度学习的基本概念、组件及技巧。
Vita Libre
·
2025-07-09 22:04
算法
训练
营DAY29 第八章 贪心算法 part02
134.加油站134.加油站-力扣(LeetCode)思路如果总消耗大于总油量,那肯定无法完成绕圈令rest=gas-cost;循环中累加这个rest记为curSUM;如果curSum出现负数,让start记为i+1;curSum归零,重新计数;遍历完后如果能完成绕圈,start记录的就是答案起始位置。classSolution{public:intcurSum=0;inttotalSum=0;i
·
2025-07-09 21:27
算法
训练
营DAY5 第二章 链表part02 补
首先补充链表part01的双链表、递归法反转链表双链表单链表中的指针域只能指向节点的下一个节点。双链表:每一个节点有两个指针域,一个指向下一个节点,一个指向上一个节点。双链表既可以向前查询也可以向后查询。关键点:注意哨兵指针的初始化,前后都指向自己;在查询函数中,使用中点下标简化查询中的cur指针移动次数,从哨兵指针开始向后移动cur指针时,需要注意for循环中“inext=sentinelNod
·
2025-07-09 21:26
算法
训练
营DAY24 第七章 回溯算法part03
93.复原IP地址93.复原IP地址-力扣(LeetCode)给定一个只包含数字的字符串,复原它并返回所有可能的IP地址格式。有效的IP地址正好由四个整数(每个整数位于0到255之间组成,且不能含有前导0),整数之间用'.'分隔。例如:"0.1.2.201"和"192.168.1.1"是有效的IP地址,但是"0.011.255.245"、"192.168.1.312"和"
[email protected]
"是
·
2025-07-09 21:26
算法
训练
营DAY7 第三章 哈希表part02
第454题.四数相加II454.四数相加II-力扣(LeetCode)解题思路:使用unordered_map,用两个for循环遍历A与B数组所有的可能的a+b组合,以及每种组合出现的次数;接下来在两个for循环中遍历所有的target=0-(c+d),在map中查询每个target是否出现,若出现则count+=map[target](map的键值,相当于该种target的出现次数);最终输出c
_Coin_-
·
2025-07-09 21:56
算法
哈希算法
代码
训练
营DAY13 第六章 二叉树part01
理论基础二叉树种类存储方式遍历方式深度优先搜索&广度优先搜索深度:前序遍历、中序遍历、后序遍历(中间在前or中or后,左右顺序固定)广度:二叉树定义递归遍历(必须掌握)递归分析三步法1、确定递归函数的参数和返回值2、确定终止条件3、确定单层递归逻辑前序遍历144.二叉树的前序遍历-力扣(LeetCode)/***Definitionforabinarytreenode.*structTreeNod
_Coin_-
·
2025-07-09 21:56
数据结构
算法
AI产品经理技术篇:从传统AI到生成式AI,解密大模型的核心概念
这种转变背后,是参数规模、模型架构和
训练
方式的根本性革新。作为AI产品经理,理解大模型的核心概念至关重要。从“参数”的意义到“Token”的向量化,从Transfor
让我看看好学吗
·
2025-07-09 21:24
人工智能
产品经理
学习
深度学习
自然语言处理
huggingface 笔记: Trainer
Trainer是一个为Transformers中PyTorch模型设计的完整
训练
与评估循环只需将模型、预处理器、数据集和
训练
参数传入Trainer,其余交给它处理,即可快速开始
训练
自动处理以下
训练
流程:
UQI-LIUWJ
·
2025-07-09 21:23
笔记
人工智能
论文略读: ALPAGASUS: TRAINING A BETTER ALPACA WITH FEWER DATA
背景大模型通常需要在有监督指令数据集上进行指令微调来加强指令遵循能力但是广泛使用的数据集包含许多具有不正确或不相关响应的低质量样本,这对大模型微调具有误导性——>论文提出了一种简单有效的数据选择策略,使用ChatGPT自动识别和过滤掉低质量数据同时引入了:ALPAGASUS,它是仅对从52k
训练
数据中过滤出来的
·
2025-07-09 21:23
深度学习之迁移学习
一、迁移学习的核心动机传统机器学习通常要求为每个新任务收集大量标注数据并从头
训练
模型,但现实中面临以下挑战:数据稀缺:例如医疗影像分析(罕见疾病样本少)
路溪非溪
·
2025-07-09 21:22
人工智能
迁移学习
机器学习
中文大模型的技术债问题
本文系统性地分析了中文大模型在数据采集、预
训练
、微调、评估与部署等生命周期各阶段产生的技术债类型,包括代码复杂性、数据隐患、
训练
流程依赖、工具链碎片化、模型解释性差、隐性资源耦合等问题,
大鹏的NLP博客
·
2025-07-09 20:50
大模型
transformer
大模型
LLM(大语言模型)能识别图像的核心原因:图像和文本记性特征识别且对其
LLM(大语言模型)能识别图像的核心原因:图像和文本记性特征识别且对其在于跨模态对齐技术——通过
训练
将图像和文本映射到同一语义空间,使语言模型能够理解视觉信息。一、为什么LLM能识别图像?
ZhangJiQun&MXP
·
2025-07-09 20:17
教学
2024大模型以及算力
2021
AI
python
语言模型
人工智能
自然语言处理
算法
均值算法
prompt
人工智能-基础篇-18-什么是RAG(检索增强生成:知识库+向量化技术+大语言模型LLM整合的技术框架)
1、核心概念大语言模型(LLM)的两大局限性:时效性不足:LLM的
训练
数据截止于某一时间点,无法获取最新信息(如2025年后的新事件)。知识幻觉:当问题超出模型
训练
数据范围时,LLM
weisian151
·
2025-07-09 20:47
人工智能
人工智能
语言模型
自然语言处理
PyTorch+CNN进行猫狗识别项目
XXX.jpg(每个文件夹含若干张图像)├──val│└──cat│└──XXX.jpg(每个文件夹含若干张图像)│└──dog└─────└──XXX.jpg(每个文件夹含若干张图像)需要对train数据集进行
训练
·
2025-07-09 20:46
粒子群算法的原理与实现示例
该算法通过模拟群体中个体(粒子)的运动和信息交互,在解空间中搜索最优解,具有实现简单、收敛速度快、参数少等特点,被广泛应用于函数优化、神经网络
训练
、工程设计等领域。一、算法
禺垣
·
2025-07-09 13:36
人工智能
算法
粒子群算法
群体智能优化算法
Python爬虫实战:爬取网易云音乐热评的完整教程
爬取热评可以用于:歌曲口碑分析用户情绪挖掘热门歌曲趋势追踪机器学习
训练
数据准备但网易云音乐对评论接口进行了加密,直接请求很难成功。本文将帮你攻克这一难点。
Python爬虫项目
·
2025-07-09 12:25
python
爬虫
开发语言
能源
selenium
【零基础学AI】第33讲:强化学习基础 - 游戏AI智能体
本节课你将学到理解强化学习的基本概念和框架掌握Q-learning算法原理使用Python实现贪吃蛇游戏AI
训练
能够自主玩游戏的智能体开始之前环境要求Python3.8+PyTorch2.0+Gymnasium
1989
·
2025-07-09 11:16
0基础学AI
人工智能
游戏
transformer
分类
深度学习
神经网络
python基础
训练
day27
python基础
训练
day27小白打卡第27天!题目来源这里python基础
训练
day27第一题(循环)第二题(进制转换)第三题(又是循环)第四题(字符串连接)第一题(循环)#809*??
·
2025-07-09 11:14
一文读懂 AI 模型
训练
流程
一文读懂AI模型
训练
流程在当今数字化时代,AI技术发展得如火如荼,广泛应用于各个领域,而这背后离不开AI模型的
训练
。AI模型
训练
流程就像是一场精心策划的“智慧锻造之旅”,每一步都至关重要。
AI赋能
·
2025-07-09 10:42
人工智能
人工智能
什么是智能体(Agent)?
大语言模型是一种采用大量数据进行
训练
的人工智能模型,主要用于理解和生成自然语
用什么都重名
·
2025-07-09 10:40
大模型相关
人工智能
Agent
大模型
【AI论文】Skywork-Reward-V2:通过人机协同实现偏好数据整理的规模化扩展
即便采用先进
训练
技术的方法也未能显著提升性能。我们推测,这种脆弱性主要源于偏好数据集的局限性——这些数据集往往范围狭窄、标
·
2025-07-09 09:37
03 数据可视化的世界非常广阔,除了已提到的类型,还有许多更细分或前沿的可视化形式。
学习曲线(LearningCurve)用途:分析模型
训练
过程
晨曦543210
·
2025-07-09 07:17
信息可视化
人工智能
大白话解释深度学习中多尺度特征融合及其意义
假设你想
训练
一个计算机程序来识别和分割这些不同的物体(汽车、巴士、行人)。
来自宇宙的曹先生
·
2025-07-09 05:05
深度学习
人工智能
Tesla的FSD 架构设计
特斯拉的FSD(完全自动驾驶)架构设计以端到端神经网络为核心,结合专用硬件加速、海量数据
训练
和持续OTA迭代,形成了一套高度集成的系统。
WSSWWWSSW
·
2025-07-09 04:30
智能驾驶
汽车
人工智能
FSD
AI初学者如何对大模型进行微调?——零基础保姆级实战指南
仅需8GB显存,三步完成个人专属大模型
训练
四步实战:从环境配置到模型发布步骤1:云端环境搭建(10分钟)推荐使用阿里魔塔ModelScope免费GPU资源:#注册后执行环境初始化pip3install-
·
2025-07-09 02:15
「论文导读」LLM高效推理与模型量化
论文探讨如何通过优化
训练
数据、模型架构和推理技术,在有限硬体资源(如单一GPU或CPU)上实现高效推理。学术背景:随着大型语言模型(LLM)如GPT-3的
雷羿 LexChien
·
2025-07-09 00:01
prompt
人工智能
LLM
论文阅读
代码随想录算法
训练
营第十三天
递归遍历二叉树的前,中,后序遍历题目链接前序遍历中序遍历后序遍历前序遍历题解classSolution{publicListpreorderTraversal(TreeNoderoot){Listlist=newArrayListlist,TreeNoderoot){if(root==null){return;}list.add(root.val);preorder(list,root.left)
天天开心(∩_∩)
·
2025-07-08 23:57
算法
2025 年机器学习工作流程的 7 个 AI 代理框架
介绍机器学习从业者花费大量时间在重复性任务上:监控模型性能、重新
训练
流程、检查数据质量以及跟踪实验。
盖瑞理
·
2025-07-08 23:57
AI
Agent
人工智能
大模型开源与国产化突围:技术路径与产业机遇深度解析
本文将从技术架构、
训练
范式、生态建设三个维度,深入剖析大模型开源与国产化的突围路径。一、全球开源格局与中国大模型现状1.1国际开源生态的演进特征技术民主化加速:LLaMA-2(700亿参数)、BLOO
梦玄海
·
2025-07-08 21:13
开源
架构
golang
开发语言
后端
大数据
【AI大模型】神经网络反向传播:核心原理与完整实现
一、反向传播的本质与意义反向传播(Backpropagation)是神经网络
训练
的核心算法,通过链式法则高效计算损失函数对网络参数的梯度,实现神经网络的优化学习。
我爱一条柴ya
·
2025-07-08 18:00
学习AI记录
人工智能
神经网络
深度学习
ai
AI编程
后端路线指导(3):后端进阶版学习路线
进阶版路线其实才是真正扎实“基本功”的阶段,这一阶段主要需要学习微服务的开发模式、并发编程、设计模式等编程技巧,学习Spring和Redis的底层设计思想和源码,以及针对面试问的最多的部分进行的专项提升
训练
绝命Coding
·
2025-07-08 18:58
后端技术分享
学习
经验分享
后端
职场和发展
面试
【实战】如何
训练
一个客服语音对话场景VAD模型
1.引言:客服场景下的VAD模型在客服中心,每天都会产生海量的通话录音。对这些录音进行有效分析,可以用于服务质量监控、客户意图洞察、流程优化等。VAD在其中扮演着“预处理器”和“过滤器”的关键角色:提升ASR效率与准确性:只将检测到的语音片段送入ASR引擎,可以避免ASR对静音和噪声进行无效识别,减少计算资源浪费,并降低识别错误率。精确统计通话指标:如通话时长、静音时长、抢话率、响应时长等,这些都
kakaZhui
·
2025-07-08 17:51
前沿多模态大模型:论文与实战
人工智能
LLM
AIGC
实时音视频
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他