E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
bp神经网络训练
通俗易懂之广义加性模型GAM时序预测(pyGAM)
本文将详细介绍如何在Python中实现广义加性模型进行时间序列预测,包括所需的库、数据预处理、模型构建、
训练
以及评估。如果这篇文章对你有一点点的帮助,欢迎点赞、关注、收藏、转发、评论哦!
智识小站
·
2025-01-19 20:23
可解释机器学习
python
工业大模型市场图谱:53个工业大模型全面梳理
根据沙丘智库发布的《2024年中国工业大模型应用跟踪报告》,工业大模型是指在通用基础大模型(例如文心一言、通义千问等)的基础上,结合行业&场景数据进行预
训练
和微调,并进行模型压缩(裁剪、蒸馏等)所形成的大模型
大模型常客
·
2025-01-19 19:21
人工智能
agi
ai
大模型
ai大模型
大模型应用
大模型就业
透过生活小故事,轻松理解大模型开发的五种核心方法
本文将以贴近生活的五个场景,通俗易懂地讲解大模型开发中的五种核心方法:提示词工程和外部函数、Agent设计、RAG设计(检索增强生成)、微调以及预
训练
。让我们一同走进这些故事,揭开大模型
·
2025-01-19 19:54
java
【大模型】从零样本到少样本学习:一文读懂 Zero-shot、One-shot 和 Few-shot 的核心原理与应用!
尤其是在大规模预
训练
模型(如GPT系列)的推动下,这些技术得到了广泛应用和关注。本篇文章将带你全面了解这三种学习方法的核心概念、原理和实际应用场景。1.什么是
橙子小哥的代码世界
·
2025-01-19 17:06
NLP自然语言理解
大模型
自然语言处理
sklearn
深度学习
神经网络
tensorflow
构建功能-vite、rollup
一、vite基础1.简介vite是一个构建工具,相较于we
bp
ack,vite采用了不同的运行方式:开发阶段:在开发阶段,Vite的工作流程如下:依赖预构建:Vite会先将项目中的第三方依赖(如node_modules
小天呐
·
2025-01-19 17:59
前端
工程化
vite
什么是AI显卡,英伟达与AMD显卡的全面对比
在人工智能领域,尤其是深度学习中,
训练
和推理任务需要处理大量的矩阵运算,这正是GPU擅长的领域。AI显卡通过高度并行的架构,可以显著提升
训练
速度和模型性能,同时降低功耗和延迟。
wit_@
·
2025-01-19 16:53
人工智能
python
算法
deep
learning
大数据
网络
深入了解卷积
神经网络
(CNN):图像处理与深度学习的革命性技术
深入了解卷积
神经网络
(CNN):图像处理与深度学习的革命性技术导语卷积
神经网络
(CNN)是现代深度学习领域中最重要的模型之一,特别在计算机视觉(CV)领域具有革命性的影响。
wit_@
·
2025-01-19 16:50
cnn
python
机器学习
深度学习
scikit-learn
从零开始的 AI Infra 学习之路
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI
训练
框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM
SSS不知-道
·
2025-01-19 15:15
MLSys
人工智能
深度学习
pytorch
【YOLOV8】YOLOV8模型
训练
train及参数详解
介绍
训练
深度学习模型涉及为其提供数据并调整其参数,以便它能够做出准确的预测。UltralyticsYOLOv8的
训练
模式专为有效、高效地
训练
目标检测模型而设计,充分利用现代硬件的能力。
小小小小祥
·
2025-01-19 15:10
YOLO
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小
对于目标检测任务官方提供了n/s/m/l/x五个模型,我们在使用YOLOV8模型进行自己任务
训练
时,应该如何选择YOLOV8的模型以及输入尺寸大小呢?
小小小小祥
·
2025-01-19 15:40
YOLO
目标检测
人工智能
ChatGPT4.0最新功能和使用技巧,助力日常生活、学习与工作!
自动生成代码等方面的强大功能,系统学习人工智能(包括传统机器学习、深度学习等)的基础理论知识,以及具体的代码实现方法,同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧,以及人工智能领域经典机器学习算法(
BP
WangYan2022
·
2025-01-19 14:34
教程
人工智能
chatgpt
数据分析
ai绘画
AI写作
深入解读ChatGPT的工作原理及底层逻辑
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读,主要包括其基本原理、核心技术、
训练
过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。
NAR_鱼丸
·
2025-01-19 13:59
ChatGPT
程序人生
厉害了,LSTM+Transformer王炸创新,精准度又高了!
这种创新的结合不仅提升了模型的预测精度,还优化了性能和
训练
效率,使其在序列分析任务中展现出卓越的能力。例如,最
马拉AI
·
2025-01-19 12:48
LSTM
transformer
详解深度学习中的Dropout
Dropout是一种在
神经网络
训练
中常用的正则化技术,其操作是在每次
训练
迭代中随机“丢弃”一部分神经元(即将其输出置为零)。
nk妹妹
·
2025-01-19 11:43
深度学习
深度学习
人工智能
深度强化学习(DRL)原理与代码实战案例讲解
符号主义AI试图通过逻辑和符号系统来模拟人类的思维过程,而连接主义AI则侧重于构建类似于人脑
神经网络
的结构,通过大量数据进行
训练
,从而实现智能。
AI大模型应用之禅
·
2025-01-19 09:27
AI大模型与大数据
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
神经网络
常见操作(卷积)输入输出
卷积dim=d的tensor可以进行torch.nn.Convnd(in_channels,out_channels),其中n=d-1,d-2对于torch.nn.Convnd(in_channels,out_channels),改变的是tensor的倒数n+1维的大小全连接使用torch.nn.Linear(in_features,out_features,bias)实现Y=XWT+b,其中X的
被放养的研究生
·
2025-01-19 09:54
计算机视觉
神经网络
深度学习
机器学习
数据增强方法及其工具
数据增强(DataAugmentation)是指在
训练
深度学习模型时,通过对现有数据进行一系列变换,从而生成新的样本。
cxr828
·
2025-01-19 07:09
大数据
大模型
训练
显卡选择
大模型
训练
显卡对比大模型
训练
时A100是首选,A40用于推理,目前还推出了H100为下一代替换A100的产品。大模型的
训练
用4090可以吗?
kcarly
·
2025-01-19 07:39
认识系列
大模型知识乱炖
人工智能
基于深度学习CNN网络 mini-xception网络实现 构建一个完整的人脸表情检测_识别分类系统,包括
训练
、评估、前端和服务端代码
人脸表情检测该项目已
训练
好网络模型,配置好环境即可运行使用,效果见图像,实现图像识别、摄像头识别、摄像头识别/识别分类项目-说明文档-UI界面-cnn网络项目基本介绍:【网络】深度学习CNN网络mini-xception
计算机c9硕士算法工程师
·
2025-01-19 07:35
卷积神经网络
深度学习
cnn
分类
单层感知机----或门实现
文章目录一、前言---感知机二、实现过程1.引入库2.或门真值表-
训练
集数据3.建立model,初始化定义权重、偏置、学习率4.前向传播定义5.
训练
过程(更新权重和偏置)6.
训练
模型一、前言—感知机感知机
翔翔子1号
·
2025-01-19 06:30
大模型-Qwen2.5 技术报告解读
Abstract主要是在介绍通义千问2.5(Qwen2.5)这一大型语言模型系列,涵盖了它在不同
训练
阶段的改进、多样化配置、可获取途径以及在各项性能评测中的出色表现等多个方面,旨在展示其先进性与实用性。
数据分析能量站
·
2025-01-19 06:55
机器学习
人工智能
【深度学习】AMP(Automatic Mixed Precision,自动混合精度)
AutomaticMixedPrecision,自动混合精度)AMP在深度学习中,AMP(AutomaticMixedPrecision,自动混合精度)是一种通过混合使用单精度(FP32)和半精度(FP16)来加速
训练
并减少显存占用的技术
shanks66
·
2025-01-19 04:38
深度学习
人工智能
【安利一个超高性价比的GPU租赁平台 使用分享】
这时候要是有8个4090该多好......正在
训练
的例子一、租蓝耘GPU服务器1、租用服务器首先需要进入蓝耘官网,登录官网后,点击【容器云市场】,租用配置合适的服务器。很便宜,随用随租,计费精
放飞自我的Coder
·
2025-01-19 04:30
无差别树洞
GPU
租显卡
大模型服务器
蓝耘GPU
深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型
文章目录1深度学习1.1
神经网络
和深度学习1.2
神经网络
的工作原理1.3
神经网络
的专业术语2LLM概述2.1大模型的"大"是指什么?2.2
训练
大模型有多烧钱?2.3如何入门大模型?
皮皮冰燃
·
2025-01-19 04:58
深度学习
深度学习
人工智能
从零开始构建一个大语言模型-第二章第一节
第二章目录**2.1理解词嵌入**2.2文本分词2.3将词元转换为词元ID2.4添加特殊上下文词元2.5字节对编码2.6使用滑动窗口进行数据采样2.7创建词元嵌入2.8编码词位置#本章涵盖为大型语言模型
训练
准备文本
释迦呼呼
·
2025-01-19 03:55
从零开始构建一个大语言模型
语言模型
人工智能
自然语言处理
深度学习笔记——前向传播与反向传播、
神经网络
(前馈
神经网络
与反馈
神经网络
)、常见算法概要汇总
本文简要介绍深度学习的前向传播与反向传播,以及前馈
神经网络
与反馈
神经网络
。
好评笔记
·
2025-01-19 03:25
深度学习笔记
深度学习
笔记
神经网络
人工智能
深度学习笔记——生成对抗网络GAN
文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的
训练
过程
训练
流程概述
训练
流程步骤1.初始化参数和超参数2.定义损失函数3.
训练
过程的迭代判别器
训练
步骤生成器
训练
步骤4
好评笔记
·
2025-01-19 03:25
深度学习笔记
深度学习
生成对抗网络
人工智能
神经网络
aigc
gan
机器学习
RPA 机器人到底有啥用?一文全知晓
一、RPA如何成为企业的智能助手(一)精准模仿人类操作,开启自动化之旅RPA机器人宛如一位
训练
有素的数字助手,其核心能力便是精准地模仿人类在计算机系统中的各种操作行为。
RPAdaren
·
2025-01-19 03:21
rpa
机器人
自动化
ai
代码随想录算法
训练
营总结
本人是一名普普通通的计算机专业的毕业生,在大学学数据结构和算法就感觉非常难,到毕业也没刷过几道题,所幸后来入职的公司也没有考察算法相关的内容。到现在已经工作两年多了,看到过许多聊面试聊算法的文章,也接触到一些对我来说很厉害的大佬,发现在面试尤其是大厂面试时对算法的考察还是很重要的,遂重新打开leetcode开始刷题,起初只是实在无聊的时候看下每日一题,这里用“看题”主要是因为完全不会做啊,毫不夸张
whpu_yb
·
2025-01-19 01:12
算法
神经网络
初始化 (init) 介绍
常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型
训练
与评估
迷路爸爸180
·
2025-01-18 23:25
神经网络
人工智能
深度学习
初始化
init
3.ChatClient&Chat Model简化与AI模型的交互
通过向预
训练
语言模型(如GPT等)发送提示词或部分对话内容,模型依据自身
训练
数据及对自然语言模式的理解,生成对话的延续或完整回复,并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。
laopeng301
·
2025-01-18 23:20
Spring
AI
人工智能
交互
吴恩达系列——微调(Fine-tuning)与生成模型的应用
微调(Fine-tuning)是指在已有预
训练
模型的基础上,对模型进行进一步
训练
,以适应特定任务或需求。
疯狂小料
·
2025-01-18 21:04
ai
prompt
Android开发中图片处理
图片优化:选择合适的图片格式:使用适当的图片格式(如PNG、JPEG或We
bP
)以获得最佳的图片质量和文件大小。
wayne214
·
2025-01-18 21:26
android
Pytorch 三小时极限入门教程
无论是科研人员探索前沿的
神经网络
架构,还是工程师将深度学习技术落地到实际项目,Pytorch都提供了强大的支持。
power-辰南
·
2025-01-18 20:43
人工智能
深度学习
pytorch
人工智能
【Python篇】深入机器学习核心:XGBoost 从入门到实战
2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型
训练
5.4预测6.模型评估7.超参数调优
半截诗
·
2025-01-18 19:06
Python
python
机器学习
深度学习
分类
回归
数据分析
XGBoost
【YOLOv8杂草作物目标检测】
以下是一些关键信息的总结:农作物幼苗与杂草检测系统:基于YOLOv8深度学习框架,通过2822张图片
训练
了一个目标检测模型,用于检测田间的农作物幼苗与杂草对象。
stsdddd
·
2025-01-18 19:35
YOLO目标检测
目标检测
YOLO
目标检测
人工智能
e
BP
F 底层结构剖析
所以我们的寄存器,通常分为下面几种:数据寄存器,一般用于存储数据地址寄存器,用于存储地址,常见的有段指针在e
BP
F中常见的寄存器有下面这几种:R0,这个寄存器一般用于存储对应函数返回值R1-R5,这几个寄存器用于存储函数的参数值
·
2025-01-18 18:07
linuxebpf
NVIDIA Hopper解说
它代表了NVIDIA在加速计算领域的最新进展,旨在为AI
训练
和推理、HPC应用提供前所未有的性能提升。
白总Server
·
2025-01-18 17:24
redis
数据库
缓存
rust
mongodb
大数据
数据仓库
LLMs,即大型语言模型
LLMs,即大型语言模型,是一类基于深度学习的人工智能模型,它们通过海量的数据和大量的计算资源进行
训练
,可以理解和生成自然语言。
maopig
·
2025-01-18 17:52
AI
语言模型
人工智能
自然语言处理
第79期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 17:22
GPTSecurity
AIGC
gpt
第60期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 17:22
GPTSecurity
人工智能
语言模型
网络安全
【LLM】大语言模型(LLMs)
它们通过在大规模文本数据上进行
训练
,学习语言的语法、语义和各种语言特征,从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。
林九生
·
2025-01-18 17:21
人工智能
语言模型
人工智能
自然语言处理
全新 Hopper 架构的Transformer 引擎有什么特点?
Transformer引擎是全新Hopper架构的一部分,将显著提升AI性能和功能,并助力在几天或几小时内
训练
大型模型。
扫地的小何尚
·
2025-01-18 17:50
人工智能
大语言模型(LLMs)入门教程(非常详细)从零基础入门到精通,看完这一篇就够了
如下这份指南将涵盖LLMs的基础知识、
训练
过程、用例和未来趋势……一.WhatareLargeLanguage
大模型零基础教程
·
2025-01-18 17:19
语言模型
人工智能
自然语言处理
大模型
《多模态语言模型:一个开放探索的技术新领域》
核心主题多模态语言模型的特点仍处于探索和定义阶段没有固定的标准任务和评估方法研究方向高度开放技术路径主要存在两种方法:后期融合(LateFusion)从语言模型backbone开始添加图像编码器效果稳定,成本可控早期融合(EarlyFusion)从多模态数据集预
训练
效果尚不明显需要更大规模计算资源开放和透明的重要性促进知识累积和技术迭代降低技术准入门槛避免技术垄断便于安全性审计主要挑战技术层面数据
XianxinMao
·
2025-01-18 17:16
语言模型
人工智能
算法
1.4走向不同:GPT 与 BERT 的选择——两大NLP模型的深度解析
它们都基于Transformer架构,但在设计理念、任务应用和
训练
方式等方面存在显著差
少林码僧
·
2025-01-18 16:12
AI大模型应用实战专栏
自然语言处理
gpt
bert
1.8 GPT-4:开创人工智能的新纪元
作为“生成预
训练
转换器”家族中的最新成员,GPT-4不仅在功能上进行了提升,更在语言处理能力、理解深度以及适应性方面带来了全新的变革。
少林码僧
·
2025-01-18 16:12
AI大模型应用实战专栏
人工智能
第83期 | GPTSecurity周报
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区,集成了生成预
训练
Transformer(GPT)、人工智能生成内容(AIGC)以及大语言模型(LLM)等安全领域应用的知识。
云起无垠
·
2025-01-18 16:11
GPTSecurity
人工智能
网络安全
使用
神经网络
拟合6项参数
使用
神经网络
拟合6项参数1.数据预处理1.1添加参数解析1.2数据预处理逻辑1.3数据归一化及划分1.4数据标签处理逻辑1.5数据转torch2.定义model2.1CNN_LSTM2.2Transformer3
Andrew_Xzw
·
2025-01-18 15:06
神经网络
人工智能
深度学习
开发语言
机器学习
python
3DUnetCNN 项目常见问题解决方案
designedformedicalimagesegmentation项目地址:https://gitcode.com/gh_mirrors/3d/3DUnetCNN项目基础介绍3DUnetCNN是一个基于PyTorch的3DU-Net卷积
神经网络
魏纯漫
·
2025-01-18 14:27
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他