E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
预训练
卷积这个词在卷积神经网络中应该怎么理解
卷积核中的每个值称为权重(weights),这些权重是通过
训练
过程优化得到的。滑动窗
abments
·
2025-03-02 06:05
人工智能
cnn
深度学习
计算机视觉
卷积核在初始阶段的数据是怎么获取的
卷积核的初始化随机初始化:在大多数情况下,卷积核(滤波器)的权重在模型
训练
开始时是随机初始化的。常用的随机初始化方法包括以下几种:均匀分布初始化:权重从一个均匀分布中抽取值。
abments
·
2025-03-02 06:05
人工智能
深度学习
人工智能
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用
但当我们需要更强的语言生成能力时,往往会求助于更先进的
预
训练
语言模型。OpenAI旗下的GPT系列模型(如GPT-3、GPT-3.5、GPT-4等)在生成文本方面拥有强大的表现。
山海青风
·
2025-03-02 05:29
人工智能
gpt
自然语言处理
python
DeepSeek R1 详解:思维链、强化学习和蒸馏
训练
过程较小模型基准为什么Deepseek很重要DeepSeekR1常见问题解答来自中国的新型大型语言模型DeepSeekR1的发布在人工智能研究界引起了轰动。这不仅仅是又一次渐进式改进。
前网易架构师-高司机
·
2025-03-02 05:58
2025年最新-深度学习+AI
DeepSeek和AI工具
深度学习
Deepseek
基于 langchain+ollama 创建私有化知识库
概念介绍什么是RAGRAG是retrieval-augmented-generation的缩写,直译中文的意思是检索增强生成,可以简单理解能让
训练
好的大模型LLM可以结合外部数据,可以补充或者修正大模型返回的答案
大语言模型
·
2025-03-02 02:09
langchain
知识图谱
LLM
人工智能
llama
RAG
知识库
硅基流动:免费领取2000万Token,畅享AI大模型盛宴!
其核心团队来自清华大学、MIT等顶尖高校,致力于为企业和开发者提供高性能的AI模型推理和
训练
解决方案。
·
2025-03-02 01:05
ai开发
sql深入学习
文章目录前言知识学习注释的两种形式字符型注入万能密码布尔盲注报错注入堆叠注入时间盲注二次注入小技巧前言这次学习建立在对数据库有基本的认识,了解基础的增删改查语句,数字型注入和字符型注入的基础上,进一步深入学习知识,并进行实战
训练
知识学习注释的两种形式
lally.
·
2025-03-01 22:38
sql
学习
数据库
实体识别处理--在给定的文本中识别特定类型的实体
它结合了字典匹配和向量相似度匹配两种方法,利用
预
训练
的BERT模型来获取实体的嵌入表示,通过构建Trie树来提高字典匹配的效率。
风清扬【coder】
·
2025-03-01 21:04
自然语言分析处理
算法
深度学习
人工智能
nlp
自然语言处理
6.20CSIG腾讯云后台开发实习一面面经 C++50min
零零总总已经面了9场腾讯了,身心俱疲hr面完了一整天都是链接状态不知道有没有戏,感觉凉了AjokenevergainsaAjokenevergainsanenemybutoftenlosesafrie我在牛客笔试
训练
营第
han_xue_feng
·
2025-03-01 21:33
java
如何用 DeepSeek 进行卷积神经网络(CNN)的优化
然而,尽管CNN在这些任务中表现出色,它们通常需要大量的计算资源,并且在优化过程中可能会遇到一些挑战,如过拟合、
训练
速度慢、局部最优解等问题。
一碗黄焖鸡三碗米饭
·
2025-03-01 20:57
人工智能前沿与实践
cnn
人工智能
神经网络
机器学习
深度学习
基于RF随机森林机器学习算法的回归预测模型MATLAB代码实现了一个回归任务的决策树集成模型。
首先从Excel文件中导入数据集,并将数据划分为
训练
集和测试集。然后,对数据进行归一化处理并转置以适应模型的要求。
qq924711725
·
2025-03-01 20:22
仿真模型
机器学习
算法
随机森林
【学习】电脑上有多个GPU,命令行指定GPU进行
训练
。
CUDA_VISIBLE_DEVICES=1假设要使用第二个GPU进行
训练
。CUDA_VISIBLE_DEVICES=1pythontrain.py
超好的小白
·
2025-03-01 19:18
学习
人工智能
深度学习
深度学习开源数据集大全:从入门到前沿
在深度学习中,数据是模型
训练
的基石。本文整理了当前最常用且高质量的开源数据集,涵盖图像、视频、自然语言处理(NLP)、语音与音频等方向,帮助研究者和开发者快速定位所需资源。
念九_ysl
·
2025-03-01 19:48
AI
人工智能
在麻将 AI 的迷宫中,我用 Python 函数组合探寻最优解:精髓与穷举
预
判风险:计算打出某张牌可能带来的风险。布局未来:预测后续牌局的走向,制定长远策略。为
fxrz12
·
2025-03-01 19:46
AI
人工智能
python
开发语言
使用 Flink CDC 实现 MySQL 数据,表结构实时入 Apache Doris
数据:库表较多,每个企业用户一个分库,每个企业下的表均不同,无法做到聚合,且表可以被用户随意改动,增删改列等,增加表分析:用户自定义分析,通过拖拽定义图卡,要求实时,点击确认即出现相应结果,其中有无法
预
判的过滤问题
一天两晒网
·
2025-03-01 18:42
doris
mysql
flink
doris
flink
cdc
图像识别-pytorch
模型可以是
预
训练
的,也可以自己搭建。损失函数:用于衡量预测值与真实值之间的差距,如均方误差。损失函数越小越好。优化器:用于调整权重和偏置,使损失函数最小化。优化器决定了参数的调整方式。误差反传(
星辰瑞云
·
2025-03-01 17:08
机器学习
cnn
pytorch
搜索赋能:大型语言模型的知识增强与智能提升
由于
训练
数据的局限性,LLM无法获取最新的知识,也无法涵盖所有领域的专业知识。为了克服这些局限性,LLM需要依赖外部搜索来增强性能和保证输出结果的可靠性。
听吉米讲故事
·
2025-03-01 17:36
语言模型
人工智能
自然语言处理
搜索引擎
webpack基础配置
文章目录一、默认入口和默认出口二、资源配置三、输出文件3.1多文件入口3.2HtmlWebpackPlugin插件四、环境4.1环境变量4.2热更新五、代码分离5.1公共模块5.2懒加载5.3
预
获取/预加载模块六
吃杠碰小鸡
·
2025-03-01 15:51
前端
前端工具库
webpack
前端
javascript
【探商宝】DeepSeek开源周第四弹:双向流水并行与专家负载均衡技术解析
引言在千亿级大模型
训练
领域,计算资源利用率与通信效率是制约
训练
速度的核心瓶颈。
探熵科技
·
2025-03-01 15:19
数据分析
人工智能
基于 Pytorch 的全卷积网络人脸表情识别:从数据到部署的实战之旅
前言:本文将详细介绍基于Pytorch框架,利用全卷积网络进行人脸表情识别的完整过程,涵盖从数据集的准备、模型的设计与
训练
,再到模型的部署与预测,通过代码实现以及详细讲解,帮助读者深入理解并掌握这一技术
那年一路北
·
2025-03-01 14:16
Pytorch理论+实践
pytorch
网络
人工智能
YOLOv8 赋能道路状况检测:革新交通基础设施监测
检测原理(二)相较于传统方法的优势二、YOLOv8在道路状况检测中的具体应用实例(一)裂缝检测(二)坑洼检测(三)积水检测三、基于YOLOv8的道路状况检测流程(一)图像采集(二)数据预处理(三)模型
训练
与评估
他是只猫
·
2025-03-01 14:15
YOLOv8
在交通领域的应用
YOLO
目标跟踪
人工智能
yolo位姿估计实验
目录介绍实验过程2.1数据集下载2.2模型和数据配置文件修改2.3模型
训练
参考链接1.介绍1.1简介YOLOv8-Pose是基于YOLOv4算法的姿势估计模型,旨在实现实时高效的人体姿势估计。
jarreyer
·
2025-03-01 14:15
YOLO
.net机器学习框架:ML.NET模型生成器
ML.NETModelBuilder是一个直观的图形化VisualStudio扩展,用于构建、
训练
和部署自定义机器学习模型。
NotOnlyCoding
·
2025-03-01 13:41
AI编程
Meta:基于数据关系的LLM高效
预
训练
标题:Data-EfficientPretrainingwithGroup-LevelDataInfluenceModeling来源:arXiv,2502.14709摘要数据高效的
预
训练
已显示出提高缩放定律的巨大潜力
大模型任我行
·
2025-03-01 12:37
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
大模型
训练
与微调(4)——Top-k 和 Top-p 采样策略介绍
大模型
训练
与微调(4)——Top-k和Top-p采样策略介绍**一、Top-k采样****1.核心思想****2.数学实现****3.示例****4.特点****二、Top-p(Nucleus)采样**
John_今天务必休息一天
·
2025-03-01 12:33
自然语言处理
深度学习
算法
python
chatgpt
人工智能
单卡挑战千亿模型!深度求索MoE架构实战指南:从理论到开源工具全解析
引言:为什么需要单GPU
训练
千亿参数模型?随着大模型参数规模突破千亿级别,
训练
成本与算力需求呈指数级增长。传统密集架构(DenseModel)在单卡
训练
中面临显存不足、计算效率低等问题。
小诸葛IT课堂
·
2025-03-01 11:27
架构
代码随想录算法
训练
营day47(0215)
开始单调栈,我记得这个第一题我某次笔试就遇到过1.每日温度题目739.每日温度给定一个整数数组temperatures,表示每天的温度,返回一个数组answer,其中answer[i]是指对于第i天,下一个更高温度出现在几天后。如果气温在这之后都不会升高,请在该位置用0来代替。示例1:输入:temperatures=[73,74,75,71,69,72,76,73]输出: [1,1,4,2,1,1
Lazy.land
·
2025-03-01 08:00
算法
yolov5-
训练
好的模型部署的几种方式-ONNX
ONNX所针对的是深度学习开发生态中最关键的问题之一,在任意一个框架上
训练
的神经网络模型,无法直接在另一个框架上用。开发者需要耗费大量时间精力把模型从一个开发平台移植到另一个。
黄晓魚
·
2025-03-01 08:30
halcon3d
PCL点云处理
深度神经网络
YOLO
C#
python
Stable Diffusion(SD)系列模型及关联算法深度解析
一、基础模型架构演进SDv1.5核心架构:基于LatentDiffusionModel(LDM),通过VAE将图像压缩至潜空间进行扩散
训练
,支持512x512分辨率生成,兼容二次元与写实风格混合创作
Liudef06
·
2025-03-01 08:59
Stable
Diffusion
stable
diffusion
算法
聚类算法(K-means)代码实现(鸢尾花数据集)
目录一、前言二、代码实现1.随即给定初始点并返回,其点个数就是K值2.得到当前每一个样本到K个中心点的距离,得到每个样本距离最近的那个中心点并返回中心点3.更新中心点并返回4.进行
训练
(迭代)返回最后一次的中心点和簇类中的样本
乔大将军
·
2025-03-01 08:59
机器学习
算法
聚类
kmeans
python
全方位解析:大语言模型评测方法的综合指南
自2017年Transformer模型提出以来,自然语言处理研究逐步转向基于该框架的
预
训练
模型,如BERT、GPT、BART和T5等。这些
预
训练
模型与下游任务适配后,持续刷新最优结果。
大模型玩家
·
2025-03-01 08:28
语言模型
人工智能
自然语言处理
深度学习
agi
大模型
搜索引擎
大语言模型原理与工程实践:手把手教你
训练
7B 大语言模型 自动化
训练
框架
大语言模型原理与工程实践:手把手教你
训练
7B大语言模型自动化
训练
框架关键词:大语言模型、7B模型、自动化
训练
、深度学习、神经网络、自然语言处理、分布式计算文章目录大语言模型原理与工程实践:手把手教你
训练
AI天才研究院
·
2025-03-01 07:24
AI大模型企业级应用开发实战
DeepSeek
R1
&
大数据AI人工智能大模型
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)
全网国内外总结Prompt&LLM论文,开源数据&模型,AIGC应用(持续更新,收藏查看)目录顺序如下国内外,垂直领域大模型Agent和指令微调等
训练
框架开源指令,
预
训练
,rlhf,对话,agent
训练
数据梳理
代码讲故事
·
2025-03-01 07:54
智能工具
Prompt
LLM
AIGC
模型
开源
数据集
深度学习
OpenCV 入门(六) —— Android 下的人脸识别
OpenCV入门系列:OpenCV入门(一)——OpenCV基础OpenCV入门(二)——车牌定位OpenCV入门(三)——车牌筛选OpenCV入门(四)——车牌号识别OpenCV入门(五)——人脸识别模型
训练
与
tmacfrank
·
2025-03-01 07:53
Android
#
NDK
opencv
android
人工智能
ES6的let和const,一篇文章就够了
注意let声明变量不会进行变量提升无法在声明之前使用let声明的变量let声明的变量不容许重复声明
预
解析阶段会对let声明的变量锁定所有其他在同一个域下的声明都会报错let会开启块级作用域基础特性if(
小常--
·
2025-03-01 07:52
前端
JavaScript
ES6
javascript
前端
es6
【读书笔记】《What is Mathematics》第一章:自然数
我数学渣锻炼自己解决问题的能力数据结构逻辑
训练
为将来转行数据科学做底子(也许永远都不会转)考研(emmm想考一个非全日制玩一玩,感觉非全日制很适合工科学生)嗯,有了以上的理由,所以一定要坚持下去✊为什么是这本书
还没入门的大菜狗
·
2025-03-01 07:21
具体数学
读书笔记
BERT模型深入理解——自然语言处理的里程碑
BERT创新性地使用
预
训练
+微调模式,先用
预
训练
在大量无标注的语料中进行自监督学习,学习到语言的通用规律,然后在少量有标注的数据中进行有监督学习,适配更精细化的任务。这种模式一直影响到最新的大模型结
cufewxy2018
·
2025-03-01 06:47
自然语言处理
bert
人工智能
怎样通过人机融合智能去除“机器幻觉”?
机器幻觉指的是人工智能模型在处理信息时,做出错误的、非理性的判断或预测,这种现象往往源于模型在
训练
数据中的偏差、不完全信息或过度依赖某些特定模式。
人机与认知实验室
·
2025-03-01 06:45
【附源码】基于opencv+pyqt5搭建的人脸识别系统
文章目录前言一、人脸检测二、人脸识别1.
训练
识别器2.识别人脸三、界面相关1.Qlabel展示图片2.表格跟随内容而增加和减少3.选择图片文件4.警告框四、源码获取总结前言人脸识别技术作为人工智能领域的一颗璀璨明珠
~啥也不会~
·
2025-03-01 06:12
opencv
人工智能
计算机视觉
人脸识别
pyqt
计算机视觉与机器学习之文档解析与向量化技术加速多模态大模型
训练
与应用——文件向量化大模型!
目录前言1、TextIn文档解析技术1.1、文档解析技术1.2、目前存在的问题1.2.1、不规则的文档信息示例1.3、合合信息的文档解析1.3.1、合合信息的TextIn文档解析技术架构1.3.2、版面分析关键技术Layout-engine1.3.3、文档树提取关键技术Catalog-engine1.3.4、双栏1.3.5、非对称双栏1.3.6、双栏+表格1.3.7、无线表格1.3.8、合并单元格
知世不是芝士
·
2025-03-01 04:57
计算机视觉
人工智能
大语言模型
ai大模型
多模态大模型
机器学习
LLM
GitHub每日最火火火项目(2.28)
olmocr项目介绍:olmocr是由allenai开发的一款用于将PDF文件线性化,以适配大语言模型(LLM)数据集和
训练
的工具包。在大语言模型的
训练
过程中,数据的格式和预处理极为关键。
FutureUniant
·
2025-03-01 03:50
github日推
github
人工智能
计算机视觉
音视频
ai
深入理解PyTorch模型
训练
所需的数据集
在PyTorch中,模型
训练
的核心是数据集(Dataset)。数据集是模型
训练
的基础,它提供了模型
训练
所需的所有输入数据和对应的标签。理解数据集的结构、加载方式以及如何预处理数据是成功
训练
模型的关键。
mosquito_lover1
·
2025-03-01 03:20
pytorch
人工智能
python
人类驾驶的人脑两种判断模式(反射和
预
判)-->自动驾驶两种AI模式
另一种模式是物理时空图式推理模式,判断是基于
预
判预测,人脑把物理世界的物理动态时空规则(规律)图像已经编码为脑内符号(语言或图式)系统,通过
预
判预测的思维链推理过程(语言符号或物理时空图式的推理运算,映射推理出了物理世界的后续时空图像
liron71
·
2025-03-01 02:14
人工智能
机器学习
YOLOv9与YOLOv8创新点差异概述:
这意味着模型在
训练
过程中可能更加关注梯度信息的质量和流向,从而更有效地进行参数
奔强的程序
·
2025-03-01 02:42
YOLO
DeepSeek 最新发布 DeepEP:一款用于 MoE 模型
训练
和推理的开源 EP 通信库
采用Mixture-of-Experts(MoE)架构的大型语言模型在没有相应计算量增加的情况下显著提升了模型容量。然而,这种方法也引入了一些挑战,尤其是在GPU之间的通信方面。在MoE模型中,对于任何给定的token,只有一部分专家是活跃的,因此在设备之间高效地交换数据至关重要。传统的全对全(all-to-all)通信方法可能会造成瓶颈,增加延迟,并导致GPU资源利用不足。在对延迟敏感的场景中,
强哥之神
·
2025-03-01 01:37
人工智能
LLM
机器学习
Latent
Space
语言模型
deepseek
使用YOLOv8
训练
自己的数据集:详细教程
使用YOLOv8
训练
自己的数据集:详细教程引言YOLOv8是Ultralytics团队开发的新一代目标检测算法,以其高效的性能和简洁的API而闻名。
zru_9602
·
2025-02-28 22:52
人工智能
YOLO
谁说消费级硬件不能玩 DeepSeek - R1 微调?手把手教你进阶AI玩家
微调像DeepSeek-R1这样的大规模人工智能模型可能需要大量资源,但借助正确的工具,在消费级硬件上进行高效
训练
是可行的。
硅基创想家
·
2025-02-28 22:51
#
大模型-DeepSeek系列
人工智能
DeepSeek
大模型微调
大模型
GPU
谈谈DeepSeek-v3在算力约束下的出色工作
在算力约束下的出色工作原创渣Bzartbot2024年12月28日22:52上海寒冷的周末,加完班挤点时间读个论文吧.Deepseek-v3仅用了2048块H800GPU就超越了Llama3405B模型,要知道Meta
训练
强化学习曾小健
·
2025-02-28 22:19
Deepseek原理与使用
人工智能
PyTorch 常见的损失函数:从基础到大模型的应用
PyTorch常见的损失函数:从基础到大模型的应用在用PyTorch
训练
神经网络时,损失函数(LossFunction)是不可或缺的“裁判”。
阿正的梦工坊
·
2025-02-28 22:19
LLM
PyTorch
pytorch
人工智能
python
DeepSeek五天开源5大杀器实测:
训练
成本砍半+推理速度起飞,算法圈已疯(附删库跑路教程)
算法圈惊呼:
训练
成本腰斩,AGI进度条拉爆!根本学不完,学不完速删祖传代码,GitHub星链已就位:https://github.com/deepseek-aiDay1:FlashMLA(
AI仙人掌
·
2025-02-28 22:18
人工智能
深度学习
人工智能
大模型
算法
开源
上一页
3
4
5
6
7
8
9
10
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他