E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
考试训练
Llama 2架构深度解析:Meta开源的70B参数大模型设计哲学
Llama2作为Meta开源的商用级大语言模型,其架构设计体现了三大核心原则:效率优先:在7B/13B/70B参数规模下保持线性计算复杂度扩展性强化:通过改进注意力机制支持4k上下文长度安全性内嵌:在预
训练
阶段融入
AI时代已来!
·
2025-03-02 14:46
llama
架构
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型
DINO-X:一种用于开放世界目标检测与理解的统一视觉模型摘要1引言2方法2.1模型架构2.1.1DINO-XPro2.1.2DINO-XEdge3数据集构建和模型
训练
数据收集模型
训练
摘要在本文中,我们介绍了
黄阳老师
·
2025-03-02 13:10
目标检测
目标跟踪
人工智能
指数移动平均(EMA)策略
在神经网络领域,EMA常被用于对模型参数进行平滑处理,使得网络模型在
训练
过程中能够更加稳定且泛化能力可能得到提升。
Sherry Wangs
·
2025-03-02 13:06
深度学习
深度学习
python
机器学习
Transformer预测 | 基于TCN-Transformer的股票价格预测(Pytorch)
文章目录预测效果文章概述程序设计参考资料预测效果文章概述Transformer预测|基于TCN-Transformer的股票价格预测(Python)Transformer模型本质上都是预
训练
语言模型,大都采用自监督学习
机器学习之心
·
2025-03-02 13:35
#
Transformer模型
transformer
pytorch
深度学习
TCN-Transformer
股票价格预测
Dify理论:漫话RAG
大语言模型,由闭卷
考试
,变成了开卷
考试
。第一:减轻了大模型的幻觉。大模型在不知道答案时,往往会胡编乱造。如今,有人把答案告诉了它,它只需要整理一下语言即可。
几道之旅
·
2025-03-02 12:58
Dify与Langflow
智能体(Agent)
知识库
人工智能
自然语言处理
nlp
【AI带来的机遇】
类比房地产黄金期中介赚取信息差、移动互联网初期应用商店分发红利,当前AI领域存在三大核心机遇:基础设施重构机遇(类比域名投资)AI大模型开源浪潮下,高质量
训练
数据资产、特定领域微调模型、模型中间件将成为新时代
调皮的芋头
·
2025-03-02 11:18
人工智能
神经网络
AIGC
如何用AI写程序
一、AI写程序之工具选择(一)主流AI编程工具介绍如今市面上有诸多AI编程工具可供选择,以下为大家介绍几种常见且实用的工具:ChatGPT:由OpenAI开发的一款基于Transformer架构的预
训练
模型
Honmaple
·
2025-03-02 11:46
人工智能
模型优化之强化学习(RL)与监督微调(SFT)的区别和联系
想了解有关deepseek本地
训练
的内容可以看我的文章:本地基于GGUF部署的DeepSeek实现轻量级调优之一:提示工程(PromptEngineering)(完整详细教程)_deepseekgguf-CSDN
搏博
·
2025-03-02 10:08
深度学习
人工智能
机器学习
架构
transformer
大模型在心力衰竭预测及临床方案制定中的应用研究报告
1.2研究目的1.3研究方法与创新点二、大模型技术与心力衰竭概述2.1大模型技术原理与发展2.2心力衰竭的病理机制与现状三、大模型在心力衰竭术前风险预测中的应用3.1数据收集与预处理3.2预测模型的构建与
训练
LCG元
·
2025-03-02 09:58
围术期危险因子
预测模型研究
人工智能
完整的 Python 数据分析案例:在线游戏玩家付费预测
目录1.案例背景代码实现2.主要的代码难点解析2.1数据清洗-缺失值处理2.2特征工程-新特征计算与独热编码2.3特征选择2.4模型
训练
与评估2.5数据可视化3.可能改进的代码3.1数据清洗与特征工程改进
萧十一郎@
·
2025-03-02 08:56
python
机器学习
人工智能
DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?
今天咱们聊聊最近在AI界引发轰动的新闻——DeepSeek和xAI相继用R1和Grok-3证明了预
训练
ScalingLaw并非OpenAI的护城河。这意味着什么呢?让我们一探究竟!
东方佑
·
2025-03-02 08:53
量子变法
chatgpt
人工智能
【大模型】fp32 和 fp16 的区别,混合精度的原理。
(仅为fp32的50%)数值范围约±3.4×10³⁸约±6.5×10⁴精度(尾数)23位(约7位有效十进制数)10位(约3位有效十进制数)用途高精度计算(如梯度更新)高效计算(如矩阵乘法)2.混合精度
训练
的原理核心思想
深度求索者
·
2025-03-02 08:20
python
pytorch
高效空间编码技术:SPD-Conv在目标检测中的创新应用
YOLOv8中的SPD-Conv实现YOLOv8SPD-Conv代码实现代码解析性能提升SPD-Conv的优势与应用场景SPD-Conv的设计细节与优化1.空间深度转换机制的进一步优化2.SPD-Conv的
训练
技巧与改进
向哆哆
·
2025-03-02 08:17
目标检测
目标跟踪
人工智能
yolov8
pytorch与深度学习随记——AlexNet
激活函数:AlexNet使用ReLU而不是sigmoid作为其激活函数,这有助于缓解梯度消失问题并加速
训练
过程。AlexNet架构的创新点局部响应归一化(LRN):AlexNet引入LRN层,可以创建
黑色的山岗在沉睡
·
2025-03-02 08:46
深度学习随记
深度学习
pytorch
人工智能
【大模型】什么是蒸馏版大模型
大模型蒸馏一、知识蒸馏与无监督样本
训练
1.知识蒸馏的核心原理目标:将复杂大模型(Teacher)的知识迁移到轻量化小模型(Student)中,提升小模型性能。
深度求索者
·
2025-03-02 07:12
python
人工智能
开发语言
云计算相关工作岗位有哪些,薪资怎么样?
随着亚马逊云、阿里云、华为云等云厂商的快速发展,也产生了大量的岗位需求,同时厂商为了增强自身影响力,也设置了很多证书
考试
,acp、ace、hcip、hcie等等。
欧米说云
·
2025-03-02 06:07
云计算
腾讯云
阿里云
云计算
【llm对话系统】 LLM 大模型推理python实现:vLLM 框架
它指的是利用
训练
好的LLM模型,根据输入(Prompt)生成文本的过程。然而,LLM的推理速度往往较慢,尤其是在处理长序列或高并发请求时,效率瓶颈尤为突出。为了解决这个问题,vLLM应运而生!
kakaZhui
·
2025-03-02 06:06
人工智能
AIGC
chatgpt
python
llama
卷积这个词在卷积神经网络中应该怎么理解
卷积核中的每个值称为权重(weights),这些权重是通过
训练
过程优化得到的。滑动窗
abments
·
2025-03-02 06:05
人工智能
cnn
深度学习
计算机视觉
卷积核在初始阶段的数据是怎么获取的
卷积核的初始化随机初始化:在大多数情况下,卷积核(滤波器)的权重在模型
训练
开始时是随机初始化的。常用的随机初始化方法包括以下几种:均匀分布初始化:权重从一个均匀分布中抽取值。
abments
·
2025-03-02 06:05
人工智能
深度学习
人工智能
自然语言处理NLP入门 -- 第八节OpenAI GPT 在 NLP 任务中的应用
但当我们需要更强的语言生成能力时,往往会求助于更先进的预
训练
语言模型。OpenAI旗下的GPT系列模型(如GPT-3、GPT-3.5、GPT-4等)在生成文本方面拥有强大的表现。
山海青风
·
2025-03-02 05:29
人工智能
gpt
自然语言处理
python
DeepSeek R1 详解:思维链、强化学习和蒸馏
训练
过程较小模型基准为什么Deepseek很重要DeepSeekR1常见问题解答来自中国的新型大型语言模型DeepSeekR1的发布在人工智能研究界引起了轰动。这不仅仅是又一次渐进式改进。
前网易架构师-高司机
·
2025-03-02 05:58
2025年最新-深度学习+AI
DeepSeek和AI工具
深度学习
Deepseek
考研380分什么水平计算机,考研380分相当于高考多少分的难度
研究生入学
考试
,不同专业,有不同的专业课程,
考试
成绩不能一概而论。另外,即使是同一专业,很多学校采用独立命题,
考试
的难度也大相径庭。
程芯言
·
2025-03-02 04:53
考研380分什么水平计算机
2025 年考研数学二大纲原文(完整版)
2025年考研数学二大纲原文(完整版)
考试
科目:高等数学、线性代数
考试
形式和试卷结构一、试卷满分及
考试
时间试卷满分为150分,
考试
时间为180分钟.二、答题方式答题方式为闭卷、笔试.三、试卷内容结构高等教学约
WEL测试
·
2025-03-02 04:20
数学二学习
考研
考研导师选择方法
曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI
考试
认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。
herosunly
·
2025-03-02 04:20
考名校研究生经验分享
考研
选择导师
考研导师
选择方法
基于 langchain+ollama 创建私有化知识库
概念介绍什么是RAGRAG是retrieval-augmented-generation的缩写,直译中文的意思是检索增强生成,可以简单理解能让
训练
好的大模型LLM可以结合外部数据,可以补充或者修正大模型返回的答案
大语言模型
·
2025-03-02 02:09
langchain
知识图谱
LLM
人工智能
llama
RAG
知识库
2024年12月中国电子学会青少年软件编程(Python)等级
考试
试卷(一级)真题 + 答案
青少年软件编程(Python)等级
考试
试卷(一级)分数:100题数:37一、单选题(共25题,共50分)可以对Python代码进行注释的符号是?()A.B.//C.**D.
伶俐角少儿编程
·
2025-03-02 01:32
python
少儿编程
青少年编程等级考试
中国电子学会
硅基流动:免费领取2000万Token,畅享AI大模型盛宴!
其核心团队来自清华大学、MIT等顶尖高校,致力于为企业和开发者提供高性能的AI模型推理和
训练
解决方案。
·
2025-03-02 01:05
ai开发
软考程序员各模块知识点对应的分值分布及
考试
形式总结
软考程序员
考试
分为基础知识(综合知识)和应用技术两个科目,各科目满分均为75分,合格标准通常为45分。
水瓶丫头站住
·
2025-03-02 00:23
考试
排序算法
算法
数据结构
sql深入学习
文章目录前言知识学习注释的两种形式字符型注入万能密码布尔盲注报错注入堆叠注入时间盲注二次注入小技巧前言这次学习建立在对数据库有基本的认识,了解基础的增删改查语句,数字型注入和字符型注入的基础上,进一步深入学习知识,并进行实战
训练
知识学习注释的两种形式
lally.
·
2025-03-01 22:38
sql
学习
数据库
实体识别处理--在给定的文本中识别特定类型的实体
它结合了字典匹配和向量相似度匹配两种方法,利用预
训练
的BERT模型来获取实体的嵌入表示,通过构建Trie树来提高字典匹配的效率。
风清扬【coder】
·
2025-03-01 21:04
自然语言分析处理
算法
深度学习
人工智能
nlp
自然语言处理
6.20CSIG腾讯云后台开发实习一面面经 C++50min
零零总总已经面了9场腾讯了,身心俱疲hr面完了一整天都是链接状态不知道有没有戏,感觉凉了AjokenevergainsaAjokenevergainsanenemybutoftenlosesafrie我在牛客笔试
训练
营第
han_xue_feng
·
2025-03-01 21:33
java
python数据预处理技术与实践期末
考试
_Python机器学习手册:从数据预处理到深度学习...
内容简介O'ReillyMedia,Inc.介绍第1章向量、矩阵和数组1.0简介1.1创建一个向量1.2创建一个矩阵1.3创建一个稀疏矩阵1.4选择元素1.5展示一个矩阵的属性1.6对多个元素同时应用某个操作1.7找到最大值和最小值1.8计算平均值、方差和标准差1.9矩阵变形1.10转置向量或矩阵1.11展开一个矩阵1.12计算矩阵的秩1.13计算行列式1.14获取矩阵的对角线元素1.15计算矩阵
坂田月半
·
2025-03-01 20:29
如何用 DeepSeek 进行卷积神经网络(CNN)的优化
然而,尽管CNN在这些任务中表现出色,它们通常需要大量的计算资源,并且在优化过程中可能会遇到一些挑战,如过拟合、
训练
速度慢、局部最优解等问题。
一碗黄焖鸡三碗米饭
·
2025-03-01 20:57
人工智能前沿与实践
cnn
人工智能
神经网络
机器学习
深度学习
基于RF随机森林机器学习算法的回归预测模型MATLAB代码实现了一个回归任务的决策树集成模型。
首先从Excel文件中导入数据集,并将数据划分为
训练
集和测试集。然后,对数据进行归一化处理并转置以适应模型的要求。
qq924711725
·
2025-03-01 20:22
仿真模型
机器学习
算法
随机森林
【学习】电脑上有多个GPU,命令行指定GPU进行
训练
。
CUDA_VISIBLE_DEVICES=1假设要使用第二个GPU进行
训练
。CUDA_VISIBLE_DEVICES=1pythontrain.py
超好的小白
·
2025-03-01 19:18
学习
人工智能
深度学习
深度学习开源数据集大全:从入门到前沿
在深度学习中,数据是模型
训练
的基石。本文整理了当前最常用且高质量的开源数据集,涵盖图像、视频、自然语言处理(NLP)、语音与音频等方向,帮助研究者和开发者快速定位所需资源。
念九_ysl
·
2025-03-01 19:48
AI
人工智能
计算机毕业设计 ——jspssm507Springboot 的论坛管理系统
服务内容:1、提供科研入门辅导(主要是代码方面)2、代码部署3、定制化需求解决等4、期末
考试
复习计算机毕业设计——jsps
奔强的程序
·
2025-03-01 18:45
课程设计
图像识别-pytorch
模型可以是预
训练
的,也可以自己搭建。损失函数:用于衡量预测值与真实值之间的差距,如均方误差。损失函数越小越好。优化器:用于调整权重和偏置,使损失函数最小化。优化器决定了参数的调整方式。误差反传(
星辰瑞云
·
2025-03-01 17:08
机器学习
cnn
pytorch
搜索赋能:大型语言模型的知识增强与智能提升
由于
训练
数据的局限性,LLM无法获取最新的知识,也无法涵盖所有领域的专业知识。为了克服这些局限性,LLM需要依赖外部搜索来增强性能和保证输出结果的可靠性。
听吉米讲故事
·
2025-03-01 17:36
语言模型
人工智能
自然语言处理
搜索引擎
【探商宝】DeepSeek开源周第四弹:双向流水并行与专家负载均衡技术解析
引言在千亿级大模型
训练
领域,计算资源利用率与通信效率是制约
训练
速度的核心瓶颈。
探熵科技
·
2025-03-01 15:19
数据分析
人工智能
基于 Pytorch 的全卷积网络人脸表情识别:从数据到部署的实战之旅
前言:本文将详细介绍基于Pytorch框架,利用全卷积网络进行人脸表情识别的完整过程,涵盖从数据集的准备、模型的设计与
训练
,再到模型的部署与预测,通过代码实现以及详细讲解,帮助读者深入理解并掌握这一技术
那年一路北
·
2025-03-01 14:16
Pytorch理论+实践
pytorch
网络
人工智能
YOLOv8 赋能道路状况检测:革新交通基础设施监测
检测原理(二)相较于传统方法的优势二、YOLOv8在道路状况检测中的具体应用实例(一)裂缝检测(二)坑洼检测(三)积水检测三、基于YOLOv8的道路状况检测流程(一)图像采集(二)数据预处理(三)模型
训练
与评估
他是只猫
·
2025-03-01 14:15
YOLOv8
在交通领域的应用
YOLO
目标跟踪
人工智能
yolo位姿估计实验
目录介绍实验过程2.1数据集下载2.2模型和数据配置文件修改2.3模型
训练
参考链接1.介绍1.1简介YOLOv8-Pose是基于YOLOv4算法的姿势估计模型,旨在实现实时高效的人体姿势估计。
jarreyer
·
2025-03-01 14:15
YOLO
.net机器学习框架:ML.NET模型生成器
ML.NETModelBuilder是一个直观的图形化VisualStudio扩展,用于构建、
训练
和部署自定义机器学习模型。
NotOnlyCoding
·
2025-03-01 13:41
AI编程
Meta:基于数据关系的LLM高效预
训练
标题:Data-EfficientPretrainingwithGroup-LevelDataInfluenceModeling来源:arXiv,2502.14709摘要数据高效的预
训练
已显示出提高缩放定律的巨大潜力
大模型任我行
·
2025-03-01 12:37
大模型-模型训练
人工智能
自然语言处理
语言模型
论文笔记
西工大航海学院,新一代电子信息复试资料911电子版!资料全
点此获取资料:https://www.yiwanma.com/product/view1679.html911大纲与真题信号检测与估值知识点总结数字信号处理本校PPT数字信号处理真题和本校期末
考试
题数字信号处理知识点与问答题纸质资料拍照汇总通信原理
weixin_aaa722509
·
2025-03-01 12:06
电子信息复试资料
西工大航海学院
大模型
训练
与微调(4)——Top-k 和 Top-p 采样策略介绍
大模型
训练
与微调(4)——Top-k和Top-p采样策略介绍**一、Top-k采样****1.核心思想****2.数学实现****3.示例****4.特点****二、Top-p(Nucleus)采样**
John_今天务必休息一天
·
2025-03-01 12:33
自然语言处理
深度学习
算法
python
chatgpt
人工智能
单卡挑战千亿模型!深度求索MoE架构实战指南:从理论到开源工具全解析
引言:为什么需要单GPU
训练
千亿参数模型?随着大模型参数规模突破千亿级别,
训练
成本与算力需求呈指数级增长。传统密集架构(DenseModel)在单卡
训练
中面临显存不足、计算效率低等问题。
小诸葛IT课堂
·
2025-03-01 11:27
架构
代码随想录算法
训练
营day47(0215)
开始单调栈,我记得这个第一题我某次笔试就遇到过1.每日温度题目739.每日温度给定一个整数数组temperatures,表示每天的温度,返回一个数组answer,其中answer[i]是指对于第i天,下一个更高温度出现在几天后。如果气温在这之后都不会升高,请在该位置用0来代替。示例1:输入:temperatures=[73,74,75,71,69,72,76,73]输出: [1,1,4,2,1,1
Lazy.land
·
2025-03-01 08:00
算法
yolov5-
训练
好的模型部署的几种方式-ONNX
ONNX所针对的是深度学习开发生态中最关键的问题之一,在任意一个框架上
训练
的神经网络模型,无法直接在另一个框架上用。开发者需要耗费大量时间精力把模型从一个开发平台移植到另一个。
黄晓魚
·
2025-03-01 08:30
halcon3d
PCL点云处理
深度神经网络
YOLO
C#
python
上一页
11
12
13
14
15
16
17
18
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他