E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
2018寒假训练
大模型之二十七-语音识别Whisper实例浅析
Whisper简介Whisper是OpenAI于2022年9月开源的一个多语种识别模型,目前支持99种语言,是目前性能最好的开源多语种识别ASR大模型,第一版版使用了68万小时标注好的语料预
训练
模型,而
shichaog
·
2025-02-27 01:55
神经网络&人工智能
语音识别
whisper
人工智能
深入解析 DeepSeek R1:强化学习如何驱动大模型推理能力的进化
引言在AI竞赛日益激烈的时代,DeepSeek-AI推出了DeepSeekR1,试图以强化学习(RL)直接
训练
推理能力,而非仅依赖传统的监督微调(SFT)。
海棠AI实验室
·
2025-02-26 23:07
智元启示录
人工智能
deep
learning
DeepSeek-R1
深度学习批次数据处理的理解
基础介绍在计算机视觉深度学习网络中,在
训练
阶段数据输入通常是一个批次,即不是一次输入单张图片,而是一次性输入多张图片,而神经网络的结构内部一次只能处理一张图片,这时候很自然就会考虑为什么要这样的输入?
_DCG_
·
2025-02-26 22:28
计算机视觉
深度学习
人工智能
编译 Linux 4.15.11 内核并增加系统调用
编译Linux4.15.11内核并增加系统调用实验日期;
2018
年3月21日-
2018
年3月22日实验环境:主机:操作系统:MicrosoftWindows10.0.16299Build16299处理器
Isolarae
·
2025-02-26 21:22
医院HIS接入大模型:算力基础设施与
训练
能力的深度剖析与测算
一、引言1.1研究背景与意义在数字化医疗快速发展的当下,医院信息系统(HospitalInformationSystem,HIS)作为医疗信息化的核心枢纽,承载着患者诊疗信息、医院运营管理等关键数据,对提升医疗服务质量、优化医院管理流程起着至关重要的作用。然而,传统HIS在面对日益增长的医疗数据量和复杂的临床需求时,逐渐显露出分析决策能力不足、智能化程度低等短板。随着人工智能技术的飞速发展,大模型
Allen_LVyingbo
·
2025-02-26 21:52
数智化医院2025
健康医疗
人工智能
动态规划
python
论文笔记:Enhancing Sentence Embeddings in Generative Language Models
——>需要较大的
训练
批次,这会消耗大量的计算资源一些前沿的工作将焦点转向了最近开发的生成模型,期望利用其先进的文本理解能力,直接对输入句子进行编码,而无需额外的反向传播由于句子表示和自回归语言建模
UQI-LIUWJ
·
2025-02-26 20:17
论文阅读
语言模型
人工智能
DeepSeek-V3:最强开源MoE模型的技术解析与使用指南
目录引言模型概览架构创新:负载均衡策略与
训练
目标预
训练
:追求极致的
训练
效率后
训练
:从DeepSeek-R1进行知识蒸馏模型下载评估结果基础模型标准基准测试上下文窗口聊天模型标准基准测试(大于67B的模型
认识祂
·
2025-02-26 19:10
deepseek
开源
deepseek
Python算法学习: 2020年蓝桥杯省赛模拟赛-Python题解
答案:
2018
填空题2问题描述将LANQIAO中
普通Gopher
·
2025-02-26 19:07
Python算法
DeepSeep开源周,第三天:DeepGEMM是啥?
矩阵乘法(GEMM)是深度学习模型的核心运算(如全连接层、卷积层等),其性能直接影响
训练
和推理效率。
程序员差不多先生
·
2025-02-26 19:33
pytorch
从零开始:使用PyTorch构建DeepSeek R1模型及其
训练
详解
本文将引导你使用PyTorch从零开始构建DeepSeekR1模型,并详细解释模型架构和
训练
步骤。
陆鳐LuLu
·
2025-02-26 19:02
pytorch
人工智能
python
什么是RAG?RAG是如何解决问题的?RAG的未来发展趋势有哪些?
二、为什么会出现RAGRAG的出现,是因为在大模型的广泛应用中,伴随着出现的一些问题,比如:知识的局限性:模型自身的知识完全源于它的
训练
数据,而现有的主流大模
大模型综述
·
2025-02-26 18:31
人工智能
开发语言
大模型
AGI
ai
RAG
自然语言处理
202年
寒假
充电计划——自学手册 网络安全(黑客技术)
前言什么是网络安全网络安全可以基于攻击和防御视角来分类,我们经常听到的“红队”、“渗透测试”等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行,因为不知如何去学,在这里,我将这个整份答案分为黑客(网络安全)入门必备、黑客(网络安全)职业指南、黑客(网络安全)学习导航三大章节,涉及价值观、方法论、执行力、行业分类、职位解读、法
网安康sir
·
2025-02-26 18:00
web安全
安全
网络
python
linux
DeepSeek 开源周:DeepEP 项目详解,GPU 压榨计划启动!
本文将详细介绍DeepEP的功能、应用场景以及如何使用它来提升AI
训练
和推理的效率。DeepEP概述功能与作用DeepEP是一个专门针对Mixture-of-Experts(
东方佑
·
2025-02-26 18:29
量子变法
开源
一文读懂 AI 大模型备案:万字详解全流程要点
它确保大模型在整个生命周期,从开发、
训练
到部署和应用,都严格遵循相关法律
chuangfumao
·
2025-02-26 17:25
人工智能
DeepSeek各模型现有版本对比分析
文章目录一、基础模型系列:V1到V3的演进二、专用模型系列:推理与多模态三、版本选型与商业化趋势DeepSeek作为最近特别火爆的模型,本文将对DeepSeek现有的主要版本进行对比分析,涵盖参数规模、
训练
数据
墨染夜雨笺
·
2025-02-26 17:22
DeepSeek
AI
正则化技术和模型融合等方法提高模型的泛化能力
正则化技术原理正则化是通过在损失函数中添加一个正则化项,来限制模型的复杂度,防止模型过拟合
训练
数据,从而提高模型在未见过数据上的泛化能力。
小赖同学啊
·
2025-02-26 15:36
人工智能
人工智能
蓝桥杯备赛-基础
训练
(三)哈希表 day16
今天一更赎金信题意:给定一个赎金信(ransom)字符串和一个杂志(magazine)字符串,判断第一个字符串ransom能不能由第二个字符串magazines里面的字符构成。如果可以构成,返回true;否则返回false。(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)注意:你可以假设两个字符串均只含有小写
清墨璃笙
·
2025-02-26 14:28
蓝桥杯
散列表
算法
数据结构
python
202年
寒假
充电计划——自学手册 网络安全(黑客技术)
前言什么是网络安全网络安全可以基于攻击和防御视角来分类,我们经常听到的“红队”、“渗透测试”等就是研究攻击技术,而“蓝队”、“安全运营”、“安全运维”则研究防御技术。如何成为一名黑客很多朋友在学习安全方面都会半路转行,因为不知如何去学,在这里,我将这个整份答案分为黑客(网络安全)入门必备、黑客(网络安全)职业指南、黑客(网络安全)学习导航三大章节,涉及价值观、方法论、执行力、行业分类、职位解读、法
网安康sir
·
2025-02-26 14:28
web安全
安全
网络
php
开发语言
全市场大模型分类及对比分析报告
2.大模型分类根据模型架构、
训练
目标和应用领域,全市场的
早退的程序员
·
2025-02-26 13:53
分类
数据挖掘
人工智能
零基础学习机器学习分类模型
模型
训练
和评估:使用经典的分类算法——逻辑回归。代码解释:逐步分析代码实现。拓展内容:如何优化和扩展该项目。1.原理介绍1.1机器学习基本概念机器学习(
可喜~可乐
·
2025-02-26 12:14
机器学习
机器学习
学习
分类
人工智能
数据挖掘
训练
神经网络出现nan
在理解和修改QARV的代码时,出现了
训练
会因为nan而终止的问题,因此学习记录。
崧小果
·
2025-02-26 11:12
AI学习记录
神经网络
深度学习
机器学习
复试英文准备方法
为了高效准备计算机领域的英文文献翻译面试,可以按照以下步骤进行系统
训练
,重点提升专业术语积累、文献结构理解和即时翻译能力:一、核心能力针对性
训练
专业术语速记建立术语库:-每天整理《算法导论》《人工智能:
小王Jacky
·
2025-02-26 11:12
计算机英语
英语
计算机英语
深度求索DeepSeek:AI大模型的全域应用与技术突破
其基于DeepSeek-R1系列大模型的创新架构,以600万美元的超低
训练
成本(仅为OpenAI同类模型的1/30)3,在自然语言处理、逻辑推理、多模
量子纠缠BUG
·
2025-02-26 11:11
DeepSeek部署
DeepSeek
AI
人工智能
easyui
前端
AI人工智能机器学习之监督线性模型
监督学习是一种机器学习任务,其中模型在已标记的数据集上进行
训练
。线性模型是一类通过线性组合输入特征来进行预测的模型。线性模型的基本形式可
rockfeng0
·
2025-02-26 09:57
人工智能
机器学习
sklearn
Yolov8分割
训练
自己的数据集记录
Yolov8分割
训练
自己的数据集记录第一章、标签制作一、安装labelmelabelme安装很简单,直接在终端输入:pipinstalllabelme启用labelme在终端输入:labelme接下来就是标注数据了
小俊俊的博客
·
2025-02-26 08:21
yolov8
分割
训练自己的数据集
【深度学习】PYTORCH框架中采用
训练
数据“CIFAR-10”实现RESNET50
一、ResNet网络结构二、基本块三、RESNET50代码实现resnet50.pyimporttorchimporttorch.nnasnnfromtorch.nnimportfunctionalasFclassResNet50BasicBlock(nn.Module):def__init__(self,in_channel,outs,kernerl_size,stride,padding):s
别出BUG求求了
·
2025-02-26 08:20
深度学习
深度学习
pytorch
cifar-10
resnet50
神经网络
详细介绍人工智能学习框架
人工智能学习框架是开发者用于构建、
训练
和部署机器学习模型的核心工具。
日记成书
·
2025-02-26 08:16
反正看不懂系列
人工智能
YOLOv8实例分割
训练
自己的数据集
转载https://blog.csdn.net/m0_51530640/article/details/1299752571.利用labelme进行数据标注1.1Labelme安装方法首先安装Anaconda,然后运行下列命令:####################forPython2####################condacreate--name=labelmepython=2.7s
NoContours
·
2025-02-26 08:14
YOLO
python
开发语言
总结yolov8做检测
训练
时所需要的代码
运行模型
训练
脚本代码:大家可以先在ultralytics/ultralytics文件夹下新建一个mytrain.py,然后直接复制下面的代码,所有
训练
有关的超参数都可以在这个文件中调节,不懂超参数可以忽略
小胡学长
·
2025-02-26 08:13
YOLO
人工智能
深度学习
yolov8
python
1024程序员节
Qwen2.5 技术报告
与之前的迭代相比,Qwen2.5在预
训练
和后
训练
阶段都有显著的改进。在预
训练
方面,将高质量的预
训练
数据集从之前的7万亿个token扩展到18万亿个token,为常识、专家知识和推理能力提供坚实的基础。
三谷秋水
·
2025-02-26 07:11
大模型
机器学习
人工智能
语言模型
机器学习
人工智能
代码随想录算法
训练
营Day57 | 拓扑排序精讲、dijkstra(朴素版)精讲
文章目录117.软件构建思路与重点47.参加科学大会思路与重点117.软件构建题目链接:117.软件构建讲解链接:代码随想录状态:一遍AC。思路与重点概括来说,给出一个有向图,把这个有向图转成线性的排序就叫拓扑排序。拓扑排序也是图论中判断有向无环图的常用方法。拓扑排序模板题。#include#include#include#includeusingnamespacestd;intmain(){in
Harryline-lx
·
2025-02-26 06:01
代码随想录
算法
代码随想录算法
训练
营第58天|拓扑排序精讲、dijkstra(朴素版)精讲
打卡Day581.拓扑排序精讲2.dijkstra(朴素版)精讲1.拓扑排序精讲题目链接:拓扑排序精讲文档讲解:代码随想录给出一个有向图,把这个有向图转成线性的排序就叫拓扑排序。拓扑排序要检测这个有向图是否有环,即存在循环依赖的情况,因为这种情况是不能做线性排序的。所以拓扑排序是图论中判断有向无环图的常用方法。拓扑排序的过程,有两步,第一步,找到入度为0的节点,加入结果集;第二步,将该节点从图中移
Yinems
·
2025-02-26 05:57
算法
DeepSeek的开源之路:一文读懂从V1-R1的技术发展,见证从开源新秀到推理革命的领跑者
随着模型规模的不断扩大,算力需求呈指数级增长,
训练
成本飙升,而性能提升的边际收益却逐渐递减,形成了所谓的“ScalingLaw”瓶颈。
·
2025-02-26 05:05
算法
DeepSeek Coder
以下是对该模型的详细分析:模型背景与特点模型规模与
训练
数据:DeepSeekCoder系列模型从头开始
训练
,覆盖了超过80种编程语言,总参数量从1B到33B不等,其中包含基础版和指令调优版。
百态老人
·
2025-02-26 05:24
人工智能
大数据
笔记
深度求索:解析DeepSeek R1与V3模型的技术差异
深度求索:解析DeepSeekR1与V3模型的技术差异引言模型定位与核心能力DeepSeekV3应用场景及示例DeepSeekR1应用场景及示例模型架构与
训练
方法DeepSeekV3的架构特点DeepSeekR1
walkskyer
·
2025-02-26 05:53
AI探索
deepseek
deepseek-r1
deepseek-v3
【百问百答系列】-全面了解Transformer(未来发展)
但随着一个一个问题的深入探究,从它的基本概念、原理架构,到如何
训练
、模型优化,再到其广泛的应用领域以及充满潜力的未来发展,我对它的理解也越来越深刻。
什么都想学的阿超
·
2025-02-26 04:51
原理概念
#
深度学习
transformer
深度学习
人工智能
基于深度学习的行人跌倒检测系统:UI 界面 + YOLOv5 + 数据集详解
目录引言系统设计概述数据集准备数据集选择数据预处理data.yaml文件模型选择与
训练
YOLOv5介绍模型
训练
步骤用户界
深度学习&目标检测实战项目
·
2025-02-26 03:45
深度学习
ui
YOLO
目标检测
人工智能
大模型是如何蒸馏像Qwen-7B,Llama-3 这种小模型的?
2.蒸馏数据的使用与模型归属蒸馏技术的作用:DeepSeek将自研大模型(如DeepSeek-R1)生成的80万条高质量解题数据(称为“蒸馏数据”)用于
训练
Qwen、Llam
闫哥大数据
·
2025-02-26 03:12
大模型
llama
人工智能
DeepSeek动态增量学习技术详解与实战指南
一、主题背景1.Why:破解模型持续进化难题传统全量
训练
模式面临三大困境:金融风控场景中,每周新增百万级欺诈样本时,全量
训练
耗时从3小时增至8小时(数据量年增长300%)医疗影像诊断模型遇到新病症类型时
燃灯工作室
·
2025-02-26 02:09
Deepseek
人工智能
机器学习
数据挖掘
GLake:优化GPU内存管理与IO传输的开源项目
GLake:突破GPU内存和IO瓶颈的利器在人工智能快速发展的今天,大模型
训练
和推理正面临着严峻的挑战。
2401_87458718
·
2025-02-26 02:35
开源
DeepSeek技术解析:降本增效的“双刃剑”如何重塑AI产业?
正面影响分析算力需求与成本大幅降低DeepSeek通过算法优化(如稀疏计算、知识蒸馏)和模型压缩技术,将云端
训练
算力需求降至传统大模型的35%,车端推理芯片需求减少至65%。
爱吃青菜的大力水手
·
2025-02-26 01:29
人工智能
DeepSeek:突破闭源封锁,引领大模型新时代
然而,大模型的
训练
和部署往往面临着硬件依赖性强、成本高昂、效率低下等挑战。DeepSeek的出现,为解决这些问题提供了全新的思路和方案。
fanstinmsl
·
2025-02-26 01:59
算法
语言模型
Pytorch:以CIFAR-10分类为例,给出了神经网络的
训练
流程
下面给出了神经网络的
训练
流程,包括数据加载与预处理、网络定义、损失函数和优化器定义、网络
训练
和网络测试。
Xiao_Ya__
·
2025-02-25 23:49
深度学习
pytorch
pytorch
分类
神经网络
梯度累加(结合DDP)梯度检查点
梯度累加目的梯度累积是一种
训练
神经网络的技术,主要用于在内存有限的情况下处理较大的批量大小(batchsize)。
糖葫芦君
·
2025-02-25 23:16
LLM
算法
人工智能
大模型
深度学习
支持向量机(Support Vector Machine,SVM)
这个间隔被定义为支持向量到超平面的最短距离,而支持向量就是那些恰好位于间隔边缘上的
训练
样本点。
不易撞的网名
·
2025-02-25 23:15
支持向量机
算法
机器学习
Tensorflow2.x框架-神经网络八股扩展-acc曲线与loss曲线
目录摘要一、acc曲线与loss曲线二、完整代码摘要loss/loss可视化,可视化出准确率上升、损失函数下降的过程一、acc曲线与loss曲线history=model.fit(
训练
集数据,
训练
集标签
诗雨时
·
2025-02-25 23:15
DeepSeek强化学习(Reinforcement Learning)基础与实践
引言强化学习(ReinforcementLearning,RL)是机器学习的一个重要分支,专注于
训练
智能体(Agent)在环境中通过试错来学习最优策略。
Evaporator Core
·
2025-02-25 23:44
强化学习
#
DeepSeek快速入门
人工智能
python
数据库
tornado
强化学习
deepseek
团体程序设计天梯赛-练习集——L1-052
2018
我们要赢
前言这个题看题目有点年代感了,
2018
是有啥大事来着吗?
SY师弟
·
2025-02-25 23:14
GPLT天梯赛
算法
c语言
数据结构
c++
PTA
GPLT
团体程序设计天梯赛
第三讲-神经网络八股
一、搭建神经网络六部法tf.keras搭建神经网络六部法1、import相关模块 2、train,test #
训练
集、测试集3、model=tf.keras.models.Sequential #逐层搭建网络结构
loveysuxin
·
2025-02-25 22:38
Tensorflow
tensorflow
神经网络八股(3)
梯度爆炸是指梯度在方向传播过程中逐渐变大,权重参数更新变化较大,导致损失函数的上下跳动,导致
训练
不稳定可以使用一些合理的损失函数如relu,leakRelu,归一化处理,batchnorm,确保神经元的输出值在合理的范围内
SylviaW08
·
2025-02-25 22:37
神经网络
人工智能
深度学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他