E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习算法(RL)
解读 DeepSeek 关键
RL
算法 GRPO
DeepSeekGRPO:面向超大规模RLHF的梯度正则化策略优化算法引言在当下人工智能蓬勃发展的浪潮里,DeepSeek无疑是一颗耀眼的明星,频繁出现在各类科技前沿讨论中,热度持续攀升。从惊艳的模型表现,到不断拓展的应用场景,DeepSeek正以强劲之势重塑着行业格局。大家不难发现,无论是复杂的自然语言处理任务,还是充满挑战的智能推理难题,DeepSeek都能展现出卓越的性能。而这斐然成绩的背后
进一步有进一步的欢喜
·
2025-02-26 08:16
LLM
算法
DeepSeek
GRPO
深度求索:解析DeepSeek R1与V3模型的技术差异
DeepSeekR1与V3模型的技术差异引言模型定位与核心能力DeepSeekV3应用场景及示例DeepSeekR1应用场景及示例模型架构与训练方法DeepSeekV3的架构特点DeepSeekR1的
强化
学习策略性能表现与基准测试
walkskyer
·
2025-02-26 05:53
AI探索
deepseek
deepseek-r1
deepseek-v3
OpenAI: 人工智能领域的领军企业
自成立以来,OpenAI在自然语言处理、计算机视觉、
强化
学习等多个人工智能领域取得了突破性进展,推出了一系列广受关注的AI模型和产品。OpenAI的发展历程OpenAI由埃隆·马斯克、山姆
2401_87458718
·
2025-02-26 02:35
人工智能
基于“蘑菇书”的
强化
学习知识点(十三):第三章的代码:MonteCarlo.ipynb及其涉及的其他代码的更新以及注解(gym版本 >= 0.26)(一)
第三章的代码:MonteCarlo.ipynb及其涉及的其他代码的更新以及注解(gym版本>=0.26)(一)摘要摘要本系列知识点讲解基于蘑菇书EasyRL中的内容进行详细的疑难点分析!具体内容请阅读蘑菇书EasyRL!对应蘑菇书附书代码——MonteCarlo.ipynb在MonteCarlo.ipynb目录下面创建envs文件夹,然后下载racetrack.py和track.txt放到envs
墨绿色的摆渡人
·
2025-02-26 01:32
基于“蘑菇书”的强化学习知识点
强化学习
蘑菇书
DeepSeek
强化
学习(Reinforcement Learning)基础与实践
引言
强化
学习(ReinforcementLearning,
RL
)是机器学习的一个重要分支,专注于训练智能体(Agent)在环境中通过试错来学习最优策略。
Evaporator Core
·
2025-02-25 23:44
强化学习
#
DeepSeek快速入门
人工智能
python
数据库
tornado
强化学习
deepseek
支持向量机 (Support Vector Machine, SVM)
支持向量机(SupportVectorMachine,SVM)支持向量机(SVM)是一种广泛应用于分类、回归分析以及异常检测的监督
学习算法
。
数维学长986
·
2025-02-25 22:38
支持向量机
算法
机器学习
机器学习笔记——特征工程
本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍
强化
学习。
好评笔记
·
2025-02-25 22:37
补档
机器学习
笔记
人工智能
AIGC
深度学习
计算机视觉
面试八股
论文学习3:深度学习增强的光声成像(PAI)的最新进展(综述)
2.DL方法的原理介绍DL的子集:监督学习、无监督学习和
强化
学习。详细说明代表性DL架构:卷积神经网络(CNN)、U-形神经网络(U-Net)和
superace7911
·
2025-02-25 15:50
基于机器学习的光声图像处理
机器学习
图像处理
网关类设备技术演进思路
身份验证和访问控制:
强化
用户身份验证,确保只有授权用户可以访问网关。固件和软件安全更新:支
看兵马俑的程序员
·
2025-02-25 13:03
网闸
安全
初学者推荐学习AI的路径
学习人工智能的路径可以分为基础知识、编程技能、机器学习、深度学习、数据处理与可视化、自然语言处理(NLP)、计算机视觉(CV)、
强化
学习、实践项目和持续学习几个阶段。
ProgramHan
·
2025-02-25 09:05
学习
人工智能
时序大模型:技术需求、现有成果及主流模型、模型架构、数据处理方式、优势、缺点及未来展望
数据清洗:去除异常值:通过统计方法或机器
学习算法
检测并去除异常值,确保数据的合理性。填补缺失值:使用插值方法、均值填充、中位数填充或基于模型的预测
xl.liu
·
2025-02-25 07:50
架构
人工智能
深度学习与搜索引擎优化的结合:DeepSeek的创新与探索
目录引言1.传统搜索引擎的局限性2.深度学习在搜索引擎中的作用3.DeepSeek实现搜索引擎优化的关键技术3.1神经网络与搜索引擎优化3.2自然语言处理与查询理解3.3深度
强化
学习与搜索结果排序4.DeepSeek
m0_74825634
·
2025-02-25 01:37
面试
学习路线
阿里巴巴
深度学习
搜索引擎
人工智能
用人类反馈微调大模型,InstructGPT 让 GPT-3 脱胎换骨
接着,我们收集模型输出的排名数据集,使用人类反馈
强化
学习对这个经过监督学习训练的模型进
·
2025-02-24 23:50
人工智能
软考高项备考技巧
分阶段备考:将备考过程分为不同的阶段,如基础学习阶段、
强化
训练阶段和冲刺复习阶段。每个阶段都有明确的学习目标和任务,确保备考过程有条不紊。
chengxuyuan1213_
·
2025-02-24 19:26
职场和发展
DeepSeek 和 Qwen 模型快速部署指南
模型大小总参数量6710亿(671B),MoE架构,每个token激活370亿参数总参数量与V3相当,基于DeepSeek-V3-Base,采用类似的MoE架构训练方法包含预训练、监督微调(SFT)和
强化
学习
moton2017
·
2025-02-24 18:47
深度学习
运维
模型部署
DeepSeek
Qwen
大型语言模型
LLM
人工智能
AI
采购模块需求文档
为提升采购管理效能,降低采购成本,
强化
供应链协同运作,实现采购流程的数字化、智能化转型,特开展采
nbsaas-boot
·
2025-02-24 14:54
java
前端
数据库
AI环境初识
它提供了强大的张量计算能力和灵活的架构,支持广泛的机器学习和深度
学习算法
。PyTorch:由Facebook推出,也是一个广受欢迎的开源机器学习库。PyTorc
网络飞鸥
·
2025-02-24 07:02
AI
人工智能
Android仿人人客户端(v5(2)
@OverrideprotectedvoidsetupView(){mTopNavbar=(TopNavbar)findViewById(R.id.
rl
_top_navbar);mWebView=(WebView
2401_87555477
·
2025-02-24 04:42
android
harmonyos
华为
金融大模型应用的机遇与挑战
大模型本质特征大模型通常指大语言模型(LargeLanguageModel,LLM),是基于深度
学习算法
的自然语言处理技术,是通用大模型。
Python程序员罗宾
·
2025-02-24 03:34
金融
人工智能
语言模型
数据库
自然语言处理
SVM(支持向量机)原理及数学推导全过程详解
本来想着总结得简洁明了又易懂,但SVM本就有严格的数学理论支撑,不像其他机器
学习算法
是一个黑箱,写完发现要尽量让小白也懂少不了具体的论述
子木呀
·
2025-02-24 02:59
支持向量机
人工智能
分类算法
SVM
【机器学习】支持向量机(SVM)详解:原理与优化
非线性分类与支持向量3.优缺点分析3.1优点3.2缺点4.SVM与其他算法的比较5.总结支持向量机(SVM)详解1.基本概念支持向量机(SupportVectorMachine,SVM)是一种强大的监督
学习算法
宸码
·
2025-02-24 02:28
机器学习
模式识别
支持向量机
机器学习
算法
人工智能
数据挖掘
python
深度
强化
学习算法
在金融交易决策中的优化应用【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域:金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具:Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容:金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
算法与数据
·
2025-02-24 01:22
算法
机器学习基础
了解机器学习的基本概念,如监督学习、无监督学习、
强化
学习、模型评估指标(准确率、召回率、F1分数等)。
dringlestry
·
2025-02-23 21:50
机器学习
人工智能
AI人工智能常见的专业术语
模型(model):计算机层面的认知
学习算法
(learningalgorithm),从数据中产生模型的方法数据集(dataset):一组记录的集合示例(instance):对于某个对象的描述样本(sample
奇华智能
·
2025-02-23 19:10
人工智能
大模型
ChatGPT
LLM
AI
通俗理解Test time Scaling Law、
RL
Scaling Law和预训练Scaling Law
一、ScalingLaw解释1、预训练阶段的ScalingLaw(打地基阶段)通俗解释:就像建房子时,地基越大、材料越多、施工时间越长,房子就能盖得越高越稳。核心:通过堆资源(算力、数据、模型参数)让AI变得更聪明。具体含义:在预训练阶段(比如训练GPT这种大模型),模型的表现取决于三个核心因素:模型参数(房子的“大小”):神经元越多,模型越“聪明”。数据量(砖头的“数量”):喂给模型的文本越多,
老A的AI实验室
·
2025-02-23 16:12
#
【LLM】
人工智能
chatgpt
深度学习
LLM
agi
算法
RL
人工智能:从基础到前沿
2.2人工智能的历史2.3人工智能的分类3.机器学习3.1机器学习概述3.2监督学习3.3无监督学习3.4
强化
学习4.深度学习4.1深度学习概述4.2神经网络基础4.3卷积神经网络(CNN)4.4循环神经网络
顾漂亮
·
2025-02-23 12:15
人工智能
深度学习
windows
深入浅出机器学习:概念、算法与实践
目录引言机器学习的基本概念什么是机器学习机器学习的基本要素机器学习的主要类型监督学习(SupervisedLearning)无监督学习(UnsupervisedLearning)
强化
学习(ReinforcementLearning
倔强的小石头_
·
2025-02-23 11:43
AI
机器学习
算法
人工智能
【机器
学习算法
选型:分类与回归】 常见分类算法介绍
第2节:常见分类算法介绍在机器学习中,分类算法是用于预测一个样本所属类别的工具。无论是在金融风控、医疗诊断、图像识别还是推荐系统等领域,分类算法都扮演着至关重要的角色。不同的分类算法各自有不同的优缺点和应用场景,因此了解这些算法的特点及其适用条件,是构建高效分类模型的关键。1.逻辑回归(LogisticRegression)介绍逻辑回归是一种广泛应用于二分类问题的线性模型,其目标是根据输入特征预测
云博士的AI课堂
·
2025-02-23 11:37
哈佛博后带你玩转机器学习
机器学习
分类
回归
分类与回归
机器学习算法选型
深度学习
人工智能
ε-贪心算法:在探索与利用之间寻找平衡
ε-贪心算法:在探索与利用之间寻找平衡在
强化
学习领域,智能体需要在环境中采取行动以最大化累积奖励。这个过程涉及到两个关键的决策因素:探索(exploration)和利用(exploitation)。
Chen_Chance
·
2025-02-23 09:22
贪心算法
算法
使用Scikit-Learn决策树:分类问题解决方案指南
决策树是一种强大的机器
学习算法
,能够根据输入数据的特征属性学习决策规则,并用于预测新数据的分类标签。
范范0825
·
2025-02-23 07:36
scikit-learn
决策树
分类
什么是机器学习?
机器
学习算法
是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为
学习算法
中涉及了大量的统计学理论,机器学习与推断统计学联系尤为密切,也被称为统计学习理论。
CM莫问
·
2025-02-23 05:53
机器学习模型
机器学习
人工智能
算法
机器学习,我们主要学习什么?
例如,1956年,达特茅斯会议标志着人工智能的诞生,机器学习作为其重要分支也开始受到关注1960年代:出现了早期的机器
学习算法
,如1967年诞生的K最近邻算法(KNN
悠然的笔记本
·
2025-02-23 05:22
机器学习
机器学习
IAR加入Zephyr项目成为银牌会员,
强化
对开源协作的承诺
全球领先的嵌入式系统开发软件解决方案供应商IAR宣布,正式加入Zephyr项目,成为银牌会员。Zephyr是由Linux基金会托管并广泛应用于嵌入式行业的开源实时操作系统(RTOS),已得到众多嵌入式领域的重要企业支持。此次合作充分彰显了IAR对开源社区的深度承诺,致力于为开发者提供专业级工具和解决方案,同时助力ZephyrRTOS在嵌入式开发领域的持续发展。Zephyr是一款轻量级的开源实时操作
电子科技圈
·
2025-02-22 20:12
IAR
开源
嵌入式硬件
物联网
mcu
iot
智能家居
设计模式
浅谈XDR---扩展检测与响应(Extended Detection and Response)
跨端点事件关联将EDR的粒度和丰富的安全上下文与XDR的基础设施分析结合在一起通过对端点和用户产生的风险进行风险分析并在本地
强化
创新,Bitdefender最大限度地减少了端点攻击
金州饿霸
·
2025-02-22 18:52
Big
Data
网络
C++:使用 SFML 创建
强化
学习迷宫场景
在
强化
学习中,迷宫通常作为一种环境,供智能体(Agent)在其中进行探索和学习。通过设计合适的环境,我们可以训练模型让其通过迷宫找到最优路径。
煤炭里de黑猫
·
2025-02-22 16:10
c++
开发语言
Python机器学习库之scikit-llm使用详解
概要Pythonscikit-llm库是一个用于机器学习的强大工具,它基于scikit-learn库并扩展了一些机器
学习算法
和功能,可以帮助开发者更轻松地进行机器学习模型的训练和评估。
Rocky006
·
2025-02-22 15:06
python
开发语言
DeepSeek赋能智能交通流量预测与优化:告别拥堵的未来
DeepSeek凭借其强大的时空预测模型和
强化
学习框架,为交通流量预测和信号优化提供了全新的解决方案。它能够整合多源数据,包括地磁传感
人工智能专属驿站
·
2025-02-22 13:19
计算机视觉
人工智能
直播美颜SDK的底层技术解析:图像处理与深度学习的结合
直播美颜SDK通过高效的图像处理技术和深度
学习算法
,使得用户在直播过程中可以获得更为自然、精致的美颜效果。
美狐美颜sdk
·
2025-02-22 11:29
美颜API
直播美颜SDK
美颜SDK
图像处理
深度学习
人工智能
美颜API
视频美颜SDK
直播美颜SDK
滤镜sdk
DeepSeek的架构设计
临港等多地超算中心构建混合集群,10万+GPU卡规模(含H100/A100等),通过自研RDMA网络实现μs级延迟能效优化:采用液冷+余热回收技术,PUE<1.1,算力密度达50kW/机柜故障自愈:基于
强化
学习的节点健康预测系统
程序猿000001号
·
2025-02-22 06:24
DeepSeek
架构设计
python运维怎么学
下面给大家介绍一下:1、学习编程不止是学习语法,需要
学习算法
(计算思维、解决问题的方法、编程思路)。何为计算思维:计算思维(ComputationalThinkin
你别管我了
·
2025-02-22 05:10
python数据分析
python
开发语言
数据分析
职场和发展
运维
Spark MLlib中的机器
学习算法
及其应用场景
SparkMLlib是ApacheSpark框架中的一个机器学习库,提供了丰富的机器
学习算法
和工具,用于处理和分析大规模数据。
Java资深爱好者
·
2025-02-21 20:47
深度学习
推荐算法
什么是语料清洗、预训练、指令微调、
强化
学习、内容安全; 什么是megatron,deepspeed,vllm推理加速框架
什么是语料清洗、预训练、指令微调、
强化
学习、内容安全目录什么是语料清洗、预训练、指令微调、
强化
学习、内容安全语料清洗预训练指令微调
强化
学习内容安全什么是megatron,deepspeed,vllm推理加速框架语料清洗语料清洗是对原始文本数据进行处理的过程
ZhangJiQun&MXP
·
2025-02-21 19:45
教学
2021
论文
2024大模型以及算力
人工智能
嵌入式人工智能应用-第四章 KNN 算法介绍 3
2.3距离计算2.4KNN算法特点2.5KNN算法流程3实验验证3.1实验代码-具体代码可以从附件下载3.2演示效果1KNN介绍K邻近(K-NearestNeighbors,KNN)是一种广泛使用的监督
学习算法
数贾电子科技
·
2025-02-21 16:17
嵌入式人工智能应用
人工智能
算法
linux
knn
初识pytorch
与机器
学习算法
的主要区别如下图所示:三、扩展1.使用场景1)图像识别和处理2)自然语言处理(NLP)3)音频处理4)视频分析5)游戏和仿真6)自动驾驶汽车7)
m0_73286250
·
2025-02-21 15:02
pytorch
人工智能
python
机器学习课程的常见章节结构
以下是机器学习课程的常见章节结构,结合了搜索结果中的信息:1.机器学习基础知识机器学习的定义与分类监督学习、无监督学习、半监督学习、
强化
学习机器学习的产生与发展机器学习的历史与现代应用经验误差与过拟合过拟合与欠拟合的概念及解决方案评估方法与性能度量交叉验证
zhangfeng1133
·
2025-02-21 14:24
机器学习
分类
学习
机器学习_18 K均值聚类知识点总结
K均值聚类(K-meansClustering)是一种经典的无监督
学习算法
,广泛应用于数据分组、模式识别和降维等领域。它通过将数据划分为K个簇,使得簇内相似度高而簇间相似度低。
数据媛
·
2025-02-21 14:53
机器学习
均值算法
聚类
python
scikit-learn
pandas
numpy
OpenCV机器学习(10)训练数据的一个核心类cv::ml::TrainData
它封装了样本数据、响应(标签)、样本权重等信息,并提供了多种方法来创建和操作这些数据,以适应不同的机器
学习算法
需求。主要功能数据准备:允许你从原始数据创建训练数据对象。支
村北头的码农
·
2025-02-21 10:19
OpenCV
opencv
机器学习
人工智能
机器学习(一) 本文(3万字) | 机器学习概述 |
机器学习)1.1特点1.2对象1.3目的1.4方法1.5步骤2.基本分类2.1监督学习2.1.1输入空间、特征空间和输出空间2.1.2概率分布2.1.3假设空间2.1.4问题的形式化2.2无监督学习2.3
强化
学习
小酒馆燃着灯
·
2025-02-21 08:05
机器学习
人工智能
深度学习
目标检测
vscode
pytorch
python
内容中台重构智能服务:人工智能技术驱动精准决策
通过整合自然语言处理、知识图谱构建与深度
学习算法
三大技术模块,该架构实现了从数据采集到决策输出的全链路智能化。
清风徐徐de来
·
2025-02-21 07:30
其他
【数据挖掘】ARFF格式与数据收集
【数据挖掘】ARFF格式与数据收集三级目录1.ARFF格式与数据收集2.稀疏数据3.属性类型4.缺失值与不正确的值5.了解数据6.知识表达7.聚类机器
学习算法
训练数据挖掘分析数据共享与交换三级目录1.ARFF
布鲁惠比寿
·
2025-02-20 23:04
数据挖掘
数据挖掘
人工智能
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他