E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
对话系统&强化学习
[论文笔记] Deepseek技术报告
1.总体概述背景与目标报告聚焦于利用
强化学习
(RL)提升大型语言模型(LLMs)的推理能力,旨在探索在不依赖大规模监督微调(SFT)的情况下,模型如何自我进化并形成强大的推理能力。
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
它在
强化学习
中的作用是什么?
“若要得到救赎,必先承受痛苦。”作者主页:追光者♂个人简介:[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步,一起追光!!!
追光者♂
·
2025-02-06 14:34
百题千解计划(项目
实战
案例)
Record
StudyRecord
postgraduate
Master
WorkRecord
深度Q网络
强化学习
深度学习与搜索引擎优化的结合:DeepSeek的创新与探索
目录引言1.传统搜索引擎的局限性2.深度学习在搜索引擎中的作用3.DeepSeek实现搜索引擎优化的关键技术3.1神经网络与搜索引擎优化3.2自然语言处理与查询理解3.3深度
强化学习
与搜索结果排序4.DeepSeek
云边有个稻草人
·
2025-02-06 10:37
热门文章
深度学习
搜索引擎
人工智能
DeepSeek
AI协助探索AI新构型自动化创新的技术实现
一、AI自进化架构的核心范式1.元代码生成与模块化重构-代码级自编程:基于神经架构搜索的
强化学习
框架,AI可通过生成元代码模板(框架的抽象层定义)自动组合功能模块。
liron71
·
2025-02-06 10:35
人工智能
自动化
神经网络
国家超算平台上线DeepSeek - R1系列模型:开启AI新征程
它用了
强化学习
训练,推理的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑推理这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
AI大模型探秘:核心能力与应用场景深度解析
AI:包含很多术语,如:模式识别、自然语言处理、神经网络、机器学习、深度学习、
强化学习
、人类反馈
强化学习
等。类比:AI是电力–吴恩达。
程序员辣条
·
2025-02-06 08:53
人工智能
java
AI大模型
大模型
spring
DeepSeek-R1:通过
强化学习
提升大型语言模型推理能力的探索
DeepSeek-R1:通过
强化学习
提升大型语言模型推理能力的探索在人工智能领域,大型语言模型(LLMs)的发展日新月异,其在自然语言处理和生成任务中的表现逐渐接近人类水平。
kaichu2
·
2025-02-06 03:07
论文翻译
DeepSeek
机器学习在金融领域的应用
个性化服务需求1.2机器学习的兴起1.2.1大数据时代的到来1.2.2计算能力的提升1.2.3算法的不断创新2.核心概念与联系2.1机器学习的定义与分类2.1.1有监督学习2.1.2无监督学习2.1.3
强化学习
AI天才研究院
·
2025-02-05 17:01
大数据AI人工智能
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
LLM 算法工程师的速成指南:微调、
强化学习
微调与偏好微调
OpenAI近期在直播中,提到了两个新的概念:①
强化学习
微调(ReinforcementFine-Tuning):仅需少量高质量数据(数十到数千个),模型即可通过
强化学习
处理复杂任务。
大模型玩家
·
2025-02-05 16:24
算法
机器学习
深度学习
chatgpt
人工智能
ai
大模型
一切皆是映射:元学习中的神经架构搜索(NAS)
元学习神经架构搜索NAS遗传算法
强化学习
演化算法一切皆是映射:元学习中的神经架构搜索(NAS)在人工智能的广阔领域中,神经架构搜索(NeuralArchitectureSearch,简称NAS)是一颗璀璨的明星
杭州大厂Java程序媛
·
2025-02-05 16:22
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
机器学习,深度学习,神经网络,深度神经网络
深度学习的算法又分很多种,比较典型的四种:卷积神经网络—CNN,循环神经网络—RNN,生成对抗网络—GANs,深度
强化学习
—RL。机器学习和深度学习的
武昌库里写JAVA
·
2025-02-05 12:52
面试题汇总与解析
java
学习
开发语言
课程设计
spring
boot
DeepSeek-R1全面超越OpenAI o1:开源大模型训练范式革新
OpenAI早期专注于
强化学习
(RL),但在Transformer结构问世后,迅速调整方向,借助Google的开源研究开发出强大的LLM。然而,尽
·
2025-02-05 02:16
前端javascript
OpenAI 模型与 DeepSeek 模型使用的
强化学习
有何不同
OpenAI模型与DeepSeek模型使用的
强化学习
有何不同阅读时长:15分钟发布时间:2025-02-04近日热文:全网最全的神经网络数学原理(代码和公式)直观解释欢迎关注知乎和公众号的专栏内容LLM
·
2025-02-04 18:02
人工智能
LangChain教程 - 系列文章
LangChain允许将语言模型、提示模板、输出解析器等组件进行无缝集成,同时支持链式调用和复杂任务的处理,适用于
对话系统
、内容生成、翻译等多种场景。
花千树-010
·
2025-02-04 16:56
LangChain
langchain
人工智能
机器学习
AI编程
AIGC
java
spring
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模
强化学习
(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-04 14:27
后端java
人工智能机器学习基本概念详解
本文将详细探讨机器学习的基本概念,包括监督学习、无监督学习、
强化学习
及其应用示例。一、机器学习的基本概念1.1数据数据是机器学习的基础。机器学习模型通过分析数据来识别模式和
猿享天开
·
2025-02-04 13:07
人工智能基础知识学习
机器学习
人工智能
LlamaIndex架构设计:大模型长期记忆模块竟暗藏图数据库玄机
随着人工智能技术的不断发展,大型语言模型(LLM)已经在自然语言处理、文本生成、
对话系统
等领域取得了显著的进展。
威哥说编程
·
2025-02-04 08:52
数据库
llama
DeepSeek- R1 原理介绍
DeepSeek-R1是由DeepSeek公司推出的一款基于
强化学习
(RL)的开源推理模型,其核心原理和特点如下:1.核心技术与架构
强化学习
驱动:DeepSeek-R1是首个完全通过
强化学习
训练的大型语言模型
kcarly
·
2025-02-04 08:50
大模型知识乱炖
杂谈
DeepSeek
R1
原理介绍
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模
强化学习
(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
老马啸西风
·
2025-02-04 06:04
java
构建由局部观测、分布式决策与全局奖励协同作用的多智能体
强化学习
系统
传统的单智能体
强化学习
(RL)模型难以直接适用于这种场景,因此需要多智能体
强化学习
(MARL)的方法。1.2将问题转化为部分可观测马尔可夫决策过
由数入道
·
2025-02-04 05:30
分布式
强化学习
智能体
机器学习笔记——特征工程、正则化、
强化学习
本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍
强化学习
。
好评笔记
·
2025-02-04 00:48
机器学习笔记
机器学习
人工智能
AI
AI编程
算法工程师
DeepSeek R1 AI 论文翻译
DeepSeek-R1-Zero是一个通过大规模
强化学习
(RL)训练的模型,且在此过程中未使用监督微调(SFT)作为预处理步骤,展现出了显著的推理能力。
·
2025-02-03 20:09
后端java
AIGC与虚拟身份及元宇宙的未来:虚拟人物创作与智能交互
云边有个稻草人-CSDN博客目录引言一、AIGC在元宇宙中的作用1.1AIGC与虚拟人物创作1.1.1生成虚拟人物外观1.1.2个性化虚拟角色设计1.2AIGC与虚拟角色的行为与交互1.2.1行为生成与
强化学习
云边有个稻草人
·
2025-02-03 19:38
热门文章
AIGC
算法
笔记
Reinforcement Learning 通过
强化学习
激励大型语言模型的推理能力
主要技术:1.
强化学习
(RL)核心是
强化学习
技术,像训练小狗一样,当模型做出正确的推理步骤或得到正确的
davenian
·
2025-02-03 18:56
评论
语言模型
人工智能
深度学习
DeepSeek
基于“蘑菇书”的
强化学习
知识点(一):奖励函数(Reward Function)和价值函数(Value Function)的区别
奖励函数(RewardFunction)和价值函数(ValueFunction)的区别摘要1.定义与目标奖励函数(RewardFunction)价值函数(ValueFunction)2.核心区别3.具体示例场景:迷宫导航问题(1)奖励函数的设计(2)价值函数的计算对比结果4.关系与协同作用总结摘要本系列知识点讲解基于蘑菇书EasyRL中的内容进行详细的疑难点分析!具体内容请阅读蘑菇书EasyRL!
墨绿色的摆渡人
·
2025-02-03 17:20
基于“蘑菇书”的强化学习知识点
强化学习
蘑菇书
初入机器学习
也为大家提供一些个人的思考一切仅供参考概念辨析深度学习:本质是建模,将训练得到的模型作为系统的一部分使用侧重于发现样本集中隐含的规律难点是认识并了解模型,合理设置初始模型,要对建模对象有比较深刻的认识依赖大量的准确训练样本
强化学习
辰尘_星启
·
2025-02-03 14:54
机器学习
人工智能
深度学习
python
mxnet
基于CNN(一维卷积Conv1D)+LSTM+Attention 实现股票多变量时间序列预测(PyTorch版)
食品饮料、运动健身、交通运输、环境科学、社交媒体以及文本和图像处理等诸多领域,讨论了各种复杂的深度神经网络思想,如卷积神经网络、循环神经网络、生成对抗网络、门控循环单元、长短期记忆、自然语言处理、深度
强化学习
矩阵猫咪
·
2025-02-03 12:42
cnn
lstm
pytorch
注意力机制
卷积神经网络
长短期记忆网络
Attention
DeepSeek-R1,DeepSeek-V3,DeepSeek-VL,DeepSeek-V2,DeepSeek-R1-Zero各个模型区别
3.模型参数与规模4.应用场景5.性能表现6.发布时间7.价格1.各个模型架构DeepSeek-R1:未明确有特殊架构说明,但属于推理模型,可能在Transformer架构基础上针对推理做了优化,通过
强化学习
训练实现大量反思和验证
fpga和matlab
·
2025-02-03 01:12
前言技术汇集
#
人工智能
大模型
DeepSeek
强化学习
中的关键模型与算法:从Actor-Critic到GRPO
强化学习
中的关键模型与算法:从Actor-Critic到GRPO
强化学习
中的Actor-Critic模型是什么?这与生成对抗网络(GANs)十分相似。
·
2025-02-02 22:14
人工智能
【Legged Gym】Legged Gym训练参数详解与自定义任务实现
LeggedGym训练参数详解与自定义任务实现在进行机器人
强化学习
训练时,LeggedGym提供了一套灵活的参数配置系统,以适应不同的训练需求和环境。
啵啵啵啵哲
·
2025-02-02 19:28
人工智能
监督学习、无监督学习和
强化学习
的特点和应用场景
在机器学习中,监督学习、无监督学习和
强化学习
是三种核心的学习范式,它们各自具有独特的特点和应用场景。
BugNest
·
2025-02-02 16:03
AI
学习
ai
机器学习
人工智能
AI在虚拟客户服务中的应用:提供24_7支持
AI在虚拟客户服务中的应用:提供24/7支持关键词:虚拟客服,自然语言处理(NLP),聊天机器人,
对话系统
,深度学习,用户支持,自动化1.背景介绍随着互联网和移动互联网的迅速发展,客户服务成为各大企业提升竞争力的重要环节
AI大模型应用之禅
·
2025-02-02 15:29
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
柳暗花明又一村:Seq2Seq编码器解码器架构
从机器翻译到文本摘要,从
对话系统
到问答机器人,Seq2Seq编码器-解码器架构在众多NLP任务中展现出强大的能力。传统的机器翻译方法通常依赖于统计模型和规则引擎,难以捕捉语言的复杂性和语义关系。
AI大模型应用之禅
·
2025-02-02 15:29
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
LSTM 网络在
强化学习
中的应用
LSTM网络在
强化学习
中的应用关键词:LSTM、
强化学习
、时序依赖、长期记忆、深度Q网络、策略梯度、Actor-Critic摘要:本文深入探讨了长短期记忆(LSTM)网络在
强化学习
领域的应用。
AI天才研究院
·
2025-02-02 14:23
LLM大模型落地实战指南
AI大模型应用入门实战与进阶
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
【llm
对话系统
】大模型 Llama 源码分析之并行训练方案
1.引言训练大型语言模型(LLM)需要巨大的计算资源和内存。为了高效地训练这些模型,我们需要采用各种并行策略,将计算和数据分布到多个GPU或设备上。Llama作为当前最流行的开源大模型之一,其训练代码中采用了多种并行技术。本文将深入Llama的训练代码,分析其并行训练方案,主要关注参数并行和部分结构参数共享。2.并行训练策略概述常见的并行训练策略包括:数据并行(DataParallelism,DP
kakaZhui
·
2025-02-02 13:14
llama
人工智能
AIGC
chatgpt
【llm
对话系统
】大模型 Llama 源码分析之 LoRA 微调
1.引言微调(Fine-tuning)是将预训练大模型(LLM)应用于下游任务的常用方法。然而,直接微调大模型的所有参数通常需要大量的计算资源和内存。LoRA(Low-RankAdaptation)是一种高效的微调方法,它通过引入少量可训练参数,固定预训练模型的权重,从而在保持性能的同时大大减少了计算开销。本文将深入分析LoRA的原理,并结合Llama源码解读其实现逻辑,最后探讨LoRA的优势。2
kakaZhui
·
2025-02-02 13:14
llama
深度学习
pytorch
AIGC
chatgpt
【llm
对话系统
】大模型 Llama 源码分析之 Flash Attention
1.写在前面近年来,基于Transformer架构的大型语言模型(LLM)在自然语言处理(NLP)领域取得了巨大的成功。Transformer的核心组件是自注意力(Self-Attention)机制,它允许模型捕捉输入序列中不同位置之间的关系。然而,标准的自注意力机制的计算复杂度与序列长度的平方成正比,这使得它在处理长序列时效率低下。为了解决这个问题,FlashAttention被提出,它是一种高
kakaZhui
·
2025-02-02 13:43
llama
人工智能
AIGC
chatgpt
【llm
对话系统
】大模型 Llama、Qwen 和 ChatGLM 的网络结构和训练方法对比
1.引言近年来,大型语言模型(LLM)取得了令人瞩目的进展,其中Llama、Qwen和ChatGLM是三个备受关注的开源模型。它们都在Transformer架构的基础上进行了改进和优化,并在各种NLP任务上取得了优异的性能。本文将深入分析Llama、Qwen和ChatGLM的网络结构和训练方法,比较它们的异同以及各自的优势。2.模型结构对比特性LlamaQwenChatGLM基础架构Decoder
kakaZhui
·
2025-02-02 07:54
llama
人工智能
AIGC
chatgpt
python
Java 大视界 -- Java 大数据中的
强化学习
算法实践与优化 (57)
亲爱的朋友们,热烈欢迎来到青云交的博客!能与诸位在此相逢,我倍感荣幸。在这飞速更迭的时代,我们都渴望一方心灵净土,而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识,也期待你毫无保留地分享独特见解,愿我们于此携手成长,共赴新程!一、欢迎加入【福利社群】点击快速加入:青云交灵犀技韵交响盛汇福利社群点击快速加入2:2024CSDN博客之星创作交流营(NEW)二、本博客的精华专栏:大数据新视
青云交
·
2025-02-02 05:40
大数据新视界
Java
大视界
大数据
强化学习算法
Q-learning
经验回放
探索利用平衡
智能能源管理
算法优化
机器学习笔记——特征工程
本笔记介绍机器学习中常见的特征工程方法、正则化方法和简要介绍
强化学习
。
好评笔记
·
2025-02-01 21:56
补档
机器学习
人工智能
论文阅读
AIGC
transformer
深度学习
面试
DeepSeek R1本地化部署与联网功能实战指南:从零搭建智能
对话系统
前言在人工智能技术快速发展的今天,如何将先进的对话模型DeepSeekR1部署到本地环境并赋予其联网能力,成为许多开发者和企业关注的重点。本文将深入讲解完整的本地化部署流程,并通过实例代码演示如何为模型添加实时网络访问功能。一、环境准备与基础架构1.1硬件需求推荐配置:NVIDIAGPU(RTX3090或更高)+32GB内存+50GB存储空间最低配置:CPU(支持AVX2指令集)+16GB内存+3
Coderabo
·
2025-02-01 18:32
python
DeepSeek
R1
【AI人工智能】DeepSeek R1:你需要知道的一切
我们将在本博客中介绍的关于DeepSeekR1的所有你需要知道的一切内容,请坚持认真读完,必有收获:DeepSeekR1简要概述主要特点与能力开源与可访问性模型架构
强化学习
训练变体与精简模型使用案例与应用从专有模型迁移到开源模型
大名顶顶
·
2025-02-01 17:22
人工智能
人工智能
AI
DeepSeek
程序员
计算机
编程
开源
DeepSeek R1 简易指南:架构、培训、本地部署和硬件要求
该研究突破性地采用
强化学习
(ReinforcementLearning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。
·
2025-02-01 16:49
前端javascript
机器学习-期末复习题
给人脸打上标签再让模型进行学习训练的方法,属于()
强化学习
B.半监督学习C.监督学习D.无监督学习在机器学习中,用计算机处理一副图像,维度是:上万维B.二维C.三维D.一维以下关于降维的说法不正确的是
泡椒鸡jo
·
2025-02-01 15:32
期末复习
机器学习
python
(25-4-01)基于本地知识库的自动问答系统(LangChain+ChatGLM+ModelScope/Huggingface部署): 构建和部署
对话系统
(1)
13.3.4构建和部署
对话系统
文件jina_serving.py定义了一个名为KnowledgeBasedChatLLM的类,用于初始化模型配置、加载文件、检索问题答案等操作。
码农三叔
·
2025-02-01 15:02
《NLP算法实战》
训练
RAG
多模态)
langchain
python
自然语言处理
语言模型
bert
文心一言
Huggingface
【大模型应用开发 动手做AI Agent】Plan and Solve策略的提出
【大模型应用开发动手做AIAgent】Plan-and-Solve策略的提出关键词:大模型,AIAgent,Plan-and-Solve,智能体,策略学习,
强化学习
,自然语言处理1.背景介绍随着人工智能技术的飞速发展
杭州大厂Java程序媛
·
2025-02-01 14:22
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
「DeepSeek接班OpenAI」,最新开源的R1推理模型,让AI圈爆了
多阶段训练:创新的模型架构DeepSeek-R1的训练方式采用了多阶段循环的策略,具体包括基础训练、
强化学习
(RL)、微调等多个阶段。这
人工智能学家
·
2025-02-01 06:23
人工智能
DeepSeek R1:AI领域的新标杆
此外,R1-Zero模型通过
强化学习
和测试时计算实现了强大的推理能力,无需监督微调数据,标志着中国在AI领域的快速崛起,挑战美国的主导地位。AI模型在推理能
XianxinMao
·
2025-02-01 06:23
人工智能
Transformer模型结构分析:Encoder、Decoder以及注意力机制详解
禅与计算机程序设计艺术1.简介Transformer模型由论文[1]提出,其基本思想是使用注意力机制代替循环神经网络(RNN)或卷积神经网络(CNN),是一种基于序列到序列(Seq2seq)的机器翻译、文本摘要、
对话系统
等任务的成功范例
AI天才研究院
·
2025-02-01 04:59
Python实战
大数据AI人工智能
自然语言处理
人工智能
语言模型
编程实践
开发语言
架构设计
Hindsight Experience Replay (HER) 算法
HindsightExperienceReplay(HER)算法简介HindsightExperienceReplay(HER)是一种
强化学习
中的技术,旨在解决稀疏奖励问题,特别适用于目标导向的任务(例如机器人控制
C7211BA
·
2025-01-31 23:25
算法
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他