E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
碎片化学JUC
从零开始:用Python手写神经网络
从图像识别到自然语言处理,再到强
化学
习,神经网络的身影无处不在。然而,对于许多初学者来说,神经网络似乎是一个神秘而复杂的黑盒子。
WHCIS
·
2025-02-11 08:27
python
神经网络
开发语言
人工智能
深度学习
算法
AI分支知识之机器学习,深度学习,强
化学
习的关系
机器学习,深度学习,强
化学
习的关系这一篇文章我们来探讨下AI领域中机器学习(ML)、深度学习(DL)和强
化学
习(RL)的关系。
王钧石的技术博客
·
2025-02-11 08:55
大模型
人工智能
机器学习
深度学习
强
化学
习关键技术:重要性采样深度剖析
目录一、引言二、重要性采样基本原理(一)什么是重要性采样(二)重要性采样在强
化学
习中的作用三、判断采样好坏的方法(一)偏差(Bias)(二)方差(Variance)(三)有效样本数量(EffectiveSampleSize
进一步有进一步的欢喜
·
2025-02-11 08:21
强化学习
概率论
机器学习
人工智能
重要性采样
DeepSeek R1为什么能
DeepSeekR1模仿人类思考方式的核心在于其纯强
化学
习训练方式,这种方式更接近人类通过试错和反馈来学习的过程。与GPT等传统模型依赖大量标注数据进行监督学习不同,Dee
森焱森
·
2025-02-11 03:48
人工智能
算法
大模型入门(六)—— RLHF微调大模型
2)训练奖励模型奖励模型是输入一个文本序列,模型给出符合人类偏好的奖励数值,这个奖励数值对于后面的强
化学
习训练非常重要。构建奖励模型的训练数据一般是同一个数据用不同的语言模型生成结果,然后人工打分。
LLM.
·
2025-02-10 23:17
人工智能
语言模型
机器学习
自然语言处理
LLM
大模型
RLHF
开源和闭源的故事
闭源拿出藏在兜里的cracker,把自己敲成
碎片
,然后找出破碎的心脏,把它反编译一下,变成一碗血糊交给JAVA老祖,JAVA老祖没有去吃。最终JAV
okgoood
·
2025-02-10 09:55
java
汽车自动驾驶AI
决策系统:基于感知数据,AI通过深度学习、强
化学
习等算法进行路径规划和决策控制。例如,利用
pps-key
·
2025-02-10 07:00
人工智能
汽车
自动驾驶
Python web —— Selenium 库
Selenium:硒,一种
化学
元素。Selenium是Python下第三方浏览器自动化工具。
五道口纳什
·
2025-02-10 06:19
web
大模型学习笔记 - LLM 对齐优化算法 DPO
训练的目标是语言模型损失,任务是nexttokenprediction,生成的token不可控,为了让大模型能生成符合人类偏好的答案(无毒无害等)一般都会进行微调和人类对齐,通常采用的方法是基于人类反馈的强
化学
习方法
JL_Jessie
·
2025-02-10 03:54
学习
笔记
算法
LLM
一切皆是映射:域适应在DQN中的研究进展与挑战
1.背景介绍1.1深度强
化学
习与域适应的邂逅深度强
化学
习(DeepReinforcementLearning,DRL)在近年来取得了瞩目的成就,从Atari游戏到围棋,再到机器人控制,其强大的学习能力令人惊叹
AI天才研究院
·
2025-02-10 00:33
计算
AI大模型企业级应用开发实战
ChatGPT
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读
文章目录前言一、摘要二、引言三、贡献1.贡献后训练:基础模型的大规模强
化学
习蒸馏:较小的模型也可以很强大2.评估结果概览reasoningtasksknowledgeohters四、方法1.Overview2
tangjunjun-owen
·
2025-02-09 23:54
paper解读
DeepSeek
R1
DeepSeek
zero
大语言模型
DeepSeek-R1 原理解析及 Linux 本地部署详细教程
二、DeepSeek-R1原理解析2.1强
化学
习训练DeepSeek-R1系列模型借助强
化学
习进行训练,这是其具备强大推理能力的
power-辰南
·
2025-02-09 12:05
人工智能
linux
deepseek
大模型
语言模型
人工智能
构建一个学习助手Agent:提升学习效率的实践
这个项目源于我们一个教育团队的真实需求-提升学习效率,优
化学
习体验。
Ethan独立开发
·
2025-02-09 07:33
人工智能
AI
ai
agent
一文搞懂DeepSeek - 开源模型R1
其纯强
化学
习的训练方法、开源与低成本的特性以及技术创新使得DeepSeek-R1成为了AI领域的一颗新星。**在多个基准测试中,DeepSeek-R1的表现优于或接近OpenAIo1。
程序员辣条
·
2025-02-09 01:12
开源
人工智能
Agent
大模型
大模型教程
大模型项目
DeepSeek
DQN深度强
化学
习:CartPole倒立摆任务(完整代码)
DQN(DeepQ-Network,深度Q网络)是Q-Learning的深度学习扩展,通过神经网络替代Q表的方式来解决高维状态空间问题(例如图像输入),开启了深度强
化学
习时代。它在2013年由Dee
林泽毅
·
2025-02-08 21:45
强化学习
深度学习
DQN
QLearning
训练实战
深度强化学习
人工智能
Deepseek成功启示:从 TRPO 到 GRPO训练LLM
本文将深入探讨LLMs的训练过程,特别是强
化学
习(ReinforcementLearning,RL)(深度解析DeepSeekR1:强
化学
习与知识蒸馏的协同力量)在这一领域的应用,从TRP
大模型之路
·
2025-02-08 20:03
强化学习
大模型(LLM)
人工智能
LLM
强化学习
deepseek
GRPO
TRPO
食品添加剂的200个常见种类
在调味领域,食品中使用的“科技与狠活”主要指一些
化学
物质或技术手段,用于改善食品的味道、口感或香气。
.NET跨平台
·
2025-02-08 19:30
人生
程序员健康知识
食品安全
构建一个学习助手Agent:提升学习效率的实践
这个项目源于我们一个教育团队的真实需求-提升学习效率,优
化学
习体验。
·
2025-02-08 19:31
人工智能机器学习
机器学习模型创建的数学原理
1模型工作原理机器学习学习模型主要分为监督学习、无监督学习、半监督学习和强
化学
习,本文聚焦探讨目前应用最为广泛的监督学习问题,下午如未特殊指明,机器学习特指有监督学习机器学习。
HadesZ~
·
2025-02-08 15:04
机器学习笔记
机器学习
算法
人工智能
一切皆是映射:强
化学
习在医疗诊断中的应用:挑战与机遇
《一切皆是映射:强
化学
习在医疗诊断中的应用:挑战与机遇》关键词强
化学
习,医疗诊断,图像识别,数据预处理,算法优化摘要随着医疗技术的发展,医疗诊断的准确性和效率越来越受到关注。
AI天才研究院
·
2025-02-08 07:28
AI大模型企业级应用开发实战
Python实战
DeepSeek
R1
&
大数据AI人工智能大模型
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
DeepSeek-R1深度报告:基于Python强
化学
习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享
【DeepSeek-R1深度报告:基于Python强
化学
习的前沿长链推理模型揭秘与实战——兼谈SEO优化与实用经验分享】配合此文章使用,效果更佳:DeepSeek-R1深度报告——50道相关面试题——深刻理解相关概念
快撑死的鱼
·
2025-02-08 05:19
算法工程师面试宝典(面试必备)
python
搜索引擎
开发语言
JUC
学习笔记01
文章目录
JUC
笔记什么是
JUC
线程和进程LOCK第一版,无线程锁保护资源:第二版,传统的synchronized方案第三版,
JUC
中的LOCK来保护资源问题:锁到底是什么?怎么判断锁的是谁?
亭台烟雨中
·
2025-02-08 05:19
Java
学习
笔记
java
异步
DeepSeek模型与OpenAI模型原理和技术架构的异同分析
DeepSeek模型与OpenAI模型原理和技术架构的异同分析一、模型原理(一)DeepSeekR1DeepSeekR1的核心原理是基于强
化学
习(RL)的训练方式,其创新之处在于不依赖任何监督微调(SFT
程序猿000001号
·
2025-02-08 04:10
DeepSeek
大模型
画
化学
结构式用InDraw,6个功能很实用
一、自主研发、中文界面InDraw结构式编辑器,是国内首个自主研发的全功能
化学
结构式编辑器。大家再也不用四处找破解版软件/汉化版软件,中文界面,操作友好。
小鹰-上海鹰谷-电子实验记录本
·
2025-02-08 01:22
鹰谷InDraw
化学结构式
化学编辑器
C++, STL容器 array:固定大小数组深度解析
文章目录引言一、设计哲学与底层实现1.1零抽象成本的封装1.2性能特征二、内存优化实践2.1缓存友好性对比2.2内存
碎片
防护三、高级内存管理技巧3.1精准内存对齐3.2内存复用模式四、工程实践指南4.1
智驾
·
2025-02-08 00:46
C/C++
c++
开发语言
array
【论文阅读】DeepSeek-R1:通过强
化学
习激励LLMs的推理能力 | DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via RL
DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearningDeepSeek-R1:通过强
化学
习激励LLMs的推理能力
AI天才研究院
·
2025-02-07 22:05
DeepSeek
R1
&
大数据AI人工智能大模型
DeepSeek
计算
论文阅读
deepseek
agi
ai
llm
agent
cot
探秘PCB
钻孔完成后,需要对孔壁进行处理,如
化学
镀铜,使孔壁具有良好的导电性,确保电流能够在不同层之间顺畅传输
华高电路
·
2025-02-07 18:10
人工智能
制造
pcb工艺
深入浅出 DeepSeek-Coder-V2 是如何打破闭源模型封锁的
今天,我们就从模型架构、训练数据、强
化学
习优化三
fertiland
·
2025-02-07 17:33
人工智能
深度学习
SRMT:一种融合共享记忆与稀疏注意力的多智能体强
化学
习框架
在人工智能(AI)和强
化学
习(RL)领域的发展进程中,长期记忆维持和决策优化一直是核心技术难点。传统强
化学
习模型在经验回溯方面存在局限性,这显著制约了其在复杂动态环境中的应用效果。
·
2025-02-07 13:28
事务特征以及隔离级别,rabbitmq实战
原子在
化学
反应中不可分割,也就是说原子是最小单位,
澎湖Java架构师
·
2025-02-06 23:01
程序员
面试
java
后端
[论文笔记] Deepseek技术报告
1.总体概述背景与目标报告聚焦于利用强
化学
习(RL)提升大型语言模型(LLMs)的推理能力,旨在探索在不依赖大规模监督微调(SFT)的情况下,模型如何自我进化并形成强大的推理能力。
心心喵
·
2025-02-06 22:53
论文笔记
论文阅读
人工智能
跟三叔一起学manim——初识Manim
目录前言什么是Manim一个例子参考资料前言很多人把数学当成一门人类纯思维活动的学科,这是不对的,数学和物理,
化学
等学科一样,也是一门实验性学科,像计算圆周率的蒲丰投针法和蒙特卡罗法就是非常具有代表性的数学试验
三行数学
·
2025-02-06 16:44
跟三叔一起学manim
python
manim
它在强
化学
习中的作用是什么?
“若要得到救赎,必先承受痛苦。”作者主页:追光者♂个人简介:[1]计算机专业硕士研究生[2]2023年城市之星领跑者TOP1(哈尔滨)[3]2022年度博客之星人工智能领域TOP4[4]阿里云社区特邀专家博主[5]CSDN-人工智能领域优质创作者无限进步,一起追光!!!
追光者♂
·
2025-02-06 14:34
百题千解计划(项目
实战
案例)
Record
StudyRecord
postgraduate
Master
WorkRecord
深度Q网络
强化学习
深度学习与搜索引擎优化的结合:DeepSeek的创新与探索
目录引言1.传统搜索引擎的局限性2.深度学习在搜索引擎中的作用3.DeepSeek实现搜索引擎优化的关键技术3.1神经网络与搜索引擎优化3.2自然语言处理与查询理解3.3深度强
化学
习与搜索结果排序4.DeepSeek
云边有个稻草人
·
2025-02-06 10:37
热门文章
深度学习
搜索引擎
人工智能
DeepSeek
JUC
并发编程 常用锁 三个辅助类的使用
JUC
并发编程就是多线程的进阶版,所以很多多线程没写到的会在这里写到目录并发和并行的区别Lock锁公平锁和非公平锁Lock锁使用复习synchronized锁和lock锁区别防止虚假唤醒的方法conditioncondition
Andrew0219
·
2025-02-06 10:06
java基础知识
juc
多线程
AI协助探索AI新构型自动化创新的技术实现
一、AI自进化架构的核心范式1.元代码生成与模块化重构-代码级自编程:基于神经架构搜索的强
化学
习框架,AI可通过生成元代码模板(框架的抽象层定义)自动组合功能模块。
liron71
·
2025-02-06 10:35
人工智能
自动化
神经网络
国家超算平台上线DeepSeek - R1系列模型:开启AI新征程
它用了强
化学
习训练,推理的时候会反复思考验证,思维链能有好几万字长。在数学、代码编写和复杂逻辑推理这些方面,表现相当厉害
CodeJourney.
·
2025-02-06 08:25
数据库
人工智能
算法
人工智能
AI大模型探秘:核心能力与应用场景深度解析
AI:包含很多术语,如:模式识别、自然语言处理、神经网络、机器学习、深度学习、强
化学
习、人类反馈强
化学
习等。类比:AI是电力–吴恩达。
程序员辣条
·
2025-02-06 08:53
人工智能
java
AI大模型
大模型
spring
DeepSeek-R1:通过强
化学
习提升大型语言模型推理能力的探索
DeepSeek-R1:通过强
化学
习提升大型语言模型推理能力的探索在人工智能领域,大型语言模型(LLMs)的发展日新月异,其在自然语言处理和生成任务中的表现逐渐接近人类水平。
kaichu2
·
2025-02-06 03:07
论文翻译
DeepSeek
用deepseek制作我的第一个长视频---使用AI解决尝试新领域没有经验拖延的问题!
以下是为你定制的「从零到成品」全流程指南,结合叙事逻辑、剪辑技巧和效率工具,帮你把
碎片
素材变成有感染力的作品。一、明确核心主题:先有灵魂,再有骨架关键问题:你希望这个视频传递什么情绪或观点?
imblackcat
·
2025-02-06 02:37
音视频
人工智能
系统通解:超多视角理解
从物理世界的运动现象,到
化学
反应的进程,再到材料在受力时的响应,这些系统的行为往往由一系列数学方程来刻画。
进一步有进一步的欢喜
·
2025-02-06 00:20
复变函数
信号与系统
学霸带你游戏化增强学习动力奖励与挑战助力成长
将兴趣转化为动力游戏
化学
习通过将学习过程设计得更具吸引力和互动性,帮助学习者从兴趣中获得动力,并持续投入学习。这种方式借助游戏元素让枯燥的学习变得富有挑战和乐趣,从而激发学习潜力。
Snow Hide(雪诺海德)
·
2025-02-05 18:10
纽雪澳诺加海美德
学霸挺拔
学霸挺拔
游戏化学习
动力提升
学习效率
兴趣驱动
机器学习在金融领域的应用
个性化服务需求1.2机器学习的兴起1.2.1大数据时代的到来1.2.2计算能力的提升1.2.3算法的不断创新2.核心概念与联系2.1机器学习的定义与分类2.1.1有监督学习2.1.2无监督学习2.1.3强
化学
习
AI天才研究院
·
2025-02-05 17:01
大数据AI人工智能
AI大模型企业级应用开发实战
计算
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
LLM 算法工程师的速成指南:微调、强
化学
习微调与偏好微调
OpenAI近期在直播中,提到了两个新的概念:①强
化学
习微调(ReinforcementFine-Tuning):仅需少量高质量数据(数十到数千个),模型即可通过强
化学
习处理复杂任务。
大模型玩家
·
2025-02-05 16:24
算法
机器学习
深度学习
chatgpt
人工智能
ai
大模型
一切皆是映射:元学习中的神经架构搜索(NAS)
元学习神经架构搜索NAS遗传算法强
化学
习演化算法一切皆是映射:元学习中的神经架构搜索(NAS)在人工智能的广阔领域中,神经架构搜索(NeuralArchitectureSearch,简称NAS)是一颗璀璨的明星
杭州大厂Java程序媛
·
2025-02-05 16:22
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
JVM-垃圾回收器和垃圾回收算法
parallelscavenge垃圾回收器、cms垃圾回收器、g1垃圾回收器parallelscavenge垃圾回收器是jdk1.8默认的垃圾回收器:使用复制算法cms垃圾回收器:使用标记清除算法,会从产生内存
碎片
ohoy
·
2025-02-05 14:33
其他
jvm
算法
2025 年 YOLO 十大未来应用场景
识别建筑物倒塌、火灾、
化学
泄漏等危险区域。通过5G/卫星通信向救援队传输检测信息。技术突破点:提高YOLO在低光照、烟雾、
碎片
遮挡环境下的识别能力。结合热成像和3
ymchuangke
·
2025-02-05 12:23
yolov5学习笔记
YOLO
机器学习,深度学习,神经网络,深度神经网络
深度学习的算法又分很多种,比较典型的四种:卷积神经网络—CNN,循环神经网络—RNN,生成对抗网络—GANs,深度强
化学
习—RL。机器学习和深度学习的
武昌库里写JAVA
·
2025-02-05 12:52
面试题汇总与解析
java
学习
开发语言
课程设计
spring
boot
机器学习之决策树!决策树算法实战:葡萄酒品质预测
这个数据集包含了葡萄酒的各种
化学
成分和物理特性,
风清扬雨
·
2025-02-05 12:18
人工智能
机器学习
算法
决策树
python
DeepSeek-R1全面超越OpenAI o1:开源大模型训练范式革新
OpenAI早期专注于强
化学
习(RL),但在Transformer结构问世后,迅速调整方向,借助Google的开源研究开发出强大的LLM。然而,尽
·
2025-02-05 02:16
前端javascript
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他