E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习公开课
准备
早在2020年疫情期间,学校电教处周光杰主任在学校群里发出智慧作业抢题通知,我看了有些心动,一节微课相当于一次省级
公开课
,这对于我们普通老师是多么难得的机会啊。但想归想,我也不会用软件啊,再
胡珊珊乐平九小
·
2024-09-16 07:08
深度 Qlearning:在直播推荐系统中的应用
深度Q-learning:在直播推荐系统中的应用关键词:深度Q-learning,
强化学习
,直播推荐系统,个性化推荐1.背景介绍1.1问题的由来随着互联网技术的飞速发展,直播平台如雨后春笋般涌现。
AGI通用人工智能之禅
·
2024-09-16 02:27
程序员提升自我
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
Java
Python
架构设计
Agent
程序员实现财富自由
经济金融学
公开课
学习总汇(九)
本章内容:1.什么是金融风险2.什么是风险偏好与满意度,人都是风险厌恶吗3.单一投资还是多元投资4.无差别曲线金融风险:金融风险是指金融变量的各种可能值偏离期望的可能性以及幅度,所以风险不是说,一定会发生概率的亏损或者偏离回报,它也有可能发生超额的回报作为理财的投资人,我们一般只关注系统风险(经济环境不好造成房市大跌等)。还有非系统性风险(购买理财,卷款跑路等)。其中系统风险是可分散的风险;后者是
佳佳爱科技AITech
·
2024-09-15 23:59
OpenAI o1 的价值意义及“
强化学习
的Scaling Law” & Kimi创始人杨植麟最新分享:关于OpenAI o1新范式的深度思考
OpenAIo1的价值意义及“
强化学习
的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。
光剑书架上的书
·
2024-09-15 13:21
ChatGPT
大数据AI人工智能
计算
人工智能
算法
机器学习
探索未来,大规模分布式深度
强化学习
——深入解析IMPALA架构
探索未来,大规模分布式深度
强化学习
——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿
汤萌妮Margaret
·
2024-09-15 12:30
如何有效的学习AI大模型?
理论学习:机器学习基础:了解监督学习、非监督学习、
强化学习
等基本概念。深度学习:学习神经网络的基本结构,如卷
Python程序员罗宾
·
2024-09-14 15:37
学习
人工智能
语言模型
自然语言处理
架构
反思的魔力:用语言的力量强化AI智能体
然而,传统的
强化学习
方法如同一位严苛的训练师,需要大
步子哥
·
2024-09-14 08:52
人工智能
机器学习
公开课
,是选择学生的心灵,还是社会的好评?
远方,还有一缕阳光大教育家李镇西,在上完
公开课
后进行了一个反思,他说,“
公开课
是为了自己教学的完美而无视学生的精神自由,让学生成为自己表演的道具。而这样的教育,难道是我们应该提倡的吗?
文明未央
·
2024-09-13 23:21
周末小事
明天争取多练习几遍要讲的内容,争取做到烂熟于心,来应付后天的
公开课
,不管最后结果怎么样,总之,我觉得自己尽力了,最起码自己不会后悔。
林溪留痕
·
2024-09-13 14:15
2.0第一周检视(8/16-8/20)
本周精力感觉不足,总是犯困,每天也23点睡觉早上6点多会醒,但是醒来后还是感觉困,睡眠软件记录深眠只有1小时左右,午休做10分钟冥想补充精力;运动:两次美姿雅仪锻炼,一次晚上快走1W+2.学习:上了叶老师的财富
公开课
和
aeb1fe80c479
·
2024-09-13 13:43
公开课
上好
公开课
是一个教师教学能力的重要体现,是评各级名师、学科骨干教师、学科带头人的重要依据,也是职评考核重要指标。
悉数沉淀w
·
2024-09-13 13:38
代码随想录算法训练营第三十九天| 62. 不同路径,63. 不同路径 II
|LeetCode:62.不同路径_哔哩哔哩_bilibili《代码随想录》算法
公开课
开讲啦!快来打卡!
零offer在手
·
2024-09-13 07:18
算法
动态规划
图论
机器学习实战笔记5——线性判别分析
任务安排1、机器学习导论8、核方法2、KNN及其实现9、稀疏表示3、K-means聚类10、高斯混合模型4、主成分分析11、嵌入学习5、线性判别分析12、
强化学习
6、贝叶斯方法13、PageRank7、
绍少阿
·
2024-09-12 20:32
机器学习笔记
可视化
机器学习
python
人工智能
大模型的实践应用29-大语言模型的RLHF(人类反馈
强化学习
)的具体应用与原理介绍
大家好,我是微学AI,今天给大家介绍一下大模型的实践应用29-大语言模型的RLHF(人类反馈
强化学习
)的具体应用与原理介绍。
微学AI
·
2024-09-11 19:47
大模型的实践应用
语言模型
人工智能
自然语言处理
RLHF
书法心语
2016年之夏,某天我在住家附近走路,突然在街道边看到了“北京盛世兰亭书院”书法
公开课
的宣传海报。于是我记住了日子,在一个星期天到场听了书法课。我一下子像触电了,觉得禅宗所谓的“开悟”时刻到了。没有
仙泉
·
2024-09-11 09:27
坚定理想信念,锤炼党性修养
坚定理想信念,就要
强化学习
精神、自律精神、担当精神。思想理论上的坚定清醒是政治上坚定的前提,党员干部要始终把理论学习作为政治责任、事业需要和精神追求,积极参加组织
知涵知
·
2024-09-10 23:15
《兴奋的睡不着》坚持第922天原创分享(2017.06.17星期六)
《兴奋的睡不着》卓丽,坚持第922天原创分享(2017.06.17星期六):刘老师要来平顶山了,我们平顶山焦点团队的各位老师都开心的不得了,刘老师还特意给我们带来一节
公开课
,这是多么难得的机会呀,由于场地有限
半夏五月天
·
2024-09-10 20:10
python 物理引擎_在 Gym 上构建会动的人工智障1(python)
Gym是用于开发和比较
强化学习
算法的python包,但是我们也完全可以使用它来作为我们自己程序的应用背景,并提供可视化。
weixin_39542608
·
2024-09-09 19:30
python
物理引擎
记忆力培训与记忆课
昨天老徐拉我进了记忆
公开课
的群,研究了课程助理的工作流程之外,也读了群里提到的那本《世界记忆大师教我的超强记忆法》。先说一下这本书,看了前面一小半,联想记忆。
乌卓
·
2024-09-09 14:12
强化学习
(二)----- 马尔可夫决策过程MDP
1.马尔可夫模型的几类子模型大家应该还记得马尔科夫链(MarkovChain),了解机器学习的也都知道隐马尔可夫模型(HiddenMarkovModel,HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性),也就是指系统的下个状态只与当前状态信息有关,而与更早之前的状态无关。马尔可夫决策过程(MarkovDecisionProcess,MDP)也具有马尔可夫性,与上面不同的是MDP考虑了动作
Duckie-duckie
·
2024-09-09 06:37
机器学习
数据
数据分析
数据挖掘
机器学习
算法
Python
强化学习
,基于gym的马尔可夫决策过程MDP,动态规划求解,体现序贯决策
强化学习
过程中最典型的例子就是非线性二级摆系统,有4个关键值,小车受力,受力方向,摆速度,摆角,每个状态下都需要决策车的
baozouxiaoxian
·
2024-09-09 06:32
python
gym
qlearning
python
强化学习
mdp
动态规划求解
马尔科夫决策过程
终于结束了
心都快提到嗓子眼里了一大早起床躺在床上还在想课,顺流程脑子里一遍一遍的过,一句一句的顺词本来已经参加过好几次的
公开课
了青年教师必修课可是这次我却不幸排在了第一个讲让我从知道安排之后一直都在准备每天睁眼就在想怎么办周六日也在备课我的师傅是一个很有教学经验
有一种夹心叫中国心
·
2024-09-09 06:08
C语言知识点完美总结
免费的
公开课
供你学习!2)读程序都要从main()入口,然后从最上面顺序往下读(碰到循环做循环,碰到选择做选择),有且只有一个main函数
哪有岁月静好
·
2024-09-09 04:38
强化学习
分类
Model-free:Qlearning,Sarsa,PolicyGradientsModel-based:能通过想象来预判断接下来将要发生的所有情况.然后选择这些想象情况中最好的那种基于概率:PolicyGradients基于价值:Qlearning,Sarsa两者融合:Actor-Critic回合更新:Monte-carlolearning,基础版的policygradients单步更新:Ql
0penuel0
·
2024-09-08 16:29
深度
强化学习
:智能体的学习与决策
引言深度
强化学习
结合了
强化学习
与深度学习的优势,通过智能体与环境的交互,使得智能体能够学习最优的决策策略。深度
强化学习
在自动驾驶、游戏AI、机器人控制等领域表现出色,推动了人工智能的快速发展。
Network_Engineer
·
2024-09-08 12:58
机器学习
学习
机器学习
深度学习
神经网络
python
算法
2023-10-16
明天就要上
公开课
了,不知道为啥,一点感觉都没有,明明还没准备好呢,却硬是不紧张也不慌乱,大概是这几年被否定的太多,随波逐流,混成油条了吧。
静待花开1975
·
2024-09-08 11:06
盘点一下2019年互联网都发生了哪些大事件
点击链接加入QQ群138269539(全国招聘信息、免费
公开课
、视频应有尽有):https://jq.qq.com/?
测试帮日记
·
2024-09-08 10:58
深度
强化学习
之DQN-深度学习与
强化学习
的成功结合
目录概念深度学习与
强化学习
结合的问题DQN解决结合出现问题的办法DQN算法流程总结一、概念原因:在普通的Q-Learning中,当状态和动作空间是离散且维数不高的时候可以使用Q-Table来存储每个状态动作对应的
CristianoC
·
2024-09-07 14:39
2022-01-03
今天邀约:3办卡:0早上上了一节私教1.吴思捷麻麻:推了次卡明天跟进2.吴清柳觉得没有难度3.贺芬参观了明天再来打电话20邀约
公开课
:4明天邀约:4个黄雪英潘德桃徐子淇贺芬老会员接待1个考虑升级
梵兮瑜伽洛洛老师
·
2024-09-07 11:31
心累
最近开放日,加上考试,一大堆杂七杂八的事情,明天上午去听课,下午磨课,级部还要检查环境,周三上午
公开课
,周四开始月考,莫名心累,如果有那么些瞬间真的想什么岗位都不要,就安安静静地在当一名幸福的班主任,备好课
我在枣快乐呀
·
2024-09-07 03:02
一对一包教会脑电教学服务
想
强化学习
脑电某个内容版块可以吗?...”,也有小伙伴联系我们,咨询脑电相关内容能
茗创科技
·
2024-09-06 17:54
基于时序差分的无模型
强化学习
:Q-learning 算法详解
目录一、无模型
强化学习
中的时序差分方法与Q-learning1.1时序差分法1.2Q-learning算法状态-动作值函数(Q函数)Q-learning的更新公式Q-learning算法流程Q-learning
晓shuo
·
2024-09-06 07:30
算法
强化学习
中原焦点网初第34期坚持分享第19天2022.4.24
1.完成了人人献课、健全人格
公开课
、学科课题化献课,三课整合的
公开课
研讨活动,探索了以任务为导向,以问题为驱动,以小组合作的实践探究的课堂教学模式。
爱尚教育
·
2024-09-05 22:18
做一个学生喜欢的数学老师
经常看到,优秀的老师们上
公开课
前师生交流,不是和学生谈话、提问,就是和学生一起做游戏等,他们的目的其实很简单,那就是让学生喜欢上你这个老师,从而喜欢上你的数学课。
a修娟
·
2024-09-05 21:03
(18-1)基于深度
强化学习
的股票交易模型:项目介绍+准备环境
在本章的这个项目中,实现了一个用于股票交易的DRL模型,旨在展示DRL在金融领域的潜力,提供其在股票交易中应用的实际例子。希望通过本章内容的学习,能够为那些对金融与机器学习交叉领域感兴趣的人士提供有益的参考。1.1项目介绍在金融市场中,股票交易是一项充满挑战的任务,需要在高度波动和复杂的市场环境中做出快速且精准的决策。传统的交易策略通常依赖于经验、基本面分析或技术分析。然而,这些方法往往无法在快速
码农三叔
·
2024-09-05 11:52
强化学习从入门到实践
人工智能
深度学习
股票交易
模型
DRL
Double
DQN
Dueling
DQN
【62】关于上
公开课
《金色的草地》有感
上周五上了一节
公开课
选自课文《金色的草地》第二课时。一开始学校安排上
公开课
,我第一感觉是选了这篇课文,纯粹是因为喜欢蒲公英,真的是跟着感觉。
邓维_ca53
·
2024-09-05 06:31
Day 18 既要仰望星空,也要脚踏实地
已经有三天没有更文了,今天上午的培训强度不是很大,听完两节
公开课
,简单地来回顾一下这几天的培训内容。
南和038胡媛媛
·
2024-09-04 18:55
深度学习算法——Transformer
尽管Transformer最初是应用于在文本数据上的序列到序列学习,但现在已经推广到各种现代的深度学习中,例如语言、视觉、语音和
强化学习
领域。
fw菜菜
·
2024-09-04 18:31
数学建模
深度学习
transformer
人工智能
数学建模
python
pytorch
2021-09-25
又要讲
公开课
了,一如既往地要紧张一段时间。这种感觉可能每个老师都会有吧,站在讲台上已经21年了,大大小小的
公开课
也讲了不少,可每次要开
公开课
,还是会这样紧张。紧张,说明自己对课堂有敬畏。
做个会思考的老师
·
2024-09-04 13:50
sumo carla 自动驾驶联合仿真 安装 配置 教程 开发 驾驶模拟
强化学习
sumocarla自动驾驶联合仿真安装配置教程开发驾驶模拟
强化学习
轨迹预测轨迹规划标题:基于SUMO和CARLA的自动驾驶联合仿真系统安装与配置:教程与开发探索摘要:随着自动驾驶技术的迅猛发展,仿真环境在自动驾驶系统的评估
jZhUeZPQZw
·
2024-09-04 09:33
自动驾驶
人工智能
机器学习
Python知识点:如何使用Python实现
强化学习
机器人
实现一个
强化学习
机器人涉及多个步骤,包括定义环境、状态和动作,选择适当的
强化学习
算法,并训练模型。
杰哥在此
·
2024-09-04 03:21
Python系列
python
机器人
开发语言
编程
面试
机器学习在医学中的应用
机器学习的基本概念:简要介绍机器学习的基本原理、分类(监督学习、非监督学习、
强化学习
等)和常用算法(如神经网络、支持向量机、随
听忆.
·
2024-09-03 18:25
机器学习
人工智能
人工智能&机器学习&深度学习
强化学习
:不仅能利用现有数据,还可以通过对环境的探索获得新数据,并利用新数据循环往复地更新迭代现有模型的机器学习算法。学习是为了更好地对环境进行探索,而探索是为了获取数据进行更好的学习。
AA杂货铺111
·
2024-09-03 06:26
学习日志6
关于量子
强化学习
:论文Variational_Quantum_Circuits_for_Deep_Reinforcement_Learning:变分量子电路在深度
强化学习
中的应用论文主要内容:将经典深度
强化学习
算法
Simon#0209
·
2024-09-02 22:21
学习
记第一次录课
第二年,一到
公开课
,录课的老师特别多,再加上录课教室座位有限,多余的孩子总是没处安排,我从来没有录过课。今年,已经迈入第三年了。
半亩方塘点点香
·
2024-09-02 16:38
线性代数-MIT 18.06-6(a)
对称矩阵及正定性对称矩阵对称矩阵的特性:矩阵分解(谱定理)定理证明和复数推广对称矩阵和投影矩阵正定性性质1性质227.复数矩阵和快速傅里叶变换复数向量复数矩阵对称性正交性傅里叶矩阵快速傅里叶变换本文在学习《麻省理工
公开课
线性代数
儒雅的钓翁
·
2024-09-02 06:12
数学基础
线性代数
矩阵
机器学习
【科技前沿】用深度
强化学习
优化电网,让电力调度更聪明!
Hey小伙伴们,今天我要跟大家分享一个超级酷炫的技术应用——深度
强化学习
在电网优化中的典型案例!如果你对机器学习感兴趣,或是正寻找如何用AI技术解决实际问题的方法,这篇分享绝对不容错过!
风清扬雨
·
2024-09-01 19:05
人工智能
人工智能
python
智能电网
深度强化学习
大模型对齐方法笔记一:DPO及其变种IPO、KTO、CPO
DPO的主要思想是在
强化学习
的目标函数中建立决策函数与奖励函数之间的关系,以规避
chencjiajy
·
2024-09-01 15:36
深度学习
笔记
机器学习
人工智能
写小说很难吗?那就硬着头皮写吧
今天在喜马拉雅的奇迹文学网,在听
公开课
,其实也很好奇,喜马拉雅作为有生疏的第1位大厂,本来已经有这么多有生疏了,他为什么又要重新去建立自己的奇迹作家了?原来是因为购买其他作家的版权实在太贵了。
苏斐涵
·
2024-09-01 13:42
多智能体环境设计(二)
agent)方法3.4render()方法空间定义4.1观察空间4.2动作空间高级特性5.1并行环境5.2智能体通信5.3动态环境性能优化测试和调试实际应用示例最佳实践和常见陷阱1.引言多智能体环境是
强化学习
和人工智能研究中的一个重要领
AI-星辰
·
2024-09-01 11:43
强化学习自定义环境
python
机器学习
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他