强化学习公开课

准备

早在2020年疫情期间，学校电教处周光杰主任在学校群里发出智慧作业抢题通知，我看了有些心动，一节微课相当于一次省级公开课，这对于我们普通老师是多么难得的机会啊。但想归想，我也不会用软件啊，再

胡珊珊乐平九小·2024-09-16 07:08

深度 Qlearning：在直播推荐系统中的应用

AGI通用人工智能之禅·2024-09-16 02:27

经济金融学公开课学习总汇（九）

本章内容：1.什么是金融风险2.什么是风险偏好与满意度，人都是风险厌恶吗3.单一投资还是多元投资4.无差别曲线金融风险：金融风险是指金融变量的各种可能值偏离期望的可能性以及幅度，所以风险不是说，一定会发生概率的亏损或者偏离回报，它也有可能发生超额的回报作为理财的投资人，我们一般只关注系统风险（经济环境不好造成房市大跌等）。还有非系统性风险（购买理财，卷款跑路等）。其中系统风险是可分散的风险；后者是

佳佳爱科技AITech·2024-09-15 23:59

OpenAI o1 的价值意义及“强化学习的Scaling Law” & Kimi创始人杨植麟最新分享：关于OpenAI o1新范式的深度思考

OpenAIo1的价值意义及“强化学习的ScalingLaw”蹭下热度谈谈OpenAIo1的价值意义及RL的Scalinglaw。

光剑书架上的书·2024-09-15 13:21

探索未来，大规模分布式深度强化学习——深入解析IMPALA架构

探索未来，大规模分布式深度强化学习——深入解析IMPALA架构scalable_agent项目地址:https://gitcode.com/gh_mirrors/sc/scalable_agent在当今的人工智能研究前沿

汤萌妮Margaret·2024-09-15 12:30

如何有效的学习AI大模型？

理论学习：机器学习基础：了解监督学习、非监督学习、强化学习等基本概念。深度学习：学习神经网络的基本结构，如卷

Python程序员罗宾·2024-09-14 15:37

反思的魔力：用语言的力量强化AI智能体

然而，传统的强化学习方法如同一位严苛的训练师，需要大

步子哥·2024-09-14 08:52

公开课，是选择学生的心灵，还是社会的好评？

远方，还有一缕阳光大教育家李镇西，在上完公开课后进行了一个反思，他说，“公开课是为了自己教学的完美而无视学生的精神自由，让学生成为自己表演的道具。而这样的教育，难道是我们应该提倡的吗？

文明未央·2024-09-13 23:21

周末小事

明天争取多练习几遍要讲的内容，争取做到烂熟于心，来应付后天的公开课，不管最后结果怎么样，总之，我觉得自己尽力了，最起码自己不会后悔。

林溪留痕·2024-09-13 14:15

2.0第一周检视（8/16-8/20）

本周精力感觉不足，总是犯困，每天也23点睡觉早上6点多会醒，但是醒来后还是感觉困，睡眠软件记录深眠只有1小时左右，午休做10分钟冥想补充精力；运动：两次美姿雅仪锻炼，一次晚上快走1W+2.学习：上了叶老师的财富公开课和

aeb1fe80c479·2024-09-13 13:43

公开课

上好公开课是一个教师教学能力的重要体现，是评各级名师、学科骨干教师、学科带头人的重要依据，也是职评考核重要指标。

悉数沉淀w·2024-09-13 13:38

代码随想录算法训练营第三十九天| 62. 不同路径，63. 不同路径 II

|LeetCode：62.不同路径_哔哩哔哩_bilibili《代码随想录》算法公开课开讲啦！快来打卡！

零offer在手·2024-09-13 07:18

机器学习实战笔记5——线性判别分析

任务安排1、机器学习导论8、核方法2、KNN及其实现9、稀疏表示3、K-means聚类10、高斯混合模型4、主成分分析11、嵌入学习5、线性判别分析12、强化学习6、贝叶斯方法13、PageRank7、

绍少阿·2024-09-12 20:32

大模型的实践应用29-大语言模型的RLHF(人类反馈强化学习)的具体应用与原理介绍

大家好，我是微学AI，今天给大家介绍一下大模型的实践应用29-大语言模型的RLHF(人类反馈强化学习)的具体应用与原理介绍。

微学AI·2024-09-11 19:47

书法心语

2016年之夏，某天我在住家附近走路，突然在街道边看到了“北京盛世兰亭书院”书法公开课的宣传海报。于是我记住了日子，在一个星期天到场听了书法课。我一下子像触电了，觉得禅宗所谓的“开悟”时刻到了。没有

仙泉·2024-09-11 09:27

坚定理想信念，锤炼党性修养

坚定理想信念，就要强化学习精神、自律精神、担当精神。思想理论上的坚定清醒是政治上坚定的前提，党员干部要始终把理论学习作为政治责任、事业需要和精神追求，积极参加组织

知涵知·2024-09-10 23:15

《兴奋的睡不着》坚持第922天原创分享（2017.06.17星期六）

《兴奋的睡不着》卓丽，坚持第922天原创分享（2017.06.17星期六）：刘老师要来平顶山了，我们平顶山焦点团队的各位老师都开心的不得了，刘老师还特意给我们带来一节公开课，这是多么难得的机会呀，由于场地有限

半夏五月天·2024-09-10 20:10

python 物理引擎_在 Gym 上构建会动的人工智障1（python）

Gym是用于开发和比较强化学习算法的python包，但是我们也完全可以使用它来作为我们自己程序的应用背景，并提供可视化。

weixin_39542608·2024-09-09 19:30

记忆力培训与记忆课

昨天老徐拉我进了记忆公开课的群，研究了课程助理的工作流程之外，也读了群里提到的那本《世界记忆大师教我的超强记忆法》。先说一下这本书，看了前面一小半，联想记忆。

乌卓·2024-09-09 14:12

强化学习（二）----- 马尔可夫决策过程MDP

1.马尔可夫模型的几类子模型大家应该还记得马尔科夫链(MarkovChain)，了解机器学习的也都知道隐马尔可夫模型(HiddenMarkovModel，HMM)。它们具有的一个共同性质就是马尔可夫性(无后效性)，也就是指系统的下个状态只与当前状态信息有关，而与更早之前的状态无关。马尔可夫决策过程(MarkovDecisionProcess,MDP)也具有马尔可夫性，与上面不同的是MDP考虑了动作

Duckie-duckie·2024-09-09 06:37

Python强化学习，基于gym的马尔可夫决策过程MDP，动态规划求解，体现序贯决策

强化学习过程中最典型的例子就是非线性二级摆系统，有4个关键值，小车受力，受力方向，摆速度，摆角，每个状态下都需要决策车的

baozouxiaoxian·2024-09-09 06:32

终于结束了

心都快提到嗓子眼里了一大早起床躺在床上还在想课，顺流程脑子里一遍一遍的过，一句一句的顺词本来已经参加过好几次的公开课了青年教师必修课可是这次我却不幸排在了第一个讲让我从知道安排之后一直都在准备每天睁眼就在想怎么办周六日也在备课我的师傅是一个很有教学经验

有一种夹心叫中国心·2024-09-09 06:08

C语言知识点完美总结

免费的公开课供你学习！2)读程序都要从main()入口,然后从最上面顺序往下读(碰到循环做循环,碰到选择做选择)，有且只有一个main函数

哪有岁月静好·2024-09-09 04:38

强化学习分类

Model-free:Qlearning,Sarsa,PolicyGradientsModel-based:能通过想象来预判断接下来将要发生的所有情况.然后选择这些想象情况中最好的那种基于概率：PolicyGradients基于价值：Qlearning,Sarsa两者融合：Actor-Critic回合更新：Monte-carlolearning，基础版的policygradients单步更新：Ql

0penuel0·2024-09-08 16:29

深度强化学习：智能体的学习与决策

引言深度强化学习结合了强化学习与深度学习的优势，通过智能体与环境的交互，使得智能体能够学习最优的决策策略。深度强化学习在自动驾驶、游戏AI、机器人控制等领域表现出色，推动了人工智能的快速发展。

Network_Engineer·2024-09-08 12:58

2023-10-16

明天就要上公开课了，不知道为啥，一点感觉都没有，明明还没准备好呢，却硬是不紧张也不慌乱，大概是这几年被否定的太多，随波逐流，混成油条了吧。

静待花开1975·2024-09-08 11:06

盘点一下2019年互联网都发生了哪些大事件

点击链接加入QQ群138269539（全国招聘信息、免费公开课、视频应有尽有）：https://jq.qq.com/?

测试帮日记·2024-09-08 10:58

深度强化学习之DQN-深度学习与强化学习的成功结合

目录概念深度学习与强化学习结合的问题DQN解决结合出现问题的办法DQN算法流程总结一、概念原因：在普通的Q-Learning中，当状态和动作空间是离散且维数不高的时候可以使用Q-Table来存储每个状态动作对应的

CristianoC·2024-09-07 14:39

2022-01-03

今天邀约：3办卡：0早上上了一节私教1.吴思捷麻麻：推了次卡明天跟进2.吴清柳觉得没有难度3.贺芬参观了明天再来打电话20邀约公开课：4明天邀约：4个黄雪英潘德桃徐子淇贺芬老会员接待1个考虑升级

梵兮瑜伽洛洛老师·2024-09-07 11:31

心累

最近开放日，加上考试，一大堆杂七杂八的事情，明天上午去听课，下午磨课，级部还要检查环境，周三上午公开课，周四开始月考，莫名心累，如果有那么些瞬间真的想什么岗位都不要，就安安静静地在当一名幸福的班主任，备好课

我在枣快乐呀·2024-09-07 03:02

一对一包教会脑电教学服务

想强化学习脑电某个内容版块可以吗？...”，也有小伙伴联系我们，咨询脑电相关内容能

茗创科技·2024-09-06 17:54

基于时序差分的无模型强化学习：Q-learning 算法详解

目录一、无模型强化学习中的时序差分方法与Q-learning1.1时序差分法1.2Q-learning算法状态-动作值函数（Q函数）Q-learning的更新公式Q-learning算法流程Q-learning

晓shuo·2024-09-06 07:30

中原焦点网初第34期坚持分享第19天2022.4.24

1.完成了人人献课、健全人格公开课、学科课题化献课，三课整合的公开课研讨活动，探索了以任务为导向，以问题为驱动，以小组合作的实践探究的课堂教学模式。

爱尚教育·2024-09-05 22:18

做一个学生喜欢的数学老师

经常看到，优秀的老师们上公开课前师生交流，不是和学生谈话、提问，就是和学生一起做游戏等,他们的目的其实很简单，那就是让学生喜欢上你这个老师，从而喜欢上你的数学课。

a修娟·2024-09-05 21:03

（18-1）基于深度强化学习的股票交易模型：项目介绍+准备环境

在本章的这个项目中，实现了一个用于股票交易的DRL模型，旨在展示DRL在金融领域的潜力，提供其在股票交易中应用的实际例子。希望通过本章内容的学习，能够为那些对金融与机器学习交叉领域感兴趣的人士提供有益的参考。1.1项目介绍在金融市场中，股票交易是一项充满挑战的任务，需要在高度波动和复杂的市场环境中做出快速且精准的决策。传统的交易策略通常依赖于经验、基本面分析或技术分析。然而，这些方法往往无法在快速

码农三叔·2024-09-05 11:52

【62】关于上公开课《金色的草地》有感

上周五上了一节公开课选自课文《金色的草地》第二课时。一开始学校安排上公开课，我第一感觉是选了这篇课文，纯粹是因为喜欢蒲公英，真的是跟着感觉。

邓维_ca53·2024-09-05 06:31

Day 18 既要仰望星空，也要脚踏实地

已经有三天没有更文了，今天上午的培训强度不是很大，听完两节公开课，简单地来回顾一下这几天的培训内容。

南和038胡媛媛·2024-09-04 18:55

深度学习算法——Transformer

尽管Transformer最初是应用于在文本数据上的序列到序列学习，但现在已经推广到各种现代的深度学习中，例如语言、视觉、语音和强化学习领域。

fw菜菜·2024-09-04 18:31

2021-09-25

又要讲公开课了，一如既往地要紧张一段时间。这种感觉可能每个老师都会有吧，站在讲台上已经21年了，大大小小的公开课也讲了不少，可每次要开公开课，还是会这样紧张。紧张，说明自己对课堂有敬畏。

做个会思考的老师·2024-09-04 13:50

sumo carla 自动驾驶联合仿真安装配置教程开发驾驶模拟强化学习

sumocarla自动驾驶联合仿真安装配置教程开发驾驶模拟强化学习轨迹预测轨迹规划标题：基于SUMO和CARLA的自动驾驶联合仿真系统安装与配置：教程与开发探索摘要：随着自动驾驶技术的迅猛发展，仿真环境在自动驾驶系统的评估

jZhUeZPQZw·2024-09-04 09:33

Python知识点：如何使用Python实现强化学习机器人

实现一个强化学习机器人涉及多个步骤，包括定义环境、状态和动作，选择适当的强化学习算法，并训练模型。

杰哥在此·2024-09-04 03:21

机器学习在医学中的应用

机器学习的基本概念：简要介绍机器学习的基本原理、分类（监督学习、非监督学习、强化学习等）和常用算法（如神经网络、支持向量机、随

听忆.·2024-09-03 18:25

人工智能&机器学习&深度学习

强化学习：不仅能利用现有数据，还可以通过对环境的探索获得新数据，并利用新数据循环往复地更新迭代现有模型的机器学习算法。学习是为了更好地对环境进行探索，而探索是为了获取数据进行更好的学习。

AA杂货铺111·2024-09-03 06:26

学习日志6

关于量子强化学习：论文Variational_Quantum_Circuits_for_Deep_Reinforcement_Learning：变分量子电路在深度强化学习中的应用论文主要内容：将经典深度强化学习算法

Simon#0209·2024-09-02 22:21

记第一次录课

第二年，一到公开课，录课的老师特别多，再加上录课教室座位有限，多余的孩子总是没处安排，我从来没有录过课。今年，已经迈入第三年了。

半亩方塘点点香·2024-09-02 16:38

线性代数-MIT 18.06-6(a)

对称矩阵及正定性对称矩阵对称矩阵的特性：矩阵分解（谱定理）定理证明和复数推广对称矩阵和投影矩阵正定性性质1性质227.复数矩阵和快速傅里叶变换复数向量复数矩阵对称性正交性傅里叶矩阵快速傅里叶变换本文在学习《麻省理工公开课线性代数

儒雅的钓翁·2024-09-02 06:12

【科技前沿】用深度强化学习优化电网，让电力调度更聪明！

Hey小伙伴们，今天我要跟大家分享一个超级酷炫的技术应用——深度强化学习在电网优化中的典型案例！如果你对机器学习感兴趣，或是正寻找如何用AI技术解决实际问题的方法，这篇分享绝对不容错过！‍

风清扬雨·2024-09-01 19:05

大模型对齐方法笔记一：DPO及其变种IPO、KTO、CPO

DPO的主要思想是在强化学习的目标函数中建立决策函数与奖励函数之间的关系，以规避

chencjiajy·2024-09-01 15:36

写小说很难吗？那就硬着头皮写吧

今天在喜马拉雅的奇迹文学网，在听公开课，其实也很好奇，喜马拉雅作为有生疏的第1位大厂，本来已经有这么多有生疏了，他为什么又要重新去建立自己的奇迹作家了？原来是因为购买其他作家的版权实在太贵了。

苏斐涵·2024-09-01 13:42

多智能体环境设计（二）

agent)方法3.4render()方法空间定义4.1观察空间4.2动作空间高级特性5.1并行环境5.2智能体通信5.3动态环境性能优化测试和调试实际应用示例最佳实践和常见陷阱1.引言多智能体环境是强化学习和人工智能研究中的一个重要领

AI-星辰·2024-09-01 11:43

推荐频道