E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
cs285深度强化学习课程笔记
ZKP Mathematical Building Blocks (2)
MITIAP2023ModernZeroKnowledgeCryptography
课程笔记
Lecture3:MathematicalBuildingBlocks(YufeiZhao)FiatShamirheuristicTurnaninteractiveprooftoanon-interactiveproofPcansimulateVwheneverVpicksarandomvaluePcansi
Simba17
·
2023-12-24 12:30
零知识证明
零知识证明
笔记
学术论文写作与发表经验分享
本文由清华大学教育研究院吴菡同学在教管博党支部与教育博士临时党支部共建活动的经验分享整理而成,分享内容由吴菡同学的写作体会和叶富贵老师《中文学术规范与写作》课程的
课程笔记
组成。
兴富同学
·
2023-12-24 04:05
创造,来自臣服 ——武志红心理学
课程笔记
(第40周)
本周课程是“创造”主题模块的第一周,主题是:创造,来自臣服。武志红老师认为,创造力并不是个人大脑强大思维的结果。思维再强大,也没有创造能力。一个人一旦依赖上自己的思维,就是“向思维认同”,很可能会因此失去创造力。事实上,创造力来自臣服。单单提到“臣服”,直觉上让人感觉不舒服,因为这意味着虚弱的自我向强势低头。那我们要向什么臣服呢?向超越头脑的自我的伟大存在臣服!在任何一个领域有创造力的人,都是他们
左岸7102
·
2023-12-23 17:11
吴恩达RLHF
课程笔记
1.创建偏好数据集一个prompt输入到LLM后可以有多个回答,对每个回答选择偏好比如{prompt,answer1,answer2,prefer1}2.根据这个数据集(偏好数据集),创建rewardmodel,这个model也是一个LLM,并且它是回归模型,返回的是对每个answer的score,loss是最大化winningcandidate和losingcandidate的score。训练结
鱼鱼9901
·
2023-12-23 14:56
nlp
笔记
python
自然语言处理
2022-11-24【日精进第67天】
李庆单位:郑州鹿野苑餐饮管理有限公司(朵家甜品厨房)每日定课(根据实际情况,每十天微调一次):1,晨跑:5:20前,18分钟内跑完3公里;【完成】2,读书笔记:阅读30min+,以及写笔记;【完成】3,
课程笔记
李庆是个做蛋糕的
·
2023-12-23 10:35
【CS224W
课程笔记
】Message Parsing and Node Classification
OutlineMainquestiontoday:给定一个部分节点有标签的网络,如何为网络中的剩余节点分配标签?Collectiveclassification:为网络中所有节点分配标签的思想,直觉上是利用网络中存在的关联(Correlations)。本次课程将讨论以下三类方法:RelationClassificationIterativeClassificationBeliefPropagati
没啥信心
·
2023-12-23 08:03
【
课程笔记
】《心理学概论》第十章:个体差异(清华大学彭凯平教授)—— By Tensor 麻麻麻
彭凯平:清华大学心理学系教授、系主任、博士生导师个体差异一、个体的心理差异古代的六韬观人术:用行为的指标推测一个人的心理特质心理学对个体差异的研究强调:可观测性、可预测性、系统性、科学性人的行为、能力和价值观等方面的差别对我们有很大的影响,特点:独特性、稳定性、复杂性心理学家关注的个体差异:1、智力差异心理学家高尔登(FrancisGalton)设立智力测量方法,用生理指标和物理指标来测量;认为感
Tensor麻麻麻
·
2023-12-22 14:30
2022-12-1【日精进第74天】
郑州鹿野苑餐饮管理有限公司(朵家甜品厨房)每日定课(根据实际情况,每十天微调一次):1,晨跑:5:20前,18分钟内跑完3公里;【未完成,隔离中】2,读书笔记:阅读30min+,笔记200字以上;【完成】3,
课程笔记
李庆是个做蛋糕的
·
2023-12-22 03:29
数据分析
课程笔记
- 09 - Matplotlib
大家好呀,今天我们学习数据分析课程的第九节课——用来做数据可视化的Matplotlib。内容目录如下:什么是Matplotlib为什么要学习Matplotlib常见图形种类及意义Matplotlib画图的简单实现对Matplotlib图像结构的认识折线图(1)折线图的绘制(2)折线的颜色和形状设置(3)折点样式(4)设置的图片的大小和保存(5)绘制x轴和y轴的刻度(6)设置显示中文(7)一图多线(
爱学习的ai酱
·
2023-12-22 01:16
9/666 |小丸子|时间管理
课程笔记
:日程管理——如何合理控制真正可执行的计划
一、问题过分详细、没有实操性、太过严苛的日程安排表其实很难实现。(详细的作息时间表)二、分析日程表不需过分严苛,要合理计划掌控时间,想法和做法难免会冲突,完全按照时间表行动难免出现问题。三、解决方法(一)进阶方法:场景清单含义:每一天就像一个抽屉,抽屉里放收纳盒,把场景当做收纳盒。例如:早晨起床后,下班路上等好处:1、场景不受严格时间限制,更具弹性;2、充分考虑自身状态和环境限制,更利于安排合适的
韧性小丸纸
·
2023-12-21 23:54
ZKP Mathematical Building Blocks 1
MITIAP2023ModernZeroKnowledgeCryptography
课程笔记
Lecture3:MathematicalBuildingBlocks(YufeiZhao)Example:I(
Simba17
·
2023-12-21 22:32
零知识证明
零知识证明
笔记
ZKP Commitment (1)
MITIAP2023ModernZeroKnowledgeCryptography
课程笔记
Lecture5:Commitment1(YingTongLai)Overview:ModernSNARKIOP
Simba17
·
2023-12-21 22:02
零知识证明
零知识证明
笔记
ZKP Commitment (2)
MITIAP2023ModernZeroKnowledgeCryptography
课程笔记
Lecture5:Commitment2(YingTongLai)PolynomialCommitmentf(x
Simba17
·
2023-12-21 22:02
零知识证明
零知识证明
笔记
爆款微头条是怎么样炼成的
(根据砍柴书院21天微头条训练营6月23日晚改改老师的
课程笔记
整理)讲课之前先来问一个问题;写微头条难么?听完这节课,让你爆款不再难!
耕夫见闻录
·
2023-12-21 18:17
宁向东《管理学》
课程笔记
(四十五)
036讲:权变理论--学做领导的极简指南!图片发自App根据大家的学习反馈,后面会把学习负担相对均匀地安排,这样有助于你学习好整个课程。上周讲了五种不同的领导模式,昨天复盘时,我们说不存在唯一最优的领导模式,所以,好的领导者要学会根据实际需要来建立自己的领导模式。先和你分享一个核心概念,叫做“权变(contingency)”。权变,说得简单点就是见机行事,要懂得因时因地、有所区分地解决问题。用专业
於万斯年受天之祜
·
2023-12-21 15:08
宁向东《管理学》
课程笔记
(五十三)
043讲:谋划力--真正的舞台在后面!上节课,我们讨论了一个人说了算,但一个人说了算有两个致命的问题:第一是信息不够充分;第二是判断可能会有偏误。所以,领导要作出正确的决策,其实还需要有效的谋划。这节课,我们就来讨论一下领导的谋划力问题。一句话,真正的舞台其实是在领导的后面。1.真正的舞台在后面领导决策的谋划问题,自古就存在。政治上负责谋划的人,被称为“幕僚”或“谋士”;军事上负责谋划的人,叫“军
於万斯年受天之祜
·
2023-12-21 08:11
基金第十课
课程笔记
V简投法四步走第一步,是计算有目标时或者没有具体目标时每月的投资基数;第二步呢,是根据长投温度确定我们要投资的指数基金;第三步,根据长投温度,确定买入、卖出策略;第四步,是当出现另一只指数的长投温度低于当前指数2度以上时,从温度高的指数,切换到温度低的指数,等所有指数的长投温度都高时,再分批卖出。卖出后得到的钱,作为存量资金,待市场降温出现投资机会后,继续按照以上四步开后下-轮投资。
木子瓷
·
2023-12-21 01:19
Pytorch
深度强化学习
案例:基于Q-Learning的机器人走迷宫
目录0专栏介绍1Q-Learning算法原理2强化学习基本框架3机器人走迷宫算法3.1迷宫环境3.2状态、动作和奖励3.3Q-Learning算法实现3.4完成训练4算法分析4.1Q-Table4.2奖励曲线0专栏介绍本专栏重点介绍强化学习技术的数学原理,并且采用Pytorch框架对常见的强化学习算法、案例进行实现,帮助读者理解并快速上手开发。同时,辅以各种机器学习、数据处理技术,扩充人工智能的底
Mr.Winter`
·
2023-12-20 12:43
Pytorch深度学习实战
pytorch
人工智能
python
机器人
深度学习
强化学习
机器学习
【
课程笔记
】蜕变计划:野蛮实操营
说明:本次课程为黑手社群创始人老道于2月18日8:30在快闪群分享,董疯子@整理笔记分享。分享正文如下:大家好,我是老道,黑手社群的创始人,操盘设计过近百家公司的底层商业模式设计今天主要要跟大家讲一下我们外圈实操环节要带大家实操的内容?我们的野蛮式实操要帮助大家达到一个怎样的效果?以及加入实操群的一个简单要求!就像我们外圈第四节搭建铁粉体系课程里讲到过的,给到用户超预期的才是最好的,做就做到极致!
董董0
·
2023-12-20 06:26
【
课程笔记
】鲍忠铁:从数据思维到数据资产变现
混沌·研习社——talkingdata首席布道师鲍忠铁《从数据思维到数据资产变现》《从数据思维到数据资产变现》这门课是2018年10月talkingdata首席布道师鲍忠铁在混沌研习社的一节公开课。talkingdata已经进行了由软银和Milestone领投的B轮融资,现估值约10亿美金,是移动数据领域的独角兽公司。鲍老师在课程中穿插了很多有意思的案例来辅助理解,我这里只总结干货内容,案例可以去
中华小浣_熊当家
·
2023-12-20 02:24
认识美的底层逻辑
准备做详细的
课程笔记
,看到老师提醒:不要去记课程上的字,要把它转化成你自己的语言,自己的东西,再去输出。的确如此,学到核心的东西比外在的形更重要。这一课从美学的历史讲起,如何发展到今天人们的审美。
慧说早安
·
2023-12-19 19:53
思维导图让你换一种方式打开数学
课程笔记
很多孩子小时候不喜欢学数学,觉得很枯燥,一点趣味也没有,上课昏昏欲睡,可能孩子这种学习状态与传统的数学教学模式有关系,老师在上面讲,讲概念,讲推导过程,学生在下面工工整整的抄写老师的推导过程,一行行的公式确实让人头疼
杨博玺思维训练成长记录
·
2023-12-19 16:55
——
课程笔记
课程老师:Bobbie老师主题模板设计规范——一份好的PPT模板需要具备:1.实用;实用性不强的模板,就是失败的;01提供常用尺寸宽屏:16:9标准:4:3国外甚至A416:1018:9…你不是为了满足某一个某几个人,而是更多的普罗大众。02方便用户修改用户想要的很简单,就是用你的模板偷懒,你要想方设法【让他偷懒】的同时还能【产生愉悦感】。a.元素皆可编所用元素都可自由编辑-用户编辑元素放在普通视
哈士成
·
2023-12-19 12:28
易效能进阶版
课程笔记
02
如果你是90分以上,那么恭喜你,你的效能指数很高,继续保持。如果你是其他份数,对应效能的高低。这个测试题的目的,主要是为了让你更好的了解自己的状况。只有知道问题出在哪,才能更好的对症下药。图片发自App图片发自App
苏苏_yxn520
·
2023-12-18 18:58
收藏冥想
三阶冥想
课程笔记
:1、不做冥想,就像身处在一栋有百间房间的大楼的地下室的一个破衣柜里。2、冥想是让人向内探索,它不是宗教活动,它让人成为不是“文盲”的人。3、如何获得好的冥想:明白种子四大定律。
蓝莲花2018
·
2023-12-18 15:43
时间管理−充实的一天
1英语流利说60分钟✅2圈外
课程笔记
✅3设定留学目标和计划流程✅一步步计划当中4本科自考学习✅5带琦琦打疫苗✅发烧了没打上6涂防晒出门✅7带水果出门✅8吃了饭再出门✅9哄琦琦睡觉✅10看10页书可怕的两岁
陈鹿崎Luky
·
2023-12-18 13:48
【OS】操作系统
课程笔记
第十章 文件管理
10.1文件系统的概念1.文件:具有文件名相关信息的集合由若干个记录组成记录是一些相关数据项的集合数据项是数据组织中可以命名的最小逻辑单位2.文件系统的主要功能:实现按文件名存取文件信息为用户提供统一和友好的接口实施对文件和文件目录的管理文件存储器的分配和回收提供有关文件的共享和保护10.3文件的物理结构
令夏二十三
·
2023-12-18 13:35
#
OS
笔记
深度强化学习
之:PPO训练红白机1942
本篇是
深度强化学习
动手系列文章,自MyEncyclopedia公众号文章
深度强化学习
之:DQN训练超级玛丽闯关发布后收到不少关注和反馈,这一期,让我们实现目前主流
深度强化学习
算法PPO来打另一个红白机经典游戏
人工智能与算法学习
·
2023-12-18 12:19
游戏
人工智能
强化学习
深度学习
openssh
如何选择
深度强化学习
算法:MuZero/SAC/PPO/TD3/DDPG/DQN/等算法
离散动作空间推荐:DuelingDoubleDQN(D3QN)连续动作空间推荐:擅长调参就用TD3,不擅长调参就用PPO或SAC,如果训练环境Rewardfunction都是初学者写的,那就用PPO没入门
深度强化学习
的人请按顺序学
汀、人工智能
·
2023-12-18 12:18
#
#
强化学习相关技巧(调参
画图等)
人工智能
深度学习
强化学习
深度强化学习
DDPG
SAC
PPO
【李宏毅
深度强化学习
笔记】2、Proximal Policy Optimization算法(PPO)
【李宏毅
深度强化学习
笔记】1、策略梯度方法(PolicyGradient)【李宏毅
深度强化学习
笔记】2、ProximalPolicyOptimization(PPO)算法(本文)【李宏毅
深度强化学习
笔记
qqqeeevvv
·
2023-12-18 12:15
#
理论知识
强化学习
深度强化学习
PPO
深度强化学习
:(七)PPO
一、TRPOTRPO算法是Shulman博士为了解决普通的策略梯度算法无法保证性能单调非递减而提出来的方法。也就是说,普通的策略梯度算法无法解决更新步长的问题,对于普通的策略梯度方法,如果更新步长太大,则容易发散;如果更新步长太小,即使收敛,收敛速度也很慢。Shulman并不从策略梯度的更新步长下手,而是换了一个思路:更换优化函数。通过理论推导和分析,Shulman找到一个替代损失函数(Surro
Warship_
·
2023-12-18 12:44
深度强化学习
深度强化学习
(DRL)简介与常见算法(DQN,DDPG,PPO,TRPO,SAC)分类
简单介绍
深度强化学习
的基本概念,常见算法、流程及其分类(持续更新中),方便大家更好的理解、应用强化学习算法,更好地解决各自领域面临的前沿问题。欢迎大家留言讨论,共同进步。
行至为成
·
2023-12-18 12:44
算法
分类
深度学习
人工智能
【
深度强化学习
】TRPO、PPO
策略梯度的缺点步长难以确定,一旦步长选的不好,就导致恶性循环步长不合适→策略变差→采集的数据变差→(回报/梯度导致的)步长不合适步长不合适\to策略变差\to采集的数据变差\to(回报/梯度导致的)步长不合适步长不合适→策略变差→采集的数据变差→(回报/梯度导致的)步长不合适一阶信息不限制步长容易越过局部最优,而且很难回来TRPO置信域策略优化思想:步子不要太大,应该保证更新在某个邻域内∣∣θ−θ
x66ccff
·
2023-12-18 12:13
强化学习
强化学习
人工智能
007不出局第12篇
课上做
课程笔记
,课后做反思输出,一直是我学习的两大法宝。1.从老师的《柴夫入林》的故事讲起吧。从前有一个柴夫在森林里砍柴,山林里智慧的僧者问他,为什么不再向前走十
洁然Rose
·
2023-12-18 06:48
【深度学习】强化学习(七)基于策略函数的学习方法
文章目录一、强化学习问题1、交互的对象2、强化学习的基本要素3、策略(Policy)4、马尔可夫决策过程5、强化学习的目标函数6、值函数7、
深度强化学习
二、基于值函数的学习方法三、基于策略函数的学习方法一
QomolangmaH
·
2023-12-18 02:10
深度学习
基于人工智能 RL 算法的边缘服务器智能选择 模式研究
提出了一种基于人工智能
深度强化学习
算法的扩展性及智能性较高的智能选择模式。
Mindtechnist
·
2023-12-17 23:32
人工智能
算法
服务器
王树森
深度强化学习
笔记
本笔记基于王树森的
深度强化学习
课程文章目录王树森
深度强化学习
笔记一、基础1.概率论2.名词3.ReturnUtU_tUt4.Action-ValueFunctionQπ(s,a)Q_\pi(s,a)Qπ
开longlong了吗?
·
2023-12-17 21:30
笔记
深度学习
【李宏毅
课程笔记
】NLP任务概览
Video:https://www.youtube.com/watch?v=tFBrqPPxWzE&feature=youtu.beSlides:http://speech.ee.ntu.edu.tw/~tlkagk/courses/DLHLP20/TaskShort%20(v9).pdf可以根据输入(OneSentence/MultipleSentences)和输出(OneClass/Class
没啥信心
·
2023-12-17 20:29
《7小时*24天完成一件事》
坚持每天整七小时的系统性学习,良好的学习效果一定会呈现出来;用近一个月的时间,我先把明年要考试的所有课程先学一遍;我希望自己不只是通过考试,而是能比较好地掌握知识,并能把它应用起来;因为每天还有很多的
课程笔记
那条爬上岸的鱼
·
2023-12-17 18:05
【
深度强化学习
】DQN, Double DQN, Dueling DQN
DQN更新方程Qθ(st,at)←Qθ(st,at)+α(rt+γmaxa′Qθ(st+1,a′)−Qθ(st,at))Q_\theta(s_t,a_t)\leftarrowQ_\theta(s_t,a_t)+\alpha\left(r_t+\gamma\red{\max_{a'}Q_\theta(s_{t+1},a')}-Q_{\theta}(s_t,a_t)\right)Qθ(st,at)←
x66ccff
·
2023-12-17 09:36
强化学习
机器学习
人工智能
《梁宁产品思维30讲》
课程笔记
(一)
2018年初的时候,有朋友推荐《得到》的《梁宁产品思维30讲》这门课给我听,她知道我是做互联网行业的嘛。但我一直放着没去听,直到有天早晨刷好牙准备上班前,随便听了几分钟,哪知道一发不可收拾,简直停不下来。停不下来是因为,梁宁的课深入浅出,有大量的故事案例,还都是微信/小米/陌陌这些主流产品的内部故事,一点也不生硬。不同阶段的PM听了这门课都会有收获,当然,有经验的PM受到的启发可能会更多一些。其实
TK_237d
·
2023-12-16 22:44
【树】Linux笔记-2 软件安装
以下内容是参与【生信技能树-全球听第7期】的
课程笔记
,记录人:小瑛,有问题可在公众号后台留言小白小白,请注意:笔记中出现的所有文件路径,仅作为参考,请勿模仿!
瑛_儿_肥
·
2023-12-16 13:11
课程笔记
:通过修改提高文章质量,写出深度好文
今天听了无戒学堂的课程,在此给出自己的课堂笔记,本次课程主要涉及修改文章。一、写文要注意1、不要在一次写的时候就写到极致;2、不要边写边改,这样效率很低。二、快速完成写文的办法1、构思,选取素材,确立文章主题,迅速开始写;2、不要在意错别字、逻辑,把想到的内容一股脑写出来;3、写文期间不要去做其他的事情,思想高度集中的时候去完成,快速记录脑海浮现的东西,不要管质量逻辑啥的,过后慢慢改;4、早上起来
芷澜吟
·
2023-12-16 13:19
文章解读与仿真程序复现思路——电网技术EI\CSCD\北大核心《基于乐观行动-评判
深度强化学习
的含氢综合能源系统低碳经济调度》
这个标题涉及到基于乐观行动的
深度强化学习
在含氢综合能源系统低碳经济调度方面的评判。
电网论文源程序
·
2023-12-16 12:56
文章解读
能源
综合能源系统
低碳经济调度
深度强化学习
2019-01-24
早起打卡图片发自App晨间日记图片发自App日程安排图片发自App图片发自App图片发自App运动打卡图片发自App阅读分享图片发自App
课程笔记
图片发自App正念冥想图片发自App
世界本来美好
·
2023-12-16 10:08
易效能进阶
课程笔记
19
工具1:手机下载一款软件starwalk,下载完成后打开App,然后将手机指向天空或者点击上面的指南针,它就能显示出各个星象的名称。工具2:手机下载另一款软件Solarlwalk,这款软件可以模拟太阳系九大行星的公转和自转,让你能在更宏观的角度看到宇宙的形态。图片发自App
苏苏_yxn520
·
2023-12-16 10:42
《正向领导》
课程笔记
1.Laerningfromwhatworksbest向最好的学习。启发:这不是第一次听到该理论,却是理解最深刻的一次,我们的知识或经验一定要向最权威的人学习或请教,一定要研究高手的心理表征,而非三四流的知识或文献。比如,在教练技术领域,这么多流派,埃里克森的流派最权威、最系统,理应学习他们的;在家庭教育领域,最权威的是谁?谁在研究儿童教育最专业的,蒙特梭利,简尼尔森…,也即我们在选择书籍或知识的
喜乐妈妈
·
2023-12-16 03:56
学习
深度强化学习
---第1部分----RL介绍、基本模型、Gym介绍
文章目录1.1节强化学习简介1.2节强化学习的模型1.3节Gym介绍视频所在地址:
深度强化学习
的理论与实践经典的强化学习有三种:1、基于动态规划的强化学习、2、基于蒙特卡洛算法的强化学习、3、基于时序差分的强化学习
饿了就干饭
·
2023-12-16 00:41
强化学习
强化学习
学习
深度强化学习
---第3部分----RL蒙特卡罗相关算法
文章目录3.1节蒙特卡罗法简介3.2节蒙特卡罗策略评估3.3节蒙特卡罗强化学习3.4节异策略蒙特卡罗法本部分视频所在地址:
深度强化学习
的理论与实践3.1节蒙特卡罗法简介在其他学科中的蒙特卡罗法是一种抽样的方法
饿了就干饭
·
2023-12-16 00:11
强化学习
强化学习
学习
深度强化学习
---第2部分----RL动态规划相关算法
文章目录2.1节动态规划简介2.2节值函数与贝尔曼方程2.3节策略评估2.4节策略改进2.5节最优值函数与最优策略2.6节值迭代与策略迭代2.7节动态规划求解最优策略本部分视频所在地址:
深度强化学习
的理论与实践
饿了就干饭
·
2023-12-16 00:06
强化学习
算法
动态规划
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他