E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习阅读笔记
FreeRTOS源码
阅读笔记
5--mutex
互斥量是一种特殊的二值信号量,拥有优先级继承的机制,所以适合用在临界资源互斥访问。5.1创建互斥量xSemaphoreCreateMutex()5.1.1函数原型5.1.2函数框架5.2创建递归互斥量xSemaphoreCreateRecursiveMutex()5.2.1函数原型5.2.2函数框架xSemaphoreCreateRecursiveMutex()实际调用的函数就是xQueueCre
c_up
·
2023-12-03 07:18
笔记
FreeRTOS源码
阅读笔记
3--queue.c
消息队列可以应用于发送不定长消息的场合,包括任务与任务间的消息交换,队列是FreeRTOS主要的任务间通讯方式,可以在任务与任务间、中断和任务间传送信息,发送到队列的消息是通过拷贝方式实现的,这意味着队列存储的数据是原数据,而不是原数据的引用。消息队列控制块typedefstructQueueDefinition{int8_t*pcHead;//pcHead指向队列消息存储区起始位置,即第一个消息
c_up
·
2023-12-03 07:17
笔记
FreeRTOS源码
阅读笔记
6--event_groups.c
通常用的事件标志组是一个32位的变量uxEventBits,可设置的位有24位,一共就是24种事件。事件组的结构体类型:6.1创建事件组xEventGroupCreate()6.1.1函数原型返回值:事件组句柄,指向事件组。6.1.2函数框架①为事件组结构体分配空间②初始化事件组结构体的成员变量,包括等待事件列表的初始化。6.2删除事件组vEventGroupDelete()6.2.1函数原型xE
c_up
·
2023-12-03 07:43
笔记
Swift标准库源码
阅读笔记
- Array和ContiguousArray
关于ContiguousArray,这边有喵神的文章介绍的很详细了,可以先看看这个文章。Array接着喵神的思路,看一下Array以下是从源码中截取的代码片段。publicstructArray:_DestructorSafeContainer{#if_runtime(_ObjC)internaltypealias_Buffer=_ArrayBuffer#elseinternaltypealias
weixin_33763244
·
2023-12-03 07:55
swift
移动开发
操作系统
强化学习
(一)——基本概念及DQN
1基本概念智能体agent,做动作的主体,(大模型中的AIagent)环境environment:与智能体交互的对象状态state;当前所处状态,如围棋棋局动作action:执行的动作,如围棋可落子点奖励reward:执行当前动作得到的奖励,(大模型中的奖励模型)策略policy:π(a∣s)\pi(a|s)π(a∣s)当前状态如何选择action,如当前棋局,落子每个点的策略回报(累计奖励)re
晚点吧
·
2023-12-03 06:33
强化学习
强化学习
DQN
DDQN
RL
【20230416】
老师又在讲深度学习和
强化学习
强化学习
强化学习
做的事情策略今日任务完成任务下周党课课表论文阅读论文标题论文作者Introduction图形模型和结果No-promisespeedTwo-daypromisespeedOne-daypromisespeed
limuqing_134
·
2023-12-03 04:39
笔记
强化学习
简明教程
到目前为止,我们主要关注监督学习问题(主要是分类)。在监督学习中,我们得到某种由输入/输出对组成的训练数据,目标是能够在学习模型后根据一些新输入来预测输出。例如,我们之前研究过MNIST的卷积神经网络(CNN)分类模型;给定60000个数字图像和相应数字标签(例如“5”)的训练集,我们学习了一个能够预测新MNIST图像的数字标签的模型。换句话说,类似于(但不完全是)这样的东西:NSDT工具推荐:T
新缸中之脑
·
2023-12-03 01:34
机器学习
人工智能
DQN原理及PyTorch实现【
强化学习
】
NSDT工具推荐:Three.jsAI纹理开发包-YOLO合成数据生成器-GLTF/GLB在线编辑-3D模型格式在线转换-可编程3D场景编辑器-REVIT导出3D模型插件-3D模型语义搜索引擎欢迎来到我们的
强化学习
系列的第三部分
新缸中之脑
·
2023-12-03 01:34
强化学习
强化学习
Q-Learning算法和简单迷宫代码
使用到的符号:agent代理reward奖励state(s)状态action(a)行为Rreward矩阵Q矩阵:表示从经验中学到的知识episode:表示初始→目标一整个流程贝尔曼方程(迭代公式):Q(s,a)←Q(s,a)+α[R(s,a)+γmaxa′Q(s′,a′)−Q(s,a)]Q(s,a)\leftarrowQ(s,a)+\alpha[R(s,a)+\gamma\mathop{\max
今我来思雨霏霏_JYF
·
2023-12-03 01:33
强化学习
算法
强化学习
Q-Learning
2018-10-17
可是自从教授了巴老的回忆性散文《小狗包弟》,为了在课堂上和学生之间有更多的交流,我认真阅读了教参上所有的鉴赏性的文字;又借来大部头的《巴金全传》进行研读,并做了很多
阅读笔记
。
风过无痕L
·
2023-12-03 00:18
《蛤蟆先生去看心理医生》
阅读笔记
4
时间2021年12月24日页数66-76内容:愤怒的表现苍鹭通过让蛤蟆回忆和獾的相处,意识到自己的愤怒以及自己应对愤怒的模式。愤怒的发泄方式有两种:第一种——像喷射气体一样,瞄准一个选定的目标释放愤怒,然后恢复常态。这样做的后果是会造成伤害,也会对人际关系造成不利。第二种——用缓和的方式释放发怒,让别人几乎察觉不到,这样不会让任何人不安。例如:怄气。怄气是最能说明用时间稀释愤怒的例子。一般来说,这
鑫一爱成长
·
2023-12-02 20:42
《我就想做班主任》
阅读笔记
第11天三、做一个高效的老师一个时间段读完了这一章的内容,下一章是找一条路走进学生的心。同样充满了期待。为什么做一个高效的老师?高效可以让我们在生活和学习方面感觉更轻松,更惬意。怎么做一个高效的教师?1,吃透教材。(怎么吃透教材?文本分析。怎么进行文本分析?学习、依据新课标。小括号里的内容是我自问自答的。)2,不讲废话。今天的讲座老师就讲了很多废话,所以她好像一直在赶时间,我可不要这样做,学生会不
浪漫的巴布亚企鹅
·
2023-12-02 19:33
机械臂运动规划、抓取末端执行器、抓取开源项目
主要有三种方法,如传统的基于DMP的方法、模仿学习的方法和基于
强化学习
的方法。基于DMP的方法:主要包括DMP算法。形式化为稳定的非线性吸引子系统。基于模仿学习的方法:
cocapop
·
2023-12-02 17:35
机器人
机器人
《比特币白皮书》
阅读笔记
三:先有痛点,然后才有新的技术诞生
摘要:比特币只是数字签名链上的一段记录在。通过白皮书可以看出,中本聪在发明比特币的过程中遇到了各种各样的问题,他正是通过解决一个又一个难题最终形成了区块链技术。所以伟大的发明都是先有痛点,然后才诞生了厉害的技术。我们持有的比特币只是签名链上的一段记录。Wedefineanelectroniccoinasachainofdigitalsignatures.(翻译:我们将一枚电子硬币定义为一个数字签名
大头小蚂蚁
·
2023-12-02 15:16
[PyTorch][chapter 1][李宏毅深度学习-AI 简介]
前言:李宏毅深度学习从2017-2023的系列课程总结内容章节
强化学习
11李宏毅机器学习【2017】40李宏毅机器学习深度学习(完整版)国语【2020】119李宏毅大佬的深度学习与机器学【2022】90
明朝百晓生
·
2023-12-02 10:07
深度学习
pytorch
人工智能
大语言模型评测论文HELM
阅读笔记
文章目录这篇文章是斯坦福大学的团队完成的一篇大语言模型的评测文章,文章的简称为HELM。大语言模型的训练成本:目前来说,训练一个大语言模型的成本都在1000万人民币以上。效果最好的大模型:文章中提出InstrcutGPT-v2在整体任务上表现最好。开源大模型和闭源大模型的效果对比:开源的大语言模型效果一般比闭源的语言大模型效果差一些。模型效果和参数量的关系:一般来说,模型越大效果越好;如果需要在某
北岛寒沫
·
2023-12-02 10:07
计算机科研
语言模型
笔记
人工智能
强化学习
:原理与Python实战||一分钟秒懂人工智能对齐
文章目录1.什么是人工智能对齐2.为什么要研究人工智能对齐3.人工智能对齐的常见方法延伸阅读1.什么是人工智能对齐人工智能对齐(AIAlignment)指让人工智能的行为符合人的意图和价值观。人工智能系统可能会出现“不对齐”(misalign)的问题。以ChatGPT这样的问答系统为例,ChatGPT的回答可能会含有危害祖国统一、侮辱先烈、丑化中华民族、教唆暴力、出口成“脏”等违法或不符合社会主义
雪碧有白泡泡
·
2023-12-02 10:56
粉丝福利活动
python
人工智能
开发语言
ethz(苏黎世联邦理工学院)机器人系统实验室开源库
系列文章目录文章目录系列文章目录前言一、开源库1.1OCS2-OptimalControlforSwitchedSystems1.2RSLGym-
强化学习
框架1.3ELMOEthercatSDK1.4Kindr
kuan_li_lyg
·
2023-12-02 10:38
机器人
自动驾驶
ROS
开源软件
MATLAB
四足机器人
人工智能
2020年6月复盘
一:阅读方面本月共听书24.6个小时,听完9本,并写完28篇
阅读笔记
1.好妈妈胜过好老师❤️❤️❤️❤️❤️2.不管教的勇气❤️❤️❤️❤️❤️3.解放父母,解放孩子❤️❤
Carol_f059
·
2023-12-02 09:09
碎片
阅读笔记
摘录
很喜欢一段关于成长的描述:“人的成长有三个阶段,第一个阶段明白世界不必围着自己转;第二个阶段,知道向善也不一定会被厚待;第三个阶段,即便知道结果不好依然会选择拼命奔跑。”清流哥读的《政治秩序的起源》里,作者福山还说过一句话:“人类能征服自己所处的环境的伟大,来自于对未来积极的准备。”与爸爸妈妈:做散文《牵一只蜗牛去散步》里不着急、不浮躁,淡定从容的育人者,领着孩子这个“蜗牛”稳步前行,坚信天生我娃
LEOvyhj
·
2023-12-02 08:08
[2022]《顿悟与启迪:卡罗尔·希尔兹谈写作》作者: [加]卡罗 尔`希尔兹
他仔细翻阅外祖母卡罗尔•希尔兹留下的所有档案——她与女儿、朋友、学生的通信,散文,
阅读笔记
,评论文章和演讲稿等等,梳理出卡罗尔•希尔兹对于写作的种种思考,以《顿悟与启迪》为题结集出版。
刘书朋
·
2023-12-02 04:06
【论文笔记】《SketchMate: Deep Hashing for Million-Scale Human Sketch Retrieval》
《SketchMate:面向百万级人类草图检索的深度哈希算法》论文
阅读笔记
写在前面:水平有限,此笔记仅在本人有限的理解水平上完成,有错误希望读者批评指正。
besslbjwl
·
2023-12-02 01:23
论文笔记
深度学习实战62-
强化学习
在简单游戏领域的应用,利用
强化学习
训练Agent程序的代码和步骤
大家好,我是微学AI,今天给大家介绍一下深度学习实战62-
强化学习
在简单游戏领域的应用,利用
强化学习
训练Agent程序的代码和步骤。本文介绍了如何利用
强化学习
构建智能体程序,而无需使用启发式算法。
微学AI
·
2023-12-02 00:03
深度学习实战(进阶)
深度学习
游戏
人工智能
智能体
强化学习
学习写作黄金法则的几点感悟
文章中讲到4个文件夹分类根据学习4要素(输入,思考,实践,输出)分为听课笔记文件夹,
阅读笔记
文件夹,做课笔记文件夹,社会观察文件夹。
兔子飞飞fray
·
2023-12-01 23:55
【论文阅读】1 SkyChain:一个深度
强化学习
的动态区块链分片系统
SkyChain一、文献简介二、引言及重要信息2.1研究背景2.2研究目的和意义2.3文献的创新点三、研究内容3.1模型3.2自适应分类账协议3.2.1状态块创建3.2.2合并过程3.2.3拆分过程3.3评价框架3.3.1性能3.3.1.1共识延迟3.3.1.2重新分片延迟3.3.1.3处理事务数3.3.1.4约束3.3.2安全性3.3.3问题介绍四、基于DRL的动态分片框架4.1模型设计4.2训
Camina hacia ti
·
2023-12-01 20:17
论文阅读
区块链
心理营养——
阅读笔记
1
2019.2.19阅读进度P68读完2篇序言和基本理念篇,不知道是概念性的成分比较多,还是因为异地工作关系我和儿子相处的时间不是特别多,正文部分没有想特别分享的,倒是对于序言里面的几句话有所触动。从类型上分,上五年级的儿子应该属于乐天型。记得大概在3岁左右,有一次他妈妈不小心碰倒了暖瓶,他却走过来安慰妈妈。1.改善关系+温和坚定。作者自序里提到,要想改变孩子所谓“偏差行为”,根本之道是要改善孩子和
张家鼎
·
2023-12-01 19:20
《你的脚下,我的脚下》 共读第十天
图片发自App这是我画的大花脸图片发自App
阅读笔记
图片发自App学习单图片发自App这一章令我印象最深刻的是,林方得,因为自大,而飘起来,脱离了队伍,最后导致就三个人,因
zhao哥
·
2023-12-01 19:21
《这才是心理学》
阅读笔记
05
今天写《这才是心理学》第81-118页第5-6章
阅读笔记
。Q14、请整理本章所列举的看上去是因果,其实是相关的案例。从这些案例中,有什么启发?家庭中家用电器数量和避孕。烤箱导致人们使用避孕工具。
来是春初
·
2023-12-01 17:06
《如何高效记忆》- 如何记住几乎所有东西:更多基本原则
从而超出刚好掌握或单纯记忆的程度,这已经被证明能有效的
强化学习
和提高
MrTrying
·
2023-12-01 15:10
无聊中的无聊的下午
我们一直在写,我个人觉得
阅读笔记
好难啊,因为我一直在找错字,我觉得生字很坑人,字会的多的人就根本找不到。好一个坑啊呜呜呜(┯_┯)。
魏博恒
·
2023-12-01 12:16
《少有人走的路》冲突的风险
阅读笔记
爱的最大风险之一,是以谦逊的态度行使权利,这种行为最普遍的结果就是爱的冲突。当我们和某人发生冲突,我们实质上是告诉对方:“你是错的,我是对的。”譬如,父亲批评儿子说:“你最近怎么鬼鬼祟祟的?”其实,父亲的潜台词是:“你不应该鬼鬼祟祟的,你这样是不对的。我有权批评你,因为我就从来都不鬼鬼祟祟的,我是正确的。”批评他人很容易,不仅父母和配偶,人人都可能把批评当成家常便饭,可是,大多数批评只是出于一时的
蒋大来
·
2023-12-01 12:43
【无戒学堂】再阅《小狗钱钱》
进行了拆读消化,写下对我感触章节的
阅读笔记
与感悟。第一章,白色的拉不拉多猎狗钱钱语录:金钱有一些秘密个规律,想要了解这些秘密和规律,前提条件是,你必须真的有这个愿望。
宛青扬
·
2023-12-01 10:03
文章解读与仿真程序复现思路——电力系统保护与控制EI\CSCD\北大核心《基于深度
强化学习
的城市配电网多级动态重构优化运行方法》
这个标题涉及到城市配电网(UrbanPowerDistributionNetwork)的优化运行方法,其中使用了深度
强化学习
(DeepReinforcementLearning)技术,并且特别强调了多级动态重构
电网论文源程序
·
2023-12-01 09:47
文章解读
重构
电网
能源
规划
配电网重构
《洞见》听书笔记
#樊登读书·听书打卡D8#阅读时间:2021.07.14阅读书目:《洞见》本书作者:罗伯特·赖特
阅读笔记
:看完思维导图,听完音频,再看文字稿,还是感觉不太懂。
婷婷的舞女裙
·
2023-12-01 08:12
阅读笔记
(十)——自己的人生可以由自己选择
不知道昨天青年想得如何了,但不管怎样,我们还是要继续下去的:“人处于未成年状态不在于缺乏理智,而在于没有他人的教导就缺乏运用自己理智的决心和勇气。也就是说,人处于未成年状态是自己的责任。”介绍一段康德的话。关于自立,我希望你能好好地想一想。为了回避作为教育者的责任、作为监督者者的责任、如果是父母那就是作为父母的责任,就必须支配孩子,其实,一切都是为了保全自身。是的,教育者就是孤独的存在。不期待学生
筱语梦荷
·
2023-12-01 07:04
阅读笔记
-Looking beyond two frames: end-to-end multi-object tracking using spatial and temporal trans...
来源:arXiv:2103.14829v1title这篇文章的目标是利用transformer实现真正的端到端多目标跟踪器的训练,这里的端到端是指给定一段图像序列,网络能够自动的处理轨迹的产生和终止以及生长。具体而言,提出的MO3TR模型使用temporaltransformer实现每个轨迹历史特征的融合并预测当前时刻该轨迹的特征,另外使用spatialtransformer刻画object之间的
熙熙江湖
·
2023-12-01 05:05
《传播学教程》
阅读笔记
06:传播效果
今天写第十章和第十一章上半部分
阅读笔记
。1.受众即市场,是大多数媒体机构的基本观点。反映了传媒活动的某些特性,如经营性,商品性,和竞争性,能够接受出受众作为消费者的某些行为特定。
来是春初
·
2023-12-01 02:17
阅读笔记
2
阅读笔记
2《再活一次,用写作来调心》2019/1/6今日再读这本小书。其实已经读完了一遍,也录音录了一遍,但是我觉得我还可以继续从这本书里得到一些力量。
无弦凡音
·
2023-12-01 01:28
重温
强化学习
之策略梯度算法
1、介绍这里仍考虑无模型的方法:策略是从值函数中导出的,使用贪婪的方法导出最优策略,使用e贪婪策略导出行为策略,直接参数化策略考虑之前
强化学习
分类:基于值函数的方法:学习值函数、用值函数导出策略基于策略的方法
BUPT-WT
·
2023-12-01 01:10
强化学习
DDPG深度确定性策略梯度算法概述
目录1.Critic网络2.Actor网络3.主要技巧4.补充说明DDPG(DeepDeterministicPolicyGradient)是连续控制领域的经典
强化学习
算法,是结合PG和DQN的一种off-policy
北极与幽蓝
·
2023-12-01 01:10
强化学习
强化学习
DDPG
深度
强化学习
-策略梯度算法深入理解
1引言在深度
强化学习
-策略梯度算法推导博文中,采用了两种方法推导策略梯度算法,并给出了Reinforce算法的伪代码。
indigo love
·
2023-12-01 01:40
深度强化学习
算法
机器学习
强化学习
人工智能
表格型方法
表格型方法概念
强化学习
是一个与时间相关的序列决策的问题。概率函数与奖励函数概率函数定量地表达状态转移的概率,其可以表现环境的随机性。
数分虐我千百遍
·
2023-12-01 01:38
深度学习
策略算法与Actor-Critic网络
策略算法教程链接DataWhale
强化学习
课程JoyRLhttps://johnjim0816.com/joyrl-book/#/ch7/main策略梯度与前面的基于价值的算法不同,这类算法直接对策略本身进行近似优化
数分虐我千百遍
·
2023-12-01 01:38
算法
Policy Gradient策略梯度算法详解
1.基本思想PolicyGradient策略梯度(PG),是一种基于策略的
强化学习
算法,不少帖子会讲到从基于值的算法(Q-learning/DQN/Saras)到基于策略的算法难以理解,我的理解是两者是完全两套思路
好程序不脱发
·
2023-12-01 01:08
强化学习
算法
人工智能
强化学习
机器学习
《远见》
阅读笔记
一
图片发自App最近在看生涯天赋营老师推荐的书《远见》。这是一本关于职业规划的书籍,它把我们从眼前的工作拉向了未来几十年后的整个人生长画卷的大视野,它告诉我们,不要以为职业生涯规划仅仅就是工作的计划,其实规划的是我们整整一生的工作、生活的方方面面。让我们一起开启有计划、有目标的人生蓝图的绘制吧。作者在开篇说到,《远见》着眼于一个终极问题:什么是成功的职业生涯?成功的职业生涯不在于找到热爱的工作,而在
童心麻麻
·
2023-12-01 00:05
《教作文有窍门》
阅读笔记
1.世上没有一个人的性格与他人是完全一样的,正如世上没有完全相同的两片叶子。漫画家正是抓住了人物独一无二的特征,并把它尽量夸大,所以描绘出的人物栩栩如生。我们也要学习漫画家独到的视角和杰出的表现能力,尽量抓住描写对象的特征,做到写谁像谁。2.大作家之所以能将笔下的人物写活,就是因为他写什么人物,就把自己变成什么人物,从那个人物的身份、性别、年龄、性格等去体味,去揣摩,进入角色。俗话说:“说一千,道
瑾言_c799
·
2023-11-30 23:24
阅读笔记
:达成人生重要联盟
之前聊到了奈特和帕克斯的约会,他分享了自己的过往,还把自己公司的一切坦率的讲给她听,也说了自己想要创造的未来帕克斯小姐的反馈是奈特是与众不同的,独自一人环游世界,还有勇气开办了一家运转了几年的公司其他的男孩子,她以前约会的,大多时候都会谈论运动和汽车第二次约会,奈特了解到,帕克斯的父亲是一位律师,家里面有兄弟姐妹五人,她很爱家人,家里面的环境带给她的是不安全感,她说了好多关于安全感的事,选择会计学
施吉涛
·
2023-11-30 22:39
2022-1-18晨间日记
清朗寒冷心情:还好,偶尔有点丧纪念日:无任务清单昨日完成的任务,最重要的三件事:背单词、学法考,没做题,时间利用不足改进:较前一天学习认真了很多习惯养成:早起、吃维生素B族C和E周目标·完成进度运动0,美容0,
阅读笔记
悟空小白
·
2023-11-30 21:04
今日
阅读笔记
2018.7.3图片发自App1.爱是行动,不是空想。2.真正的爱不是忘乎所以,而是深思熟虑,是奉献全身心的重大决定。3.爱的唯一目的是促进成熟和人性的进步。4.懂得自尊自爱,就不会自欺欺人。5.把别人当成快乐源头,到头来一定是备受打击。6.爱是一种特殊的“任务”,非爱的本质则是懒惰。
雪砾
·
2023-11-30 18:46
《轻松读懂财报》
阅读笔记
06
这本书已经读到204页,还有一章就读完了。第五章是写会计师视角看财报,第四章写证券分析师视角看财报,有一期的作业是,试比较会计师视角与证券分析师视角,在分析财报时,有什么相同之处,有什么不同之处?相同之处是:他们都是以财报为对象,具体都是针对财报里会计科目以及相互关系分析。都会注意看财报不能单一看一张报表,要损益表,资产负债表,现金流量表一起看。还有一点相同是,在用各自的视角看财报时,都有一根线,
来是春初
·
2023-11-30 17:10
上一页
27
28
29
30
31
32
33
34
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他