E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习阅读笔记
强化学习
(TD3)
DDPG源于DQN,DQN源于Q_learning,这些算法都是通过估计Q值来寻找最优的策略,在
强化学习
中,更新Q网络的目标值ta
sssjjww
·
2024-02-19 11:09
强化学习
python
神经网络
深度学习
计算机操作系统-笔记
现代操作系统
阅读笔记
第一章引论1.操作系统定义操作系统是运行在内核态的软件,它执行两个基本上独立的任务。隐藏计算机底层硬件的实现,为用户及应用程序提供一个资源集的清晰抽象。管理计算机硬件资源。
C+ 安口木
·
2024-02-19 10:30
计算机
笔记
microsoft
NLP_ChatGPT的RLHF实战
文章目录介绍小结介绍ChatGPT之所以成为ChatGPT,基于人类反馈的
强化学习
是其中重要的一环。
you_are_my_sunshine*
·
2024-02-15 09:41
NLP
大模型
chatgpt
自然语言处理
人工智能
DCNNs之DNA论文
阅读笔记
Article:DeepConvolutionalNeuralNetworkArchitectureWithReconfigurableComputationPatternsJournalTitle:IEEETransactionsonVeryLargeScaleIntegration(VLSI)SystemsIssue:No.08-Aug.(2017vol.25)ISSN:1063-8210pp
苏十一0421
·
2024-02-15 08:46
基于Monte Carlo 的策略评估
基于MonteCarlo的策略评估在
强化学习
中,MonteCarlo是一种被广泛用到的方法。这种方法主要是从经验experience中拟合数值,本质上就是从不同的采样中获得结果,然后将其平均。
Longlongaaago
·
2024-02-15 07:36
机器学习
人工智能
强化学习
机器学习
强化学习
On-policy vs Off-policy
强化学习
On-policyvsOff-policy这里我们讲讲
强化学习
中on-policy和off-policy的区别。
Longlongaaago
·
2024-02-15 07:36
机器学习
强化学习
机器学习
人工智能
《计算机组成与设计 RSIC-V版》
阅读笔记
——计算机抽象及相关技术
第一章:计算机抽象及相关技术介绍相关概念和定义;介绍软件和硬件的组成部分;介绍如何评估性能和功耗;介绍技术发展方向;打基础似的一章引言:计算应用分类个人计算机PC-->个人移动设备(PerisonalMobileDevice,PMD)服务器(更强调可靠性,故障的代价高)-->云计算(软件即服务,SaaS)嵌入式计算机(特定的需求,通常人们对故障的容忍度较低)软件开发思维:减少程序占用的内容空间以加
hhh_YangGe
·
2024-02-15 06:09
RSIC-V
架构
《计算机组成与设计 RSIC-V版》
阅读笔记
——前言、目录
前言阅读重点展示硬件和软件之间的关系,并关注现代计算机的基本概念做硬件的人,设计出更适合跑软件的硬件做软件的人,设计出更适应硬件的软件把程序改造成并行的。让程序员尽可能不知道他们正在使用的底层硬件的并行属性?导读方案(这还蛮好的,可惜正文小标题上没有单独标记推荐阅读方式)
hhh_YangGe
·
2024-02-15 06:39
RSIC-V
架构
【阅读】导演感官-掌握导演力的六感修炼手册
作者:【美】西蒙尼·巴勒戴萨吉(SimoneBartesaghi)著;张克译
阅读笔记
【前言】1、导演是故事的讲述者。交流才是关键所在。
上宫
·
2024-02-15 05:19
人类心灵对空间和时间认知,把握他人心灵状态的能力,心灵意向性
阅读笔记
第168/365天今日阅读《用得上的哲学》——破解日常难题的99种思考方法作者:徐英瑾第三章:心灵哲学:谁在思考?62、人类的心灵对空间的认知。
蓝色多莉
·
2024-02-15 02:53
今日arXiv最热NLP大模型论文:无需数据集,大模型可通过
强化学习
与实体环境高效对齐 | ICLR2024
相比之下,
强化学习
(RL)能够通过试错的方法从零开始学习策略,从而确保内部嵌入知识与环境的对齐。但是,怎样将先验知识高效地融入这样的学习过程是一大挑战,为了解决这一差距
夕小瑶
·
2024-02-15 02:56
自然语言处理
人工智能
深度学习
十三、枚举
文章目录枚举4.1基础4.2实现枚举4.3自定义枚举枚举本文为书籍《Java编程的逻辑》1和《剑指Java:核心原理与应用实践》2
阅读笔记
枚举是一种特殊的数据,它的取值是有限的,是可以枚举出来的,比如一年有四季
那时间总是跑得很潇洒
·
2024-02-15 02:25
java系编程
java
开发语言
十二、内部类
文章目录内部类3.1静态内部类3.2成员内部类3.3方法内部类3.4匿名内部类内部类本文为书籍《Java编程的逻辑》1和《剑指Java:核心原理与应用实践》2
阅读笔记
类都对应于一个独立的Java源文件,
那时间总是跑得很潇洒
·
2024-02-15 02:55
java系编程
开发语言
java
2021.05.02关于潜能的谎言
多莉
阅读笔记
第116/365天今日阅读:《无限可能》——快速唤醒你的学习脑[美]吉姆·奎克著王小皓译第二部分:打破充满限制的思维模式第6章:7个关于潜能的谎言。谎言1,智力是个固定值。
蓝色多莉
·
2024-02-15 01:03
阅读笔记
:16条宇宙法则
对于生命,每个人有自己的感悟。这16条宇宙法则,直指生命的真相,拨开迷雾,窥见真理。-01-人有两次生命的诞生,一次是你肉体出生,一次是你灵魂觉醒。当你觉醒时,你将不再寻找爱,而是成为爱,创造爱!当你觉醒时,你才开始真实的、真正的活着!-02-当你愿利益众生时,所有的资源都会流向你,因为资源是服务众生的。这包括:能量、财富、愿力等。-03-懂得爱,成为爱的那一天,你将不再寻找爱、追求爱、渴望爱。幸
让爱在每一天
·
2024-02-15 00:56
强化学习
-赵世钰(三):贝尔曼最优公式【Bellman Optimality Equation】、最优策略【Optimal Policy/Optimal State Values】
一、Motivatingexamples二、最优策略/optimalpolicy三、贝尔曼最优公式【BellmanOptimalityEquation】1、贝尔曼公式/BellmanEquation2、贝尔曼最优公式/BellmanOptimalityEquation对于贝尔曼公式来说,求解statevalue时是依赖于一个给定的π;对于贝尔曼最优公式来说,π是不定的,是需要求解的参数;3、压缩映
u013250861
·
2024-02-14 23:51
强化学习
学习心得-
强化学习
【贝尔曼最优公式】
只为记录学习心得学习视频来源B站up主西湖大学空中机器人:链接:https://www.bilibili.com/video/BV1sd4y167NS/?spm_id_from=333.337.search-card.all.click&vd_source=ad94eb95d81e9e6b1a5d71459ef1a76d目录1.举例入门2.最优策略3.贝尔曼最优公式4.贝尔曼最优公式详细分析5.分
白菜真是菜
·
2024-02-14 23:51
学习心得-强化日记
算法
机器学习
人工智能
【
强化学习
的数学原理】课程笔记(三)——贝尔曼最优公式
RewriteEquation4.ContractionMappingTheorem5.Solution6.Analyzingoptimalpolicies说明:本内容为个人自用学习笔记,整理自b站西湖大学赵世钰老师的【
强化学习
的数学原理
csu一言
·
2024-02-14 23:21
人工智能
机器学习
思维导图DAY1
思维导图练习第一天,通过思维导图的学习养成阅读的好习惯,再通过思维导图做
阅读笔记
相结合!思维导图的学习让逻辑思维更清晰!
黑马时代
·
2024-02-14 22:30
《西南联大求学日记》听书感悟
#樊登读书·听书打卡D3#阅读时间:2021.06.26阅读书目:《西南联大求学日记》本书作者:许渊冲
阅读笔记
:看完了视频满是感动。
婷婷的舞女裙
·
2024-02-14 21:04
如何
强化学习
力度,增强干部能力素质的思考
作为公职人员,要不断加强政治学习,做到严、实,在学习中提升综合能力素质,提高组织工作科学化水平,着力锻造一支爱学习、肯学习、富有成效的学习型干部。一要坚持政治标准,提高学习广度。要健全学习制度,加强对学习活动的动态管理,保证学习活动的经常性和学习内容的系统,锤炼组工干部忠诚、干净、担当的政治品格,以部务会、理论学习中心组学习、每日晨读、开展“夜学课堂”、“匀彩组工”读写交流为抓手,深入学习习近平新
王家遥3
·
2024-02-14 14:15
阅读笔记
阅读中看到一个见解:关于[天下无不是的父母],这包话,父母也会做出错事,做出为人所不能容之事,但身为子女的再不齿也不能加以宣扬,踩着父母的错来展现自己的无辜,进而博取同情。父母有错可以当面讨论,却不应在他人面前说父母的不是。
芋圆闲谈
·
2024-02-14 13:55
读书笔记第14天
【姓名】孙海霞【日期】2022.1.23【天数】第14天【书名】《成就孩子》【页码】001--71【作者】陈真赵卜成【
阅读笔记
】:各界成功的人士都有一个共同点,那就是他们只专注于自己的所长,不过分在意自己的弱点
孙海霞_a364
·
2024-02-14 12:56
十、java 接口
文章目录接口1.1接口的概念1.2接口定义1.3实现接口1.4使用接口1.5接口的细节1.6Java8和Java9对接口的增强接口本文为书籍《Java编程的逻辑》1和《剑指Java:核心原理与应用实践》2
阅读笔记
很多时候
那时间总是跑得很潇洒
·
2024-02-14 12:38
java系编程
java
开发语言
十一、抽象类
文章目录抽象类2.1为什么需要抽象类2.2抽象方法和抽象类2.3抽象类和接口抽象类2.1为什么需要抽象类本文为书籍《Java编程的逻辑》1和《剑指Java:核心原理与应用实践》2
阅读笔记
随着子类越来越多
那时间总是跑得很潇洒
·
2024-02-14 12:38
java系编程
开发语言
八、Java代码的组织机制
文章目录Java代码的组织机制2.1包2.2jar包2.3程序的编译与链接Java代码的组织机制本文为书籍《Java编程的逻辑》1和《剑指Java:核心原理与应用实践》2
阅读笔记
使用任何语言进行编程都有一个类似的问题
那时间总是跑得很潇洒
·
2024-02-14 12:37
java系编程
java
开发语言
【
阅读笔记
】Zero-shot Recognition via Semantic Embeddings and Knowledge Graphs-2018
Abstract我们考虑零样本识别问题:仅利用类别的单词嵌入及其与其他类别的关系来学习具有零训练示例的类别的视觉分类器,并提供视觉数据。处理陌生或新类的关键是将从熟悉类中获得的知识转移到陌生类的描述中。在本文中,我们基于最近引入的图卷积网络(GCN),提出了一种同时使用语义嵌入和类别关系来预测分类器的方法。对于一个已习得的知识图(KG),我们的方法将每个节点(表示视觉类别)作为输入语义嵌入。经过一
一只瓜皮呀
·
2024-02-14 11:19
零样本学习
图神经网络
知识图谱
深度学习
机器学习
Elasticsearch实战
阅读笔记
firstday1.默认情况所有数据全部索引2.es索引为倒排序索引.3.计算文档相关性得分的算法是TF-IDF词频-逆文档频率4.elasticsearch不支持事务!!5.索引文本"bicyclerace"分析步骤将产生"bicycle""race""cycling""racing"(还有现代分词..nb)6.面向文档,意味着索引和搜索数据的最小单位是文档7.文档是无模式的理解索引相当于库27
Wyat,sahar
·
2024-02-14 06:11
elasticsearch
elasticsearch
蓝熊船长的13条命
阅读笔记
在查莫宁世界里,一只小蓝熊就这样诞生了。这只小蓝熊告诉了我们友谊是多么重要、坚持的信念和抉择的重要。在侏儒海盗那里,小蓝熊和侏儒海盗们一起玩耍,侏儒海盗也带着他,给他吃的喝的。他们之间就这样建立了一条友谊与信任的纽带。可小蓝熊逐渐长大,侏儒海盗的船载不下他了,他们之间也只能依依分别。还有在大头颅里,蓝熊与16点之间友谊让“蓝熊多次得到16点的帮助”。在龙卷风城里,蓝熊也是靠龙卷风城里的居民才得以出
脑子进水的海绵宝宝
·
2024-02-14 05:42
探索机器学习:定义、算法及应用领域
目录前言1机器学习的定义2机器学习算法2.1监督学习2.2无监督学习2.3
强化学习
3机器学习的应用3.1智能搜索3.2医疗诊断3.3无人驾驶结语前言机器学习,源自ArthurSamuel的定义,赋予计算机通过领域学习的能力
cooldream2009
·
2024-02-14 05:29
AI技术
机器学习
机器学习
算法
人工智能
2019-7-7晨间日记
今天是周末起床:6:20就寝:22:45天气:多云心情:一般纪念日:无任务清单昨日完成的任务,最重要的三件事:运动二十分钟
阅读笔记
日总结改进:少玩会儿游戏,多学些东西。
TOMORROW_cf35
·
2024-02-14 04:42
阅读笔记
||《把生活折腾成你想要的样子》
这周看的一本书叫《把生活折腾成你想要的样子》,作者面白通过讲诉自己的故事、身边同事朋友的故事,结合自己的经历感悟写下了生活中的点点滴滴,书内的文字朴实,且耐人寻味,像是每字每句都作者用心良苦斟酌后的人生哲言。(看到下图时觉得小娃娃很可爱,你绝对想不到这张图是在做广告,主角竟是小娃娃脚下的鞋子)触动心灵的部分话语整理如下:“不要怀疑现在的努力,只是人生晚点了”1、不要做毫无意义的探索,去思考,去观察
幽梦200504
·
2024-02-14 02:01
关注优势不会让孩子盲目自信
阅读笔记
第232/365天今日阅读《让孩子的优势被看见》[澳]莉·沃特斯著闫丛丛译第一部分:发现优势第一章:在执迷于劣势的世界中发现优势一、关于“正确的”教养方式。
蓝色多莉
·
2024-02-14 02:36
2019-01-22
2019.1.22日完成打卡情况1早起(完成)2早睡(没完成)3运动(完成)4
阅读笔记
(完成)5冥想(完成)6复盘(完成)7课程笔记和作业(完成)8日程管理(完成)
世界本来美好
·
2024-02-13 23:59
大模型评测和
强化学习
知识
1大模型怎么评测?大语言模型的评测通常涉及以下几个方面:语法和流畅度:评估模型生成的文本是否符合语法规则,并且是否流畅自然。这可以通过人工评估或自动评估指标如困惑度(perplexity)来衡量。语义准确性:评估模型生成的文本是否准确传达了所需的含义,并且是否避免了歧义或模棱两可的表达。这需要通过人工评估来判断,通常需要领域专家的参与。上下文一致性:评估模型在生成长篇文本时是否能够保持一致的上下文
lichunericli
·
2024-02-13 19:26
LLM
人工智能
语言模型
今日读书小思
下午整理了一下《米格尔街》和《鼠疫》的
阅读笔记
,有摘抄的句子,有临时的感想,并录入进电脑里。这个过程很享受,也多少需要花点时间。回顾,往往是人前进的基础,只是今天的高效生活不太允许我们回顾,以及反思。
千白莫
·
2024-02-13 19:12
Black Beauty
阅读笔记
(3)
1.dog-cart「dog-cart」也可写成「dogcart」,特指由一匹马拉的容两个人背靠背坐的轻便马车,也可指小狗拉的车。2.coupe、cabriolet「coupe」双座四轮轿式马车「cabriolet」指单马双轮轻便马车;篷式马车3.However,asthemasterspentalongtimeonhisbusiness,wedidnotstartforhometillrathe
杨智麟
·
2024-02-13 17:20
社会中的第3选择
多莉
阅读笔记
第218/365天今日阅读《第三选择》作者:史蒂芬·柯维(美)今日阅读:第七章:社会中的第3选择社会面临着巨大的挑战,比如犯罪,疾病,战争以及精神环境方面的污染,它们就像社会本身的历史一样悠久
蓝色多莉
·
2024-02-13 15:30
感动无处不在
我以为,很久没有真正深入专业,再来接触一个全新的产品设计,很多相关标准陌生,
强化学习
,图纸恐怕难通过。其实顺利通过。…………哎呦喂,什么时候开始那么没有自信的了呢?我几乎一整天都在嘲笑我的自以为是。
冰之怡
·
2024-02-13 14:01
交通流优化的一种
强化学习
方法
本文提出了一种基于
强化学习
的交通流优化方法。我们表明交通流优化问题可以表述为一个马尔可夫决
当交通遇上机器学习
·
2024-02-13 14:40
算法
大数据
编程语言
python
计算机视觉
Android 进阶解密
阅读笔记
12
这篇从Window的增删过程中看看WMS的工作(由于主要从代码上整理,所以代码展示比较多,建议用大屏幕阅读)addViewaddView的操作从WindowManagerGlobal开始经过ViewRootImpl再经过Session最后就会调用WMS的添加窗口方法addWindow。publicintaddWindow(Sessionsession,IWindowclient,intseq,La
jkwen
·
2024-02-13 12:56
学习笔记:Docker
推荐这里
阅读笔记
:Docker笔记〓Docker-一切在云端B站视频地址:尚硅谷Docker阳哥云原生Java架构师的第一课K8s+Docker+KubeSphere+DevOpsDocker仓库:https
Cg心
·
2024-02-13 12:00
学习笔记
java
docker
云原生
linux
bash
【论文
阅读笔记
】UNSUPERVISED REPRESENTATION LEARNING FOR TIME SERIES WITH TEMPORAL NEIGHBORHOOD CODING
UNSUPERVISEDREPRESENTATIONLEARNINGFORTIMESERIESWITHTEMPORALNEIGHBORHOODCODINGABSTRACT 本文提出了一种自监督框架,名为“时间邻域编码”(TemporalNeighborhoodCoding,TNC),用于学习非平稳时间序列的可泛化表示。该方法利用信号生成过程的局部平滑性来定义具有平稳性质的时间邻域。通过使用去偏差对
少写代码少看论文多多睡觉
·
2024-02-13 11:39
#
论文阅读笔记
论文阅读
笔记
Bion)
阅读笔记
(第1册-05-漫长的周末 1897-1919:生命的一部分 - 印度 -1)
Bion家族族徽.png【印度】关于在印度的那段生活,Bion写了9个小节。下面是我对第1小节的阅读体验。关键词:1、家族族徽2、家庭肖像3、客观世界Vs.个人体验4、"王"与“后”5、代际传承6、手足之争7、打破砂锅问到底【1】家族族徽Bion家族族徽2.png“若不是耶和华建造房屋,建造的人就枉然劳力。若不是耶和华看守城池,看守的人就枉然儆醒。”圣歌127.i由此可以看到Bion家族的背景。接
若宁Rena
·
2024-02-13 03:44
阅读笔记
(142):哪个更重要也是有阶段性的
原文:《快速学习的几个基本原则》2016-04-21一、文章概要(还请以阅读原文为主,
阅读笔记
只表达了笔者的理解)(特别长)首先,快速学习,不是指"绝对的速度",而是应该是"总体上的效率"。
卡拉咖啦
·
2024-02-13 03:07
意外的学习
经常听到老师们提到,用思维导图来做
阅读笔记
,记录课程,构思文章框架,记东西也很快,对于我来说,记东西很慢,而且记住的过两天也就忘了,读完了静怡姐的文章,确实好像很神奇。
淡然_591b
·
2024-02-13 02:39
Deep Learning Workload Scheduling in GPU Datacenters:Taxonomy, Challenges and Vision 论文阅读
【论文
阅读笔记
】DeepLearningWorkloadSchedulinginGPUDatacenters:Taxonomy,ChallengesandVision论文链接GPU数据中心的DL工作负载调度
牛码当驴
·
2024-02-13 02:31
云计算
算法
云计算
论文阅读
班主任的核心素养与修炼(
阅读笔记
)
有些班主任,不论接手什么班级,都能带得风生水起。他们除了练得一手治班“好手艺”外,更是具备常人所不知的核心素养。那么,班主任的这些核心素养如何形成?第一,要热爱学生一个只把班主任岗位当工作的教师,或许凭着自己的努力能把班级治理得风平浪静,也能把学生管控得服服帖帖,但他永远走不进学生的生命场域。慢慢地,他就会失去学生的信任,班级也就越带越差。相反,那些热爱学生的班主任看见学生时,眼里有光,心中有爱,
海风轻吹
·
2024-02-13 01:56
陶行知的三大教育思想(
阅读笔记
)
一、“生活即教育”“生活即教育”是陶行知生活教育理论的核心。陶行知指出:“生活教育是生活所原有,生活所自营,生活所必需的教育。教育的根本意义是生活之变化。生活无时不变,即生活无时不含有教育的意义。”既然生活教育是人类社会原来就有的,那么是生活便是教育,所谓“过什么生活便是受什么教育;过好的生活,便是受好的教育,过坏的生活,便是受坏的教育”。他还指出,“生活教育与生俱来,与生同去。出世便是破蒙;进棺
海风轻吹
·
2024-02-13 01:02
ChatGPT的背后原理:大模型、注意力机制、
强化学习
Python学研大本营》,加入读者群,分享更多精彩本文主要介绍为ChatGPT提供动力的机器学习模型,将从大型语言模型的介绍开始,深入探讨使GPT-3得到训练的革命性的自注意机制,然后深入到从人类反馈
强化学习
Python学研大本营
·
2024-02-12 23:17
chatgpt
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他