E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
强化学习阅读笔记
如何让有障碍的孩子获得控制感。
多莉
阅读笔记
第256/365天今日阅读《自驱性成长》作者:【美】威廉·斯蒂克斯鲁德奈得·约翰逊著叶壮译第十一章:学习障碍,注意力缺陷多动障碍及自闭症谱系障碍。
蓝色多莉
·
2024-01-11 02:05
深入分析Linux内核源代码
阅读笔记
第四章、第五章
我的GIS/CS学习笔记:https://github.com/yunwei37/ZJU-CS-GIS-ClassNotes第四章进程描述本章将对进程进行全面的描述。进程定义:所谓进程是由正文段(Text)、用户数据段(UserSegment)以及系统数据段(SystemSegment)共同组成的一个执行环境。它代表程序的执行过程,是一个动态的实体。程序定义:程序只是一个普通文件,是一个机器代码指
云微123
·
2024-01-11 02:42
linux
内核
操作系统
linux
笔记
[Linux内核源码
阅读笔记
] 页式内存管理
注:源码版本3.4.2,参考《Linux内核源码情景分析》页式内存管理页式内存管理的思路是:通过页目录和页表项分两个层次实现从线性地址(虚拟地址空间)到物理地址的映射,这样采用多级页表的映射方式在多数情况下能够减少存储页表项所需的内存空间。二级页表映射示意图:对于32位的系统采用两级映射是比较合理的,对于64位的系统则应采用3级映射三级页表映射示意图:内核空间和用户空间一个32位系统存在4G的虚拟
jiang_T
·
2024-01-11 02:40
Linux内核学习
linux
运维
服务器
泰戈尔经典语录(
阅读笔记
)
让我的爱,像阳光一样,包围着你,又给你光辉灿烂的自由。——泰戈尔《流萤集》我的心是旷野的鸟,在你的眼睛里找到了它的天空。——泰戈尔生活如夏花之绚烂,死如秋叶之静美。——泰戈尔《生如夏花》这寡独的黄昏,幕着雾与雨,我在我心的孤寂里,感觉到它的叹息。——泰戈尔《飞鸟集》纵然伤心,也不要愁眉不展,因为你不知道谁会爱上你的笑容。——泰戈尔友谊和爱情之间的区别在于:友谊意味着两个人和世界,然而爱情意味着两个
海风轻吹
·
2024-01-11 01:25
[
阅读笔记
]产品类
文章目录1.前言2.笔记合集2.1快手主站双列的呈现形式,现在看其实缺乏对内容分层的精细化运营2.1.1原文摘抄2.1.2阅读心得1.前言无他,平时看文章,觉得一些分析与观点挺好的,久了就忘了,特此写一个文章统一记录2.笔记合集2.1快手主站双列的呈现形式,现在看其实缺乏对内容分层的精细化运营2.1.1原文摘抄文章出处:https://mp.weixin.qq.com/s/Hw60yReHn5Fg
happyegg
·
2024-01-11 01:03
产品
学习
大脑具有可塑性
阅读笔记
第193/365天今日阅读《学习天性》——打开高效学习底层逻辑的6把钥匙作者:[英]乔博勒黄邦福译第1章,神经可塑性引发的变革学习钥匙1:每当我们学习的时候,大脑的神经通路就会生成、增强或连接。
蓝色多莉
·
2024-01-11 00:10
Android 进阶解密
阅读笔记
14
本节来说说ClassLoader。首先明确一点它的作用就是用来查找和加载Class文件到虚拟机中。在Java中加载的是jar文件及Class文件,而在Android里显然虚拟机加载的是dex文件,所以Android里的ClassLoader加载的就是dex文件。ClassLoader类这个类是个抽象类,其功能我觉得是规范了一套查找和加载的机制,Java和Android的类加载器都继承自它(当然Ja
jkwen
·
2024-01-11 00:31
STM32蓝牙小车、红外循迹小车、超声波避障小车项目设计
一、前言本文旨在分享我学习STM32的过程中,为了
强化学习
成果,试着制作一些实训项目。最开始做的就是STM32蓝牙小车、STM32红外循迹小车、STM32超声波避障小车。
小小_扫地僧
·
2024-01-10 21:42
32单片机
stm32
嵌入式硬件
单片机
如何成为一个聪明的投资者---《聪明的投资者》
阅读笔记
巴菲特的价值投资理念并非与生俱来。在投资早期,巴菲特也尝试过通过技术分析、套利等方式进行投资,直到1950年。那一年,内布拉斯加大学三年级学生巴菲特阅读了《聪明的投资者》一书后,就像进入了投资的名门大派,豁然开朗。巴菲特说:就好像是在去往大马士革的路上遇到信徒保罗一样。这句话来源于一个典故,即信徒保罗(后来被称为圣保罗)在通往大马士革的路上受到了神的启发,然后皈依了基督教。这句话当中,去往大马士革
东邪惜独
·
2024-01-10 21:38
李元豪成长会:学习新技能的策略2021-04-23
根据认知心理学,以下是三种最好的学习策略:分散练习——把你的学习过程分成小的时间段来进行,而不是死记硬背测试
强化学习
——通过具有挑战性的记忆检索考试来训练你的大脑和记忆解释性提问——问自己一些辅助自己深入研究的问题
李元豪成长会
·
2024-01-10 16:25
强化学习
求解TSP(二):Qlearning求解旅行商问题TSP(提供Python代码)
一、Qlearning简介Q-learning是一种
强化学习
算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。
IT猿手
·
2024-01-10 15:56
TSP
Qlearning
python
python
开发语言
优化算法
进化计算
强化学习
tsp
深度强化学习
TSP(Python):Qlearning求解旅行商问题TSP(提供Python代码)
一、Qlearning简介Q-learning是一种
强化学习
算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。
IT猿手
·
2024-01-10 15:55
Qlearning
python
TSP
python
开发语言
优化算法
强化学习
深度强化学习
tsp
强化学习
求解TSP:Qlearning求解旅行商问题(Traveling salesman problem, TSP)提供Python代码
一、Qlearning简介Q-learning是一种
强化学习
算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。
IT猿手
·
2024-01-10 15:25
python
Qlearning
TSP
python
开发语言
强化学习
深度强化学习
Qlearning
强化学习
求解TSP(一):Qlearning求解旅行商问题TSP(提供Python代码)
一、Qlearning简介Q-learning是一种
强化学习
算法,用于解决基于奖励的决策问题。它是一种无模型的学习方法,通过与环境的交互来学习最优策略。
IT猿手
·
2024-01-10 15:49
Qlearning
python
TSP
python
开发语言
优化算法
tsp
强化学习
CSAPP
阅读笔记
-信息的表示和处理
信息的表示和处理包括整数、浮点数的存储格式、计算中可能存在的问题等信息存储大多数计算机使用8位的块,或者字节(byte),作为最小的可寻址的内存单位,而不是访问内存中单独的位。机器级程序将内存视为一个非常大的字节数组,称为虚拟内存(virtualmemory)。内存的每个字节都由一个唯一的数字来标识,称为它的地址(address),所有可能地址的集合就称为虚拟地址空间(virtualaddress
只想开始
·
2024-01-10 14:37
笔记
c++
以色列-一个民族的重生-
阅读笔记
1.以色列的建立历程据圣经记载,摩西曾带领部分以色列人走出埃及,并在约书亚(Joshua)的领导下征服了迦南(Canaan)的部落城邦。之后,在大约在公元前1000年,大卫王占领了耶路撒冷,并且在包括外约旦在内大部分迦南地区建立起以色列王国。在大卫的儿子所罗门(Solomon)死后,王国一分为二,南为犹大(Judea),北为以色列(Israel)。直到公元133年,耶路撒冷一直是犹太人的政治和宗教
晓明学习
·
2024-01-10 12:28
巜我的作文训练系统》
阅读笔记
第一章“心灵力”训练1、敏感力敏感来自内心。作文写得好的人,拥有两个世界:一个是外在的,看得见、听得到的世界;一个是内在的,看不见、听不到的世界。作文写不好的人,只有一个外在的世界。我们要关注内部世界,关注久了,人就会敏感起来。写作文,要经常回头看看自己的内心,将自己内心的想法、念头写出来,那是非常重要的作文能力。矛盾,是普遍的心理活动。作文中,把人物的矛盾心理充分地展示出来,体现出这个人的成长变
2f2dc6449a04
·
2024-01-10 10:04
强化学习
6——动态规划置策略迭代算法,以悬崖漫步环境为例
策略迭代算法通过策略评估与策略提升不断循环交替,得到最优策略。策略评估固定策略π\piπ不变,估计状态价值函数V一个策略的状态价值函数,在马尔可夫决策过程中提到过:Vπ(s)=∑a∈Aπ(a∣s)(r(s,a)+γ∑s′∈Sp(s′∣s,a)Vπ(s′))V^{\pi}(s)=\sum_{a\inA}\pi(a|s)\left(r(s,a)+\gamma\sum_{s'\inS}p(s'|s,a)
beiketaoerge
·
2024-01-10 07:15
强化学习
算法
动态规划
人工智能
大风起兮云飞扬——读《三十六骑》(9)
阅读笔记
九:今天已全书读完。
澎波先生
·
2024-01-10 04:35
强化学习
在生成式预训练语言模型中的研究现状简单调研
1.绪论本文旨在深入探讨
强化学习
在生成式预训练语言模型中的应用,特别是在对齐优化、提示词优化和经验记忆增强提示词等方面的具体实践。
一条独龙
·
2024-01-10 01:25
机器学习
语言模型
人工智能
机器学习
强化学习
Double DQN方法玩雅达利Breakout游戏完整实现代码与评估pytorch
1.实验环境1.1硬件配置处理器:2*AMDEPYC7773X64-Core内存:1.5TB显卡:8*NVIDIAGeForceRTX309024GB1.2工具环境Python:3.10.12Anaconda:23.7.4系统:Ubuntu22.04.3LTS(GNU/Linux5.15.0-91-genericx86_64)IDE:VSCode1.85.1gym:0.26.2Pytorch:2.
一条独龙
·
2024-01-10 01:22
游戏
python
人工智能
机器学习简答题
监督学习、无监督学习、半监督学习、
强化学习
3、请简述什么是监督学习?什么是无监督学习?有监督学习是指训练数据中包含了输入和输出的标签信息,目标是通过已知输入和输出来预测新数据的标签。
你若盛开,清风自来!
·
2024-01-09 23:08
机器学习
人工智能
强化学习
9——免模型预测算法介绍(蒙特卡洛方法和时步差分方法)
对于大部分情况来说,环境是未知的,也就是说状态转移概率未知,对于这种情况的算法称为免模型预测算法。免模型算法与环境不断交互学习,但是需要大量的运算。蒙特卡洛方法蒙特卡罗方法通过重复随机抽选,之后运用统计概率此方法来从抽样结果中归纳我们想要得到的数值估计。如下图所示,圆面积与正方形面积的比等于落入圆内的点与落入正方形的内的点的比一个状态的价值是它的期望回报,可以采样多条序列,计算从这个状态出发的回报
beiketaoerge
·
2024-01-09 22:30
强化学习
算法
蒙特卡洛
强化学习
时步差分
强化学习
3——马尔可夫性质、马尔科夫决策、状态转移矩阵和回报与策略(上)
如果要用
强化学习
去解决一个实际问题,第一步要做的事情就是把这个实际问题抽象为一个马尔可夫决策过程。马尔可夫决策过程描述马尔可夫决策过程以智能体在与环境交互的过程中,学习的过程。
beiketaoerge
·
2024-01-09 22:59
强化学习
python
深度学习
人工智能
强化学习
1——多臂老虎机(上)
在
强化学习
中,关注智能体在与环境的交互中学习,成为试错型学习。多臂老虎机不存在状态信息,只有动作和奖励,是最简单的“和环境交互中学习“。
beiketaoerge
·
2024-01-09 22:29
强化学习
强化学习
10——免模型控制Q-learning算法
Q-learning算法主要思路由于Vπ(s)=∑a∈Aπ(a∣s)Qπ(s,a)V_\pi(s)=\sum_{a\inA}\pi(a\mids)Q_\pi(s,a)Vπ(s)=∑a∈Aπ(a∣s)Qπ(s,a),当我们直接预测动作价值函数,在决策中选择Q值最大即动作价值最大的动作,则可以使策略和动作价值函数同时最优,那么由上述公式可得,状态价值函数也是最优的。Q(st,at)←Q(st,at)+
beiketaoerge
·
2024-01-09 22:58
强化学习
算法
python
强化学习
关键词阅读法——《阅读7堂课》
多莉
阅读笔记
第130/365天今日阅读《阅读7堂课》作者:秋叶秦阳第3章联机:让网络放大你的阅读视野-35、关键词阅读法。(1)快速浏览信息的方法。·提前想好自己要关注哪些重点信息?
蓝色多莉
·
2024-01-09 17:20
作文无话可说怎么办?
读书要有选择,亲子阅读有助于学生和家长沟通,阅读不要光是囫囵吞枣地读故事,准备一个
阅读笔记
本,好词好句,读后的感受都可以写下来,这个需要坚持,阅读就是积累知识,厚积才能薄发。
钟老师阅读与写作
·
2024-01-09 14:32
阅读:理解力、主动性及目标|《如何阅读一本书》
阅读笔记
|日更VOL1
这是本书的第一篇
阅读笔记
。如果你对本书有兴趣,欢迎关注我,跟我一起阅读~~以下是第一章“阅读的活力与艺术”的内容:太多的资讯如同太少的咨询一样,都是对理解力的一种阻碍。
金小min
·
2024-01-09 10:04
以心换心——用非暴力沟通建立“心的连接”
在我的想法中,我的“线上读书会”能够带着小伙伴们从制定阅读计划开始,渗透一些阅读的方法,以及做
阅读笔记
的方法,然后在看完整本书之后整理书本的内容框架。泛读10本,不如精读1本。
云蔓
·
2024-01-09 10:35
ChatGPT和Web3:人工智能如何帮助您建立和发展您的 Web3 公司
该机器人建立在OpenAI的GPT-3人工智能家族上,并通过监督学习和
强化学习
技术进行了优化。与ChatGPT机器人聊天时,你会感觉自己在与一个懂得一切并以非常教育性的方式回答的朋友交谈。
zgsdzczh
·
2024-01-09 01:09
openai
区块链
人工智能
chatgpt
web3
《小狗钱钱》
阅读笔记
第五章
小狗钱钱脑图可我有其他的烦恼呀,”我吞吞吐吐地说:“我害怕会失去你。我根本没有办法集中思想做那些事情。”这我理解,”钱钱答道:“可是,这正是许多没有钱的人爱犯的错误。他们总是有那么多紧急的事倩要做,以至于没有时间来关注重要的事情。”“我要告诉你三件很重要的事情:首先,你应该在自己遇到困难的时候,仍然坚持自己的意愿。当一切正常的时候,每个人都能做到这一点。可是当真正的困难出现的时候,才见了分晓。只有
麦子时光_新浪
·
2024-01-09 01:28
MATLAB
强化学习
工具箱(四)创建水箱
强化学习
模型
创建水箱
强化学习
模型问题描述行动与观测奖励信号终止信号创建环境对象重置函数本示例说明如何创建一个水箱
强化学习
Simulink®环境,该环境包含一个RLAgent块来代替用于水箱中水位的控制器。
王莽v2
·
2024-01-09 01:46
强化学习
强化学习
matlab
MATLAB
强化学习
工具箱(十一)训练DDPG智能体控制飞行机器人
飞行机器人模型此示例的
强化学习
环境是飞行机器人,其初始条件围绕半径为15m的圆环随机化。机器人的方向也是随机的。机器人具有安装在主体侧面的两个推进器,用于推动和操纵机器人。训练的目标是将机器
王莽v2
·
2024-01-09 01:46
强化学习
强化学习
matlab
MATLAB
强化学习
实战(一)
强化学习
智能体训练总览
强化学习
智能体训练总览简介训练算法情节管理器保存候选智能体并行计算GPU加速验证训练后的策略环境验证简介创建环境和
强化学习
智能体后,您可以使用训练功能在环境中训练智能体。
王莽v2
·
2024-01-09 01:46
强化学习
强化学习
matlab
MATLAB
强化学习
工具箱(三)-创建Simulink环境并训练智能体
使用
强化学习
深度确定性策略梯度(DDPG)智能体。水箱模型此示例的原始模型是水箱模型。目的是控制水箱中的水位。通过进行以下更改来修改原始模型:删除PID控制器。插入RLAgent块。
王莽v2
·
2024-01-09 01:16
强化学习
强化学习
matlab
AI人工智能学习路线图
学习人工智能的基本算法,包括分类、回归、聚类、
强化学习
等。了解常用的人工智能框架,如TensorFlow、PyTorch等。实践并练习,尝试自己解决一些练习题或者实际问题。学
AI论道
·
2024-01-09 01:43
人工智能
学习
强化学习
的数学原理学习笔记 - 策略梯度(Policy Gradient)
文章目录概览:RL方法分类策略梯度(PolicyGradient)BasicPolicyGradient目标函数1:平均状态值目标函数2:平均单步奖励PG梯度计算REINFORCE本系列文章介绍
强化学习
基础知识与经典算法原理
Green Lv
·
2024-01-09 00:24
机器学习
笔记
强化学习
机器学习
人工智能
深度学习
强化学习
的数学原理学习笔记 - 基于模型(Model-based)
方法分类基于模型(Model-Based)值迭代(ValueIteration)策略迭代(PolicyIteration)截断策略迭代(TruncatedPolicyIteration)本系列文章介绍
强化学习
基础知识与经典算法原理
Green Lv
·
2024-01-09 00:20
机器学习
笔记
强化学习
机器学习
人工智能
深度学习
种什么因就结什么果
子今
阅读笔记
3/21种什么因就结什么果,如果你想改变看得见的东西,你必须先改变,看不见的东西。“种瓜得瓜,种豆得豆。”你想结出硕大的财富果,你在心中就要构建宏大的财富蓝图。
子今子安
·
2024-01-08 20:42
【伤寒
强化学习
训练】打卡第八十三天 一期90天
8.5.1小建中汤与黄芪建中汤小建中汤,基本上是因为有饴糖,也就是麦芽糖,才称之为建中汤的。主证没有发干发渴的感觉的时候,芍药减少一点量是没有关系。因为现在人的肠胃有时候比较冷,芍药用多了会拉肚子;基本上乘以0.1的剂量,芍药放足桂枝的两倍没关系。但是觉得自己很需要大补,而用0.3的剂量的时候,芍药的用量就要看一下自己的体质;张仲景说一个容易拉肚子的人,栀子、芍药、大黄类的药都要放少一点,一般抓主
A卐炏澬焚
·
2024-01-08 18:09
2019-01-21 HANA 与 Oracle 12c哪一个更快
的
阅读笔记
,列举了其中的要点。并不代表我的观点。
麦兜的刀
·
2024-01-08 18:11
清单革命的行事原则1——《清单革命》
多莉
阅读笔记
第147/365天今日阅读《清单革命》:如何持续、正确、安全地把事做好。
蓝色多莉
·
2024-01-08 17:53
强化学习
的数学原理学习笔记 - 值函数近似(Value Function Approximation)
文章目录概览:RL方法分类值函数近似(Valuefunctionapproximation)Basicidea目标函数(objectivefunction)优化算法(optimizationalgorithm)Sarsa/Q-learningwithfunctionapproximationSarsawithfunctionapproximationQ-learningwithfunctionap
Green Lv
·
2024-01-08 15:42
机器学习
笔记
强化学习
人工智能
深度学习
机器学习
强化学习
的数学原理学习笔记 - Actor-Critic
Advantageactor-critic)Off-policyAC重要性采样(ImportanceSampling)Off-policyPGOff-policyACDPG(DeterministicAC)本系列文章介绍
强化学习
基础知识与经典算法原理
Green Lv
·
2024-01-08 15:42
机器学习
笔记
强化学习
机器学习
人工智能
深度学习
强化学习
的数学原理学习笔记 - 蒙特卡洛方法(Monte Carlo)
文章目录概览:RL方法分类蒙特卡洛方法(MonteCarlo,MC)MCBasicMCExploringStartsMCε-Greedy本系列文章介绍
强化学习
基础知识与经典算法原理,大部分内容来自西湖大学赵世钰老师的
强化学习
的数学原理课程
Green Lv
·
2024-01-08 15:12
机器学习
笔记
强化学习
机器学习
人工智能
深度学习
蒙特卡洛
强化学习
的数学原理学习笔记 - 时序差分学习(Temporal Difference)
文章目录概览:RL方法分类时序差分学习(TemporalDifference,TD)TDforstatevaluesBasicTDTDvs.MCSarsa(TDforactionvalues)BasicSarsa变体1:ExpectedSarsa变体2:n-stepSarsaQ-learing(TDforoptimalactionvalues)TD算法汇总*随机近似(SA)&随机梯度下降(SGD)
Green Lv
·
2024-01-08 15:40
机器学习
笔记
强化学习
人工智能
机器学习
深度学习
时序差分
机器学习周刊 第4期:动手实战人工智能、计算机科学热门论文、免费的基于ChatGPT API的安卓端语音助手、每日数学、检索增强 (RAG) 生成技术综述
目录:1、动手实战人工智能Hands-onAl2、huggingface的NLP、深度
强化学习
、语音课3、AwesomeJupyter4、计算机科学热门论文5、LLM开发者必读论文:检索增强(RAG)生成技术综述
机器学习算法与Python实战
·
2024-01-08 13:50
人工智能
机器学习
chatgpt
关于论文:Local Relation Learning for Face Forgery Detection
阅读笔记
整体概述首先这是一篇将频域信息与RGB信息相结合的检测方法,同时将不同阶段的RGB信息与包含频域信息的图像进行融合(通过RFAM),拼接后的图像流向两个分支,第一个是输入到分类器中得出分类结果,第二个分支是输入到解码器中,得出操纵掩码(也就是伪造的部分)创新点:1.频域与RGB域相结合()知识点:DCT变换后,高频信息聚集在左上角,低频信息聚集在右下角,高频信息往往是图像的局部细节,低分信息是整幅
一只发呆的猪
·
2024-01-08 11:55
笔记
计算机视觉
人工智能
人工智能知识点总结
人工智能涵盖很多子领域,分别是机器学习,深度学习,自然语言处理,计算机视觉,
强化学习
等。机器学习:是如何设计一个模型和算法来提取数据的模式,从而改善性能进行自主决策。
一只发呆的猪
·
2024-01-08 11:52
人工智能
人工智能
上一页
15
16
17
18
19
20
21
22
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他