cuiwader

CNTK与深度强化学习笔记之一：环境搭建和基本概念

如需转载，请指明出处。

前言

深度强化学习是人工智能当前的热点，CNTK也是微软力推的深度学习框架，2.x版本比之前有了长足的进步。目前国内将这两者融合起来的文章还不多。因此写作了这个学习笔记，希望能对大家有所帮助。

硬件，开发环境以及CNTK安装

CNTK可能是为数不多的在Windows平台同样支持CUDA和cuDNN加速的框架了。CNTK某些示例，虽然在CPU的环境下面也可以运行，但是速度实在是太慢了。因此推荐支持CUDA的Nvidia GPU，支持列表这里可以查到：CUDA GPUs。从列表中可以看到，如果想要买个游戏本做深度学习，GeForce GTX 1060是移动版本里面最便宜的支持CUDA的GPU。我正是使用了这个型号的游戏本。大概测试了一下CPU和GPU训练的性能差别，在用CNTK的ConvNet的示例训练MNIST时，使用GPU一个Epoch在2秒以内，使用“nvidia-smi -l 1”命令查看GPU的使用率，在95%以上。CPU（i7-7700HQ）需要大概50秒，使用率达到了100%。

开发环境需要在Ubuntu上面（推荐使用Ubuntu 14.04或者Ubuntu 16.04，本文使用的是Ubuntu 16.04），并且推荐使用Anaconda3的最新版本（本文使用的是Anaconda3-4.4.0，Python 3.6版本）。必须用Ubuntu的原因是，官方的DQN示例使用了gym。gym是由OpenAI开发的工具集，提供了强化学习中的环境（environment）接口，用来开发和对比强化学习算法。gym目前只支持Linux（只有有限的环境可以在Windows上面运行）。gym的安装配置官方文档也很清楚了：gym。

需要说明的是，Ubuntu 16.04默认的是开源版本的驱动，不支持GeForce GTX 1060，需要安装Nvidia的官方闭源驱动。我直接使用了Ubuntu的repo，命令"sudo apt-get install nvidia-375"就可以了。如果需要最新的驱动，也可以去Nvidia下载。用apt-get安装的另外一个好处是CUDA也会被一同安装。自己下载驱动的话需要安装CUDA。

CNTK官方文档给出了非常详细的安装过程，这里就不再重复。请参考CNTK的主页： CNTK。本文写作的时候，CNTK的版本是2.1（2017-07-31. CNTK 2.1）。

深度强化学习和DQN

目前我阅读到的，讲解深度强化学习最好的一篇文章来自Tambet Matiisen的DEMYSTIFYING DEEP REINFORCEMENT LEARNING。以下的内容基本上是对这篇文章的精简翻译（去掉少许内容并且加上我自己的理解）。

深度强化学习

2013年12月19日，DeepMind公司在Arxiv上发表了一篇论文：Playing Atari with Deep Reinforcement Learning。论文展示了他们如何使用强化学习，仅仅通过屏幕像素和分数作为奖赏，让电脑玩2600个雅达利的视频游戏。这个结果的意义在于，这些游戏和游戏要达到的目标都是不同的，并且是设计来挑战人类的。论文中提到的模型，不需要任何改变，就可以用来学习七个不同的游戏，并且在其中三个游戏中，模型的成绩比人类还好。这是迈向通用人工智能（强人工智能）的第一步：AI可以适应不同的环境，而不是限定于某个领域，例如玩象棋。发表了这个论文之后，DeepMind立刻就被Google收购了，并且一直引领了深度学习的研究。2015年2月，DeepMind又在自然杂志封面发表了论文Human-level control through deep reinforcement learning。在该论文中，DeepMind将同样的模型用到了49个游戏中，并且有半数取得了超人的成绩。

深度学习和强化学习的结合，无疑是近几年人工智能领域的热点。按照Yoshua Bengio的观点，目前的深度学习和所谓智能系统的表现，表明当前我们只做到了非常肤浅的部分，还远远没有触及智能的本源。我们必须去研究机器如何观察世界、理解世界，研究高层抽象，进行认知方面的探索。这个世界既包括真实世界，也可以是简单如视频游戏的虚拟环境。详见Andrew Ng对Bengio的访谈视频：Heroes of Deep Learning: Andrew Ng interviews Yoshua Bengio。后面我们也可以看到，用深度强化学习处理问题，更加的自然。

将深度学习和强化学习结合，有几个问题需要解决，后面的内容详细探讨这些问题：

强化学习的主要挑战：功劳分配问题(credit assignment problem)，以及探索和开发困境（exploration-exploitation dilemma，也有翻译为探索和利用）。
如何用数学形式表示深度学习问题：MDP（马尔科夫决策过程，Markov Decision Process）。
如何形成长期策略：折扣的未来奖励（discounted future reward）。
如何估计和逼近未来奖励：Q-learning算法。
如何表示巨大的状态空间：深度神经网络。
如何稳定学习：经历重放技术（experience replay technique）。

强化学习

考虑Breakout这个打砖块游戏。假定我们要教一个神经网络玩这个游戏。网络的输入应该是屏幕图像，输出应该是三个动作：左，右和发射球。如下图：

我们可能想到的是，这个问题可以作为一个分类问题，每个游戏屏幕对应一个动作。但是这样我们就需要大量的训练样本。当然我们可以找高手来玩并且录制游戏，但是这样不是人类真正如何学习的。我们不需要别人上百万次的告诉我们，哪个屏幕应该如何应对。我们只需要偶尔有点反馈说我们做对了，然后我们自己就可以搞明白怎么玩了。

这就是强化学习要解决的问题。强化学习介于监督学习和非监督学习之间。监督学习需要每个训练数据都被标注，而非监督学习完全不需要标注。强化学习有稀疏的时延的标注，即奖励（Reward）。Agent从这些奖励中，学习如何与环境（Environment）互动。

这个概念是很直观的，但是在实践中有很多挑战。例如当我们击中了某个砖块并拿到了一个分数奖励，它通常跟刚刚拿到奖励之前的动作没有关系，所有需要的工作都已经完成了。这被称为功劳分配问题（credit assignment problem），例如，之前的哪些动作（actions）是获得奖励的原因，并且在多大程度上。

当使用某个策略得到了一些奖励，我们应该继续使用这个策略，还是应该尝试一些新的可能产生更好结果的策略？这被称为探索和开发困境（exploration-exploitation dilemma）：我们应该继续开发并且最大化已知策略，还是应该探索可能的更好策略。

###马尔科夫决策过程（MDP）

如何表示一个强化学习问题，使得我们可以推演它呢？最通用的方法是MDP。假定有一个Agent，被至于一个环境中（例如Breakout游戏）。环境被至于一个确定的状态（挡板的位置，球的位置和方向，存在的砖块等等）。Agent在Environment中可以执行一些Action（例如移动挡板到左边或者右边）。这些Action可能产生Reward（例如分数增加）。Action使得Environment发生State迁移，Agent可以执行另外一个Action，如此往复。选择这些Action的规则被成为策略。Environment通常是随机的，意味着下一个State可能是随机的（例如，当我们损失了一个球，发射一个新的球，它会飞向一个随机的方向）。

State和Action的合集，加上从一个State转换到另一个State，以得到Reward的策略，构成了MDP。一段这个过程（例如一局游戏）组成了有限的State，Action和Reward的序列。

\\(s_0, a_0, r_1, s_1, a_1, r_2, s_2, …, s_{n-1}, a_{n-1}, r_n, s_n\\)

这里\\(s_i\\)代表State，\\(a_i\\)是Action，\\(r_{i+1}\\)是执行Action之后的Reward。这段序列结束于最终状态\\(s_n\\)（例如游戏结束屏幕）。马尔科夫决策过程依赖于马尔科夫假设，即下一个State \\(s_{i+1}\\)只依赖于当前State \\(s_i\\)，与之前的State和Action无关。

折扣的未来奖励

为了能有好的长期结果，我们需要考虑的不仅仅是当前的Reward，并且还有将会得到的Reward。但是如何做到呢？

在一个马尔科夫过程中，我们可以很容易的计算一段序列的全部Reward：

\\(R=r_1+r_2+r_3+…+r_n\\)

同理，\\(t\\)之后所以的Reward，可以表示为：

\\(R_t=r_t+r_{t+1}+r_{t+2}+…+r_n\\)

但是因为环境是随机的，我们永远也没有办法保证，即使我们执行了相同的Action序列，我们还可以得到相同的Reward。序列进行的越远，分歧可能会越大。因此，通常都会使用折扣的未来奖励：

\\(R_t=r_t+\gamma r_{t+1}+\gamma^2 r_{t+2}…+\gamma^{n-t} r_n\\)

这里\\(\gamma\\)是折扣系数，取值在0和1之间：越远的Reward，我们越少考虑。容易看出，\\(t\\)之后的折扣的未来奖励，可以用\\(t_{+1}\\)表示：

\\(R_t=r_t+\gamma (r_{t+1}+\gamma (r_{t+2}+…))=r_t+\gamma R_{t+1}\\)

如果设置\\(\gamma=0\\)，那么我们的策略是短视的，只依赖于当前的Reward。如果想平衡当前和将来Reward，一般设置\\(\gamma=0.9\\)。如果我们的环境是确定的，同样的Action序列总是得到相同的Reward，那么可以设置\\(\gamma=1\\)。

Agent的一个好的策略，是总去选择折扣的未来奖励最大的Action。

Q-learning算法

Q-learning算法中，定义了一个函数\\(Q(s,a)\\)，表示在状态\\(s\\)，采取动作\\(a\\)之后的折扣的未来奖励，然后在此基础上继续优化。

\\(Q(s_t,a_t)=max_{\pi} R_{t+1}\\)

对于\\(Q(s,a)\\)，应该这样理解：在状态\\(s\\)采取动作\\(a\\)之后，游戏结束时能拿到的最好分数。它被称为\\(Q\\)函数（Q-function），因为它表示了在某个State下面，某个Action的质量。这听起来有点令人费解。我们知道当前的State和Action，但是不知道下面的State和Action，如何才能估计游戏结束时候的分数？我们确实不能。但是理论上，我们可以假定有这样一个函数。

那么这个函数应该是什么样子呢？假定在状态\\(s\\)，要决定是采取动作\\(a\\)还是\\(b\\)，我们想选择一个动作，使得游戏结束时候的分数最高。当使用Q-function时，答案就很简单：取Q-value最大的动作：

\\(\pi(s) =argmax_a Q(s,a)\\)

这里\\(\pi(s) \\)代表策略，即我们在每个State，选择Action的规则。

但是我们如何得到Q-function？让我们先看一下一个状态转移的情况：\\(\\)，我们可以用下一个状态\\(s’\\)的Q-value，来表示状态\\(s\\)和动作\\(a\\)的Q-value：

\\(Q(s,a)=r + \gamma max_{a’}Q(s’,a’)\\)

这个方程被称为贝尔曼方程：当前State和Action的最大的未来奖励，等于现在的奖励加上下一个状态的最大未来奖励。

Q-learning主要的思想是，我们可以用贝尔曼方程，迭代逼近Q-function。最简单的实现是把Q-function函数实现为一个表格（Q-table），State是行，Action是列。那么Q-learning算法的伪代码如下：

initialize Q[numstates,numactions] arbitrarily
observe initial state s
repeat
	select and carry out an action a
	observe reward r and new state s'
    Q[s,a] = Q[s,a] + α(r + γmaxa' Q[s',a'] - Q[s,a])
    s = s'
until terminated

即从初始状态\\(s\\)开始，从Q-table中遍历所以的行动\\(a\\)，查看\\(a\\)对应的新状态\\(s’\\)，用新状态\\(s’\\)最大的奖励\\(r\\)，更新当前\\(Q[s,a]\\)。\\(α\\)是学习率。当学效率为1时，上面伪代码的等式，就完全和贝尔曼方程一样了。\\(maxa’ Q[s’,a’]\\)在初始阶段只是一个估计值，可能完全是错误的，但是随着迭代的进行，这个估计值会越来越精确。已经被证明，当迭代足够多次以后，\\(Q\\)函数会收敛，并且得到真实的值（Q-value）。

Deep Q Network(DQN)

上面的模型中，打砖块游戏的环境State，是由挡板的位置，球的位置和方向，还有每个砖块的位置定义的。但是这种直观的定义是游戏相关的（记得前面说过DeepMind只需要一个模型就可以玩49个游戏吗？）。那么我们能不能给出更加通用的，适合所有游戏的模型哪？一个明显的选择是用屏幕像素：隐含了所有的游戏状态，除了球的速度和方向，但是用两个连贯的屏幕就可以解决。

如果我们使用DeepMind论文中相同的预处理方法，截取四个最新的屏幕图像，将大小调整为84x84，并且转换成256级灰度，那么我们有\\(256^{84 \times 84 \times 4} \approx 10^{{67970}\\)个状态。相当于上面的Q-table有\\(10}{67970}\\)行。这个数目实在是太大了，并且某些状态可能永远也不能被访问到。因此这个方法不可行。

这里就需要用到深度学习了。神经网络（NN）特别适合结构化数据的特征提取
。我们可以用NN来表示Q-function，将state（四个游戏屏幕）和action作为输入，输出为相应的Q-value。我们也可以将一个游戏屏幕作为输入，输出为每个可能action的Q-value。后面这种方法更有优势，因为如果我们想更新Q-value，或者选择Q-value最大的action，我们只需要对网络前向传播一次，所有action的Q-value就都有了。下图是两种方法的区别：

DeepMind使用的网络结构如下：

这是一个包含了3个卷积层和两个连接层的CNN，不过没有池化层。这个也很好理解，因为池化层提供了平移不变性（translation invariance）：网络对对象在图像中的位置不敏感。但是对于游戏来说，小球的位置对于我们决定reward是至关重要的！我们不能丢弃这个信息！

网络的输入是84x84灰度的游戏屏幕，输出是每个可能状态的Q-value，可以是实数。这是一个回归任务，可以用简单的平方误差损失作优化。

经历重放

现在我们可以在每个状态下面，使用CNN，逼近Q-function，并用Q-learning估算每个state的未来reward。但是实际上，用非线性函数去逼近Q-value不是很稳定。使Q-value收敛，有很多技巧，并且还需要很长的时间（在一个GPU上面，可能需要一周）。

一个最重要的技巧是经历重放。在玩游戏的过程中，所有经历过的\\(\\)都被存储在重放内存中。当训练网络的时候，重放内存中会被随机采样，来替代最近的状态转换。这样就打破了其后训练样本的相关性，从而避免了网络进入一个局部最小值。并且经历重放使得训练变得和通常的监督学习类似，这样可以简化调试和测试。其实人类玩游戏也是这样的。

探索和开发困境

Q-learning解决了功劳分配问题：倒流时光反向传播reward，直到到达真正引起reward的决策点（通过折扣的未来奖励）。现在来看看怎么解决探索和开发困境。

首先，Q-table或者Q-network是随机初始化的，随后初始的预测也是随机的。如果我们选择了最高的Q-value，那么这个选择也是随机的，相当于Agent在进行探索。当Q-function收敛的时候，它会返回稳定的Q-value，探索随之减少。所以我们可以认为，探索是Q-learning算法的一部分。但是这个探索是贪婪的：探索停止于找到的第一个可用策略。

ε-greedy exploration可以简单有效的修正这个问题。ε是随机选择一个Action的概率，否则用贪婪的办法选择Q-value最高的Action。即按照一定概率，选择随机的Action。

深度Q-learning算法

前面给出了基于Q-table的Q-learning算法的伪代码，现在看看带经历重放的深度Q-learning的算法：

initialize replay memory D
initialize action-value function Q with random weights
observe initial state s
repeat
    select an action a
        with probability ε select a random action
        otherwise select a = argmaxa’Q(s,a’)
    carry out action a
    observe reward r and new state s’
    store experience  in replay memory D

    sample random transitions  from replay memory D
    calculate target for each minibatch transition
        if ss’ is terminal state then tt = rr
        otherwise tt = rr + γmaxa’Q(ss’, aa’)
    train the Q network using (tt - Q(ss, aa))^2 as loss

    s = s'
until terminated

从伪代码可以看到，经历重放就是从重放内存中，随机采样，用采样的State的Q-value去训练网络。

除了这个算法，DeepMind还使用了很多其它的技巧，超出了本文的介绍范围。这个算法最神奇之处在于，它确实学习了。想想看，Q-function是随机初始化的。它一开始的输出都是垃圾，没有任何意义。我们把这个垃圾（下一个State的最大Q-value）作为网络的目标，偶尔加入一点Reward。听起来很愚蠢，它怎么能学到点有意义的东西呢？实际上，它学到了。

和最早的版本相比，Q-learning已经有了很大的发展，包括 Double Q-learning, Prioritized Experience Replay, Dueling Network Architecture和 extension to continuous action space等。不过请注意，深度Q-learning已经被Google申请了专利。

公式看的头晕，还是看看代码吧：CNTK与深度强化学习笔记之二： Cart Pole游戏示例

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
18、架构-可观测性之聚合度量大树~~ 架构 java python 后端架构
聚合度量聚合度量是指对系统运行时产生的各种指标数据进行收集、聚合和分析，以了解系统的健康状况和性能表现。聚合度量是可观测性的关键组成部分，通过对度量数据的分析，可以及时发现系统中的异常和瓶颈。以下是对聚合度量各个方面的详细解析，并结合具体的数据案例和技术支撑。指标收集收集系统运行时产生的各种指标数据是聚合度量的基础。常见的指标包括CPU使用率、内存使用率、请求处理时间、请求数、错误率等。以下是指标
教育用心灵温暖心灵
@陈春丽长期学习班冯倩。今天一早就听到说高职合并，取消中专教育的教育信息。感觉是虽然知道，再听还是吓一跳。国家重视职业教育为何还要取消中专技术学校的教育？再听高中就要进行技术教育了，一部分人学习好继续努力学习考大学，一部分人在高中就可以进行职业教育接受职业教育了还要中专技术教育学校干什么呢！a有些职业教育学校转型升级快，不是孩子上完给找工作，而是学校帮孩子创业，我觉得是不错的方向！新闻新你得实时更
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
EIO国际确定性的交易（3/10）资管，资金委托安全吗？古城鹏哥
大家可能都知道资金托管，账户是自己开，钱在自己的账户上，密码是由自己掌控，别人提不走你账户的资金，每天可以看下到自己的账户，也可以看到交易流水。现金只能提到自己的银行卡中。账户由技术人员或操作人员，或者是机构团队帮你操作账户，产生盈利和收入，以获得的利润来分配盈利，技术强硬和做的时间久了过硬技术团队，会保证你的资金本金，不会让你的本金亏损的按照一定比例分配收入。所以在这个过程当中一定要看清楚技术的
OPENAIGC开发者大赛企业组AI黑马奖 | AIGC数智传媒解决方案 RPA中国人工智能 AIGC 传媒
在第二届拯救者杯OPENAIGC开发者大赛中，涌现出一批技术突出、创意卓越的作品。为了让这些优秀项目被更多人看到，我们特意开设了优秀作品报道专栏，旨在展示其独特之处和开发者的精彩故事。无论您是技术专家还是爱好者，希望能带给您不一样的知识和启发。让我们一起探索AIGC的无限可能，见证科技与创意的完美融合！创未来AI应用赛-企业组AI黑马奖作品名称：AIGC数智传媒解决方案参赛团队：深圳市三象智能技术
【六】阿伟开始搭建Kafka学习环境能源恒观中间件学习 kafka spring
阿伟开始搭建Kafka学习环境概述上一篇文章阿伟学习了Kafka的核心概念，并且把市面上流行的消息中间件特性进行了梳理和对比，方便大家在学习过程中进行对比学习，最后梳理了一些Kafka使用中经常遇到的Kafka难题以及解决思路，经过上一篇的学习我相信大家对Kafka有了初步的认识，本篇将继续学习Kafka。一、安装和配置学习一项技术首先要搭建一套服务，而Kafka的运行主要需要部署jdk、zook
提高教师信息素养，提高道德与法治课教学效益长白159宋彦红
提高教师信息素养，提高道德与法治课教学效益随着经济和社会的发展，信息技术已经运用到课堂教学中，为课堂教学展示了一个崭新的天地。的确，信息技术形象、生动、直观性强，能够将课本中的一些抽想的概念直接展示在学生面前，从而调动学生的眼、耳、脑，让他们兴奋起来，变被动学习为主动学习，充分发挥教师的教育引导作用，创造一个可以使学生积极参与的场景。在制作、使用信息技术的实践过程中，本文拟就教师提升信息素养的必要
ExpRe[25] bash外的其它shell：zsh和fish tritone ExpRe bash linux ubuntu shell
文章目录zsh基础配置实用特性插件`autojump`语法高亮自动补全fish优点缺点时效性本篇撰写时间为2021.12.15，由于计算机技术日新月异，博客中所有内容都有时效和版本限制，具体做法不一定总行得通，链接可能改动失效，各种软件的用法可能有修改。但是其中透露的思想往往是值得学习的。本篇前置：ExpRe[10]Ubuntu[2]准备神秘软件、备份恢复软件https://www.cnblogs
开发者关心的那些事圣子足道 ios 游戏编程 apple 支付
我要在app里添加IAP，必须要注册自己的产品标识符（product identifiers）。产品标识符是什么？产品标识符（Product Identifiers）是一串字符串，它用来识别你在应用内贩卖的每件商品。App Store用产品标识符来检索产品信息，标识符只能包含大小写字母（A-Z）、数字（0-9）、下划线（-）、以及圆点(.)。你可以任意排列这些元素，但我们建议你创建标识符时使用
负载均衡器技术Nginx和F5的优缺点对比 bijian1013 nginx F5
对于数据流量过大的网络中，往往单一设备无法承担，需要多台设备进行数据分流，而负载均衡器就是用来将数据分流到多台设备的一个转发器。目前有许多不同的负载均衡技术用以满足不同的应用需求，如软/硬件负载均衡、本地/全局负载均衡、更高
LeetCode[Math] - #9 Palindrome Number Cwind java Algorithm 题解 LeetCode Math
原题链接：#9 Palindrome Number 要求：判断一个整数是否是回文数，不要使用额外的存储空间难度：简单分析：题目限制不允许使用额外的存储空间应指不允许使用O(n)的内存空间，O(1)的内存用于存储中间结果是可以接受的。于是考虑将该整型数反转，然后与原数字进行比较。注：没有看到有关负数是否可以是回文数的明确结论，例如
画图板的基本实现 15700786134 画图板
要实现画图板的基本功能，除了在qq登陆界面中用到的组件和方法外，还需要添加鼠标监听器，和接口实现。首先，需要显示一个JFrame界面： public class DrameFrame extends JFrame { //显示
linux的ps命令被触发 linux
Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照，就是执行ps命令的那个时刻的那些进程，如果想要动态的显示进程信息，就可以使用top命令。要对进程进行监测和控制，首先必须要了解当前进程的情况，也就是需要查看当前进程，而 ps 命令就是最基本同时也是非常强大的进程查看命令。使用该命令可以确定有哪些进程正在运行
Android 音乐播放器下一曲连续跳几首歌肆无忌惮_ android
最近在写安卓音乐播放器的时候遇到个问题。在MediaPlayer播放结束时会回调 player.setOnCompletionListener(new OnCompletionListener() { @Override public void onCompletion(MediaPlayer mp) { mp.reset(); Log.i("H
java导出txt文件的例子知了ing java servlet
代码很简单就一个servlet,如下： package com.eastcom.servlet; import java.io.BufferedOutputStream; import java.io.IOException; import java.net.URLEncoder; import java.sql.Connection; import java.sql.Resu
Scala stack试玩, 提高第三方依赖下载速度矮蛋蛋 scala sbt
原文地址： http://segmentfault.com/a/1190000002894524 sbt下载速度实在是惨不忍睹, 需要做些配置优化下载typesafe离线包, 保存为ivy本地库 wget http://downloads.typesafe.com/typesafe-activator/1.3.4/typesafe-activator-1.3.4.zip 解压r
phantomjs安装(linux，附带环境变量设置) ，以及casperjs安装。 alleni123 linux spider
1. 首先从官网 http://phantomjs.org/下载phantomjs压缩包，解压缩到/root/phantomjs文件夹。 2. 安装依赖 sudo yum install fontconfig freetype libfreetype.so.6 libfontconfig.so.1 libstdc++.so.6 3. 配置环境变量 vi /etc/profil
JAVA IO FileInputStream和FileOutputStream，字节流的打包输出百合不是茶 java核心思想 JAVA IO操作字节流
在程序设计语言中，数据的保存是基本，如果某程序语言不能保存数据那么该语言是不可能存在的，JAVA是当今最流行的面向对象设计语言之一，在保存数据中也有自己独特的一面，字节流和字符流 1，字节流是由字节构成的，字符流是由字符构成的字节流和字符流都是继承的InputStream和OutPutStream ,java中两种最基本的就是字节流和字符流类 FileInputStream
Spring基础实例（依赖注入和控制反转） bijian1013 spring
前提条件：在http://www.springsource.org/download网站上下载Spring框架，并将spring.jar、log4j-1.2.15.jar、commons-logging.jar加载至工程1.武器接口 package com.bijian.spring.base3; public interface Weapon { void kil
HR看重的十大技能 bijian1013 提升能力 HR 成长
一个人掌握何种技能取决于他的兴趣、能力和聪明程度，也取决于他所能支配的资源以及制定的事业目标，拥有过硬技能的人有更多的工作机会。但是，由于经济发展前景不确定，掌握对你的事业有所帮助的技能显得尤为重要。以下是最受雇主欢迎的十种技能。　　一、解决问题的能力　　每天，我们都要在生活和工作中解决一些综合性的问题。那些能够发现问题、解决问题并迅速作出有效决
【Thrift一】Thrift编译安装 bit1129 thrift
什么是Thrift The Apache Thrift software framework, for scalable cross-language services development, combines a software stack with a code generation engine to build services that work efficiently and s
【Avro三】Hadoop MapReduce读写Avro文件 bit1129 mapreduce
Avro是Doug Cutting(此人绝对是神一般的存在）牵头开发的。开发之初就是围绕着完善Hadoop生态系统的数据处理而开展的（使用Avro作为Hadoop MapReduce需要处理数据序列化和反序列化的场景）,因此Hadoop MapReduce集成Avro也就是自然而然的事情。这个例子是一个简单的Hadoop MapReduce读取Avro格式的源文件进行计数统计，然后将计算结果
nginx定制500，502，503，504页面 ronin47 nginx　错误显示
server { listen 80; error_page 500/500.html; error_page 502/502.html; error_page 503/503.html; error_page 504/504.html; location /test {return502;}} 配置很简单，和配
java-1.二叉查找树转为双向链表 bylijinnan 二叉查找树
import java.util.ArrayList; import java.util.List; public class BSTreeToLinkedList { /* 把二元查找树转变成排序的双向链表题目：输入一棵二元查找树，将该二元查找树转换成一个排序的双向链表。要求不能创建任何新的结点，只调整指针的指向。 10 / \ 6 14 / \
Netty源码学习-HTTP-tunnel bylijinnan java netty
Netty关于HTTP tunnel的说明： http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/socket/http/package-summary.html#package_description 这个说明有点太简略了一个完整的例子在这里： https://github.com/bylijinnan
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别 coder_xpf jquery json map val()
JSONUtil.serialize(map)和JSON.toJSONString(map)的区别数据库查询出来的map有一个字段为空通过System.out.println()输出 JSONUtil.serialize(map)： {"one":"1","two":"nul
Hibernate缓存总结 cuishikuan 开源 ssh javaweb hibernate缓存三大框架
一、为什么要用Hibernate缓存？ Hibernate是一个持久层框架，经常访问物理数据库。为了降低应用程序对物理数据源访问的频次，从而提高应用程序的运行性能。缓存内的数据是对物理数据源中的数据的复制，应用程序在运行时从缓存读写数据，在特定的时刻或事件会同步缓存和物理数据源的数据。二、Hibernate缓存原理是怎样的？ Hibernate缓存包括两大类：Hib
CentOs6 dalan_123 centos
首先su - 切换到root下面1、首先要先安装GCC GCC-C++ Openssl等以来模块：yum -y install make gcc gcc-c++ kernel-devel m4 ncurses-devel openssl-devel2、再安装ncurses模块yum -y install ncurses-develyum install ncurses-devel3、下载Erang
10款用 jquery 实现滚动条至页面底端自动加载数据效果 dcj3sjt126com JavaScript
无限滚动自动翻页可以说是web2.0时代的一项堪称伟大的技术，它让我们在浏览页面的时候只需要把滚动条拉到网页底部就能自动显示下一页的结果，改变了一直以来只能通过点击下一页来翻页这种常规做法。无限滚动自动翻页技术的鼻祖是微博的先驱：推特(twitter)，后来必应图片搜索、谷歌图片搜索、google reader、箱包批发网等纷纷抄袭了这一项技术，于是靠滚动浏览器滚动条
ImageButton去边框&Button或者ImageButton的背景透明 dcj3sjt126com imagebutton
在ImageButton中载入图片后，很多人会觉得有图片周围的白边会影响到美观，其实解决这个问题有两种方法一种方法是将ImageButton的背景改为所需要的图片。如：android:background="@drawable/XXX" 第二种方法就是将ImageButton背景改为透明，这个方法更常用在XML里； <ImageBut
JSP之c:foreach eksliang jsp forearch
原文出自：http://www.cnblogs.com/draem0507/archive/2012/09/24/2699745.html <c:forEach>标签用于通用数据循环，它有以下属性属性描述是否必须缺省值 items 进行循环的项目否无 begin 开始条件否 0 end 结束条件否集合中的最后一个项目 step 步长否 1
Android实现主动连接蓝牙耳机 gqdy365 android
在Android程序中可以实现自动扫描蓝牙、配对蓝牙、建立数据通道。蓝牙分不同类型，这篇文字只讨论如何与蓝牙耳机连接。大致可以分三步：一、扫描蓝牙设备： 1、注册并监听广播： BluetoothAdapter.ACTION_DISCOVERY_STARTED BluetoothDevice.ACTION_FOUND BluetoothAdapter.ACTION_DIS
android学习轨迹之四：org.json.JSONException: No value for hyz301 json
org.json.JSONException: No value for items 在JSON解析中会遇到一种错误，很常见的错误 06-21 12:19:08.714 2098-2127/com.jikexueyuan.secret I/System.out﹕ Result:{"status":1,"page":1,&
干货分享：从零开始学编程系列汇总 justjavac 编程
程序员总爱重新发明轮子，于是做了要给轮子汇总。从零开始写个编译器吧系列 (知乎专栏) 从零开始写一个简单的操作系统 (伯乐在线) 从零开始写JavaScript框架 (图灵社区) 从零开始写jQuery框架 (蓝色理想 ) 从零开始nodejs系列文章 (粉丝日志) 从零开始编写网络游戏
jquery-autocomplete 使用手册 macroli jquery Ajax 脚本
jquery-autocomplete学习一、用前必备官方网站：http://bassistance.de/jquery-plugins/jquery-plugin-autocomplete/ 当前版本：1.1 需要JQuery版本：1.2.6 二、使用 <script src="./jquery-1.3.2.js" type="text/ja
PLSQL-Developer或者Navicat等工具连接远程oracle数据库的详细配置以及数据库编码的修改超声波 oracle plsql
　　在服务器上将Oracle安装好之后接下来要做的就是通过本地机器来远程连接服务器端的oracle数据库，常用的客户端连接工具就是PLSQL-Developer或者Navicat这些工具了。刚开始也是各种报错，什么TNS:no listener;TNS:lost connection;TNS:target hosts...花了一天的时间终于让PLSQL-Developer和Navicat等这些客户
数据仓库数据模型之：极限存储--历史拉链表 superlxw1234 极限存储数据仓库数据模型拉链历史表
在数据仓库的数据模型设计过程中，经常会遇到这样的需求： 1. 数据量比较大; 2. 表中的部分字段会被update,如用户的地址，产品的描述信息，订单的状态等等; 3. 需要查看某一个时间点或者时间段的历史快照信息，比如，查看某一个订单在历史某一个时间点的状态，比如，查看某一个用户在过去某一段时间内，更新过几次等等; 4. 变化的比例和频率不是很大，比如，总共有10
10点睛Spring MVC4.1-全局异常处理 wiselyman spring mvc
10.1 全局异常处理使用@ControllerAdvice注解来实现全局异常处理; 使用@ControllerAdvice的属性缩小处理范围 10.2 演示演示控制器 package com.wisely.web; import org.springframework.stereotype.Controller; import org.spring

CNTK与深度强化学习笔记之一： 环境搭建和基本概念

前言