小张也是蛮拼的

论文记录笔记NLP(五)：Glove

这篇笔记主要是结合，各种学习资源，整理而成的查找笔记，整理的不好，还望指出错误，主要是用于查找与记录。

Glove：基于全局共现信息的词表示

--Glove，在word2vec基础上的一种改进方法

摘要：

最近学习单词的向量空间表示（vector space representations of words）的方法已成功地使用向量算法（vector arithmetic）捕获细粒度的语义（fine-grained semantic）和句法规则（syntactic regularities ），但这些规则的起源仍然是不透明的（opaque）。我们分析并明确了（explicit）在单词向量中出现这种规则性所需的模型属性（model properties）。结果是一个新的全局logbilinear回归模型，它结合了文献中两个主要模型族的优点：全局矩阵分解（global matrix factorization）和局部上下文窗口方法（local context window methods）。我们的模型通过仅训练单词 - 单词共生矩阵（cooccurrence matrix）中的非零元素而不是整个稀疏矩阵（entire sparse matrix）或大型语料库（a large corpus）中的各个上下文窗口来有效地利用（leverages）统计（statistical ）信息。该模型产生一个具有有意义子结构（meaningful substructure）的向量空间，其最近一个单词类比任务（word analogy task）的性能为75％。它在相似性任务（similarity tasks）和命名实体识别（named entity recognition）方面也优于相关模型。

1. 简介

语言的语义向量空间模型（Semantic vector space models）用实值向量表示每个单词。这些向量可以用作各种应用中的特征，例如信息检索（information retrieval）（Manning等，2008），文档分类（document classification）（Sebastiani，2002），问题回答（question answering）（Tellex等，2003），命名实体识别（named entity recognition）（Turian） et al，2010）和解析（Socher et al，2013）

大多数单词向量方法（Most word vector methods）依赖于单词向量（pairs of word vectors）对之间的距离或角度（angle ），作为评估这样一组单词表示的内在质量（intrinsic quality）的主要方法。最近，Mikolov等人。（2013c）引入了一种基于单词类比（word analogies）的新评估方案（evaluation scheme），通过检查单词向量之间的标量距离（ scalar distance），而不是它们各种不同的差异，探讨（probes）单词向量空间的更精细结构（the finer structure），例如，类比“国王是女王，男人是女人”应该在向量空间中由向量方程式王 - 女王=男人 - 女人编码（be encoded in）。该评估方案（This evaluation scheme）倾向于（favors ）产生意义维度（dimensions of meaning）的模型，从而捕获（thereby capturing）分布式表示的多聚类（multi-clustering）思想（Bengio，2009）.

学习单词向量（learning word vectors）的两个主要模型族（model families）是：**1）全局矩阵分解方法（global matrix factorization），如潜在语义分析（ latent semantic analysis–LSA）（Deerwester等，1990）和2）**局部上下文窗口方法（local context window methods），如skip-gram模型 Mikolov等（2013c）。目前，两类模型方法（both families）都有明显的缺点（ significant drawbacks）。虽然像LSA这样的方法有效地利用（efficiently leverage）了统计信息，但它们对类比任务（word analogy task）这个词的表现相对较差（relatively poorly），表明了次优的向量空间结构（ sub-optimal vector space structure）。像skip-gram这样的方法在类比任务（word analogy task）上可能做得更好，但是它们很难利用（ poorly utilize）语料库的统计数据（the statistics of the corpus），因为它们在单独的本地上下文窗口（local context windows）而不是在全局共现计数（global co-occurrence counts）上进行训练。

在这项工作中，我们分析了产生线性方向意义（linear directions of meaning）所必需的模型属性（model properties necessary），并认为（argue that）全局对数双线性回归模型（global log-bilinear regression models）适合这样做（are appropriate for doing so）。我们提出了一种特定的加权最小二乘模型（specific weighted least squares model），该模型训练全局词 - 词共现计数（global word-word co-occurrence counts），从而有效地利用统计数据（makes efficient use of statistics）。该模型产生一个具有有意义子结构的单词向量空间（a word vector space with meaningful substructure），其最先进的性能（state-of-the-art）是对单词类比数据集的75％准确性所证明（as evidenced by）。我们还证明了（demonstrate ）我们的方法在几个单词相似性任务上（word similarity tasks）以及通用的命名实体识别（common named entity recognition-NER）基准上优于（outperform）其他当前方法（other current methods）.

我们在 http://nlp.stanford.edu/projects/glove/ 上提供了模型的源代码以及训练过的单词向量.

2. 相关工作

矩阵分解方法（Matrix Factorization Methods）。用于生成低维字表示（generating low-dimensional word representations）的矩阵分解方法可以追溯到LSA。这些方法利用低秩近似（utilize low-rank approximations）来分解（decompose ）捕获关于语料库的统计信息（statistical information about a corpus）的大矩阵。由这些矩阵捕获的特定类型的信息因应用而异。在LSA中，矩阵是“术语 - 文档”类型，即，行对应于单词或术语，并且列对应于语料库中的不同文档。相反（In contrast），例如，语言的超空间模拟（the Hyperspace Analogue to Language）（HAL）（Lund和Burgess，1996）利用“术语 - 术语”类型的矩阵，即行和列对应于单词，而条目对应于单词的次数给定的单词出现在另一个给定单词的上下文中。

HAL相关方法的一个主要问题是最频繁的单词对相似性度量的贡献不成比例（the most frequent words contribute a disproportionate amount to the similarity measure）：例如，the和and，他们的语义相关性相对较少（semantic relatedness），但the与or共同出现的次数很多。存在许多解决（addresses）HAL的这种缺点的技术，例如COALS方法（Rohde等人，2006），其中共生矩阵（ co-occurrence matrix）首先通过基于熵或相关的归一化来变换（entropy or correlation-based normalization）。这种类型的变换的优点在于，对于可能跨越8或9个数量级的合理大小的语料库的（which for a reasonably sized corpus might span 8 or 9 orders of magnitude）原始共现计数（raw co-occurrence counts）被压缩，以便在更小的间隔中（a smaller interval）更均匀地分布。各种新模型也采用这种方法（pursue this approach），包括一项研究（Bullinaria和Levy，2007），表明积极的逐点互信息（PPMI）是一个很好的转变。最近，Hellinger PCA（HPCA）形式的平方根类型转换（Lebret和Collobert，2014）已被建议作为学习单词表示（ learning word representations）的有效方式。

基于浅窗的方法（Shallow Window-Based Methods）。另一种方法是学习有助于在本地上下文窗口中进行预测的单词表示。例如，Bengio等人。（2003）引入了一个模型，学习单词矢量表示作为语言建模的简单神经网络体系结构的一部分。 Collobert和Weston（2008）将矢量训练一词与下游训练目标分离，这为Collobert等人铺平了道路（paved the way）。（2011）使用单词的完整（full context of a word）上下文来学习单词表示，而不仅仅是前面的上下文，就像语言模型一样。

最近，用于学习有用的单词表示的完整神经网络结构（full neural network structure）的重要性已经受到质疑（called into question）。 Mikolov等人的skip-gram和连续词袋（CBOW）模型。（2013a）提出了一种基于两个词向量之间的内积的简单单层架构。 Mnih和Kavukcuoglu（2013）也提出了密切相关的矢量对数 - 双线性模型，vLBL和ivLBL，以及Levy等。（2014）提出了基于PPMI度量的显式单词嵌入。

在skip-gram和ivLBL模型中，目标是在给定单词本身的情况下预测单词的上下文，而CBOW和vLBL模型中的目标是在给定其上下文的情况下预测单词。通过对单词类比任务（analogy task）的评估，这些模型展示了（demonstrated）将语言模式（linguistic patterns ）学习为单词向量之间的线性关系的能力。

与矩阵分解方法不同，基于浅窗口的方法的缺点在于它们不直接对语料库的共现统计进行操作（they do not operate directly on the co-occurrence statistics of the corpus）。相反，这些模型扫描整个语料库（corpus）中的上下文窗口，这无法利用数据中的大量重复的信息（which fails to take advantage of the vast amount of repetition in the data）。

3. GloVe 模型

语料库中（corpus）单词出现的统计数据是所有无监督学习单词表示方法的主要信息来源（primary source），虽然现在存在许多这样的方法，如何从这些统计数据产生（meaning）含义，以及生成的单词向量如何表示该（meaning）含义。在本节中，我们对这个问题有所了解（we shed some light on this question）。我们使用我们的见解（insights ）构建一个新的单词表示模型（a new model for word representation），我们称之为GloVe，用于全局向量，因为全局语料库统计数据是由模型直接捕获的（the global corpus statistics）。

首先，我们建立一些符号（notation）。将字 - 词共同出现次数（word-word co-occurrence counts）的矩阵表示为X，其条目表示word j 出现在单词i的上下文中的次数。设是任何单词出现在单词i的上下文中的次数。最后，让是单词j出现的概率.

我们从一个简单的例子开始，展示了如何直接从共现概率（occurrence probabilities）中提取意义的某些方面。考虑两个表示感兴趣的特定方面的词i和j; 具体而言（for concreteness），假设我们对热力学阶段（thermodynamic phase）的概念感兴趣，我们可以采用i = ice和j = steam。可以通过研究它们的共现概率（cooccurrence probabilities）与各种探测词（probe words）k的比率（the ratio of their）来检验（examined）这些词的关系。对于与ice而不是steam相关的单词k，比如说k = solid，我们预计比率会很大。类似地（Similarly），对于与steam而非ice相关的单词k，比如k = gas，该比率应该很小。对于像ice或fashion这样的词语k，无论是ice与steam，还是两者都不相关，这个比例应该接近1。表1显示了这些概率及其与大型语料库的比率（ratios），数字证实了这些期望。与原始概率相比（raw probabilities），该比率能够更好地（is better able to）区分（distinguish）相关词（solid 和 gas）与不相关词（ice和fashion），并且还能够更好地区分（discriminate）两个相关词。

上述论点表明（The above argument suggests that），单词向量学习的适当起点（appropriate starting point）应该是共现概率的比率（ ratios of co-occurrence probabilities）而不是概率本身（probabilities themselves）。注意到比率取决于三个单词i，j和k，最通用的模型采用的形式，

其中是单词向量，是单独的上下文单词向量，其作用将在4.2节中讨论。在该等式中，右侧（right-hand side）是从语料库（corpus）中提取的，并且F可以取决于一些尚未指定（as-of-yet unspecified）的参数。 F的可能性很大（The number of possibilities for F is vast），但通过强制执行一些需求（desiderata ），我们可以选择一个独特的选择。首先，我们希望F对在字向量空间中呈现比率的信息进行编码。由于向量空间本质上是线性结构（inherently linear structures），因此最自然的方法是使用向量差异（vector differences）。有了这个目标，我们可以将我们的考虑限制在仅依赖于两个目标词的差异（the difference of the two target words），修改Eqn的那些函数F. （1）到，

接下来，我们注意到公式（2）中的F的参数是向量，而右侧（right-hand side）是标量（scalar）。虽然F可以被认为是由例如神经网络参数化的复杂函数（complicated function parameterized），但是这样做会混淆（obfuscate）我们试图捕获的线性结构。为了避免这个问题，我们可以先拿参数的点积（dot product），

这可以防止F以不希望（undesirable ）的方式混合矢量尺寸。接下来，请注意（note that），对于单词共现矩阵，单词和上下文单词之间的区别是任意的，我们可以自由地交换这两个角色。为了这样做的一致性（To do so consistently），我们不仅要交换，同时也要交换。我们的最终模型在这种重新标记下（relabeling）应该是不变的（invariant），但是Eqn（3）不是。但是，对称性（symmetry）可以分两步恢复（restored）。首先，我们要求F是群之间的同态（homomorphism）.

其中，由Eqn（3），解决了，

公式（4）的解是F=exp，也就是

接下来，我们注意到公式（6）如果不是右侧的，则表现出交换对称性（exhibit the exchange symmetry）。然而，该项与k无关，因此它可以被吸收到的偏置中。最后，为添加额外的偏差可以恢复对称性（restores the symmetry），

公式（7）是对公式（1）的极大简化。但它实际上是不明确的（it is actually ill-defined），因为只要参数（argument）为零，对数（logarithm）就会发散（diverges）。该问题的一个解决方案（resolution ）是在对数中包括加性偏移（additive shift），它保持了X的稀疏性（sparsity of X），同时避免了分歧（divergences）。将共生矩阵（ co-occurrence matrix ）的对数分解（factorizing the log）的想法与LSA密切相关，我们将使用得到的模型作为我们实验中的基线（baseline）。这种模式的一个主要缺点（A main drawback）是，它平等地权衡所有共现（it weighs all co-occurrences equally），甚至是那些很少或从未发生的共现。这种罕见的共现是嘈杂（noisy）的，并且信息比较频繁的信息少 - 但即使只有零条目（zero entries）占X中数据的75-95％，这取决于词汇量（vocabulary size）和语料库（corpus）。

我们提出了一种新的加权最小二乘回归模型（weighted least squares regression model）来解决这些问题（addresses these problems）。将公式（7）作为最小二乘问题（least squares problem）并将加权函数引入到成本函数中给出了模型

其中V是词汇量的大小（the size of the vocabulary）。加权函数应遵循以下属性（The weighting
function should obey the following properties）：

。如果被视为连续的函数，f应该随着而趋于0，并且有趋于无穷。
f（x）应该是非递减的，以便罕见（rare）的共现（co-occurrences）不会超重（overweighted）。
对于较大的x值，f（x）应该相对较小，因此频繁的（frequent）共现不会超重（overweighted）。

当然，大量函数满足（satisfy ）这些属性，但我们发现可以很好地工作的一类函数可以参数化为，

The performance of the model depends weakly on the cutoff，我们所有的实验都设定我们发现比使用的线性版本提供了适度的改进（modest improvement）。虽然我们仅提供选择3/4值的经验动机（empirical motivation），但有趣的是，发现类似的分数功率缩放（fractional power scaling）以提供最佳性能（best performance）。（Mikolov等，2013a）。

3.1 与其他模式的关系

由于所有的无监督的方法学习单词向量是最终基于语料库的出现统计数据，因此模型之间应具有共性，然而,某些模型仍然在这方面有点不透明,特别是最近skip-gram和ivLBL基于窗口的方法。因此,在本节展示这些模型与我们提出的模型中,定义在Eqn。(8)。

-------------未完，待完善

OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
《策划经理回忆录之二》路基雅虎
话说三年变六年，飘了，飘了……眨眼，2013年5月，老吴回到了他的家乡——油城从新开启他的工作幻想症生涯。很庆幸，这是一家很有追求，同时敢于尝试的，且实力不容低调的新星房企——金源置业(前身泰源置业)更值得庆幸的是第一个盘就是油城十路的标杆之一:金源盛世。2013年5月，到2015年11月，两年的陪伴，迎来了一场大爆发。2000个筹，5万/筹，直接回笼1个亿！！！这……让我开始认真审视这座看似五线
【一起学Rust | 设计模式】习惯语法——使用借用类型作为参数、格式化拼接字符串、构造函数广龙宇一起学Rust #Rust设计模式 rust 设计模式开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、使用借用类型作为参数二、格式化拼接字符串三、使用构造函数总结前言Rust不是传统的面向对象编程语言，它的所有特性，使其独一无二。因此，学习特定于Rust的设计模式是必要的。本系列文章为作者学习《Rust设计模式》的学习笔记以及自己的见解。因此，本系列文章的结构也与此书的结构相同（后续可能会调成结构），基本上分为三个部分
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
git常用命令笔记咩酱-小羊 git 笔记
###用习惯了idea总是不记得git的一些常见命令，需要用到的时候总是担心旁边站了人~~~记个笔记@_@，告诉自己看笔记不丢人初始化初始化一个新的Git仓库gitinit配置配置用户信息gitconfig--globaluser.name"YourName"gitconfig--globaluser.email"[email protected]"基本操作克隆远程仓库gitclone查看
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
《人世间》南询yi
今日分享十点推文，《人世间》有感苏格拉底说：“天地只有三尺，而人在五尺开外，所以人人都要懂得低头。”深以为然。懂得低头，不是认输。而是于人世间找寻温存的成熟，于困境中寻觅柳暗花明的智慧，于争执中展示屈伸自如的格局。正如仰头不是骄傲，是要看见自己的天空；低头也不是认输，而是要看清自己的路。成大事者，不仅要抬头挺胸，还得低头看路。懂得低头，进退有度，不是认输，而是竭尽全力过好这一生。宫崎骏说过：“所有
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
东南林氏之九牧林候选父系祖缘树TheYtree
渊源介绍东晋初年晋安林始祖林禄公入闽，传十世隋右丞林茂，由晋安迁居莆田北螺村。又五世而至林万宠，唐开元间任高平太守，生三子：韬、披、昌。韬公之孙攒，唐德宗立双阙以旌表其孝，时号"阙下林家"。昌公字茂吉，乃万宠公第三子，官兵部司马，配宋氏，生一子名萍。萍于唐贞元间明经及第，官沣洲司马(后追赠中宪大夫)。唐太和年间归隐后，迁居仙游游洋，世称“游洋林”；其后裔居游洋后迁移漳州漳浦路下，由路下林第四房平和
春季养肝正当时 dxn悟
重温快乐2023年2月4日立春。春天来了，春暖花开，小鸟欢唱，那在这样的季节我们如何养肝呢？自然界的春季对应中医五行的木，人体五脏肝属木，“木曰曲直”，是以树干曲曲直直地向上、向外伸长舒展的生发姿态，来形容具有生长、升发、条达、舒畅等特征的食物及现象。根据中医天人相应的理念，肝五行属木，喜条达，主疏泄，与春天相应，所以春天最适合养肝。养肝首先要少生气，因为肝喜条达恶抑郁。人体五志肝为怒，生气发怒最
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
ARM中断处理过程落汤老狗嵌入式linux
一、前言本文主要以ARM体系结构下的中断处理为例，讲述整个中断处理过程中的硬件行为和软件动作。具体整个处理过程分成三个步骤来描述：1、第二章描述了中断处理的准备过程2、第三章描述了当发生中的时候，ARM硬件的行为3、第四章描述了ARM的中断进入过程4、第五章描述了ARM的中断退出过程本文涉及的代码来自3.14内核。另外，本文注意描述ARM指令集的内容，有些sourcecode为了简短一些，删除了T
node.js学习小猿L node.js node.js 学习 vim
node.js学习实操及笔记温故node.js，node.js学习实操过程及笔记~node.js学习视频node.js官网node.js中文网实操笔记githubcsdn笔记为什么学node.js可以让别人访问我们编写的网页为后续的框架学习打下基础，三大框架vuereactangular离不开node.jsnode.js是什么官网：node.js是一个开源的、跨平台的运行JavaScript的运行
怎么做淘客赚钱(2022最新免费淘客盈利的方法) 高省_飞智666600
很多人都不知道什么是淘宝客，今天小编为大家解答一下吧。淘宝客，现在简称淘客，是时下比较流行的一个词语，特质为淘宝店推广商品获取提成的人，这些人没有自己的产品，只是在淘宝里面选择适合自己的产品，在自己比较熟悉的领域推广，把产品卖出去之后，会从淘宝店家那里获得百分之五到百分之五十左右的佣金。淘宝客付出的是什么呢？时间。你需要花时间去选适合自己推广的产品，需要花时间去选自己的推广方法，如果你打算自己做个
烟花美，但瞬间即逝的样子像极了爱情。胡萝卜很甜
我见过烟花在天上绽放时绚烂的模样也目睹过爱情消逝曾经相爱的两人变冷漠的样子其实我特别喜欢烟花绽放的艳丽大年初一凌晨的烟花手机拍的没有眼睛看到的美但是烟花虽美，稍纵即逝，眼睛刚记录下它的美好，就转眼消失不见。天空又恢复一片黑。烟花的样子像极了爱情啊……不论曾经多么山盟海誓，海枯石烂。只要吵架或者分手。就变得那么冷漠，那么陌生。你甚至开始怀疑你有过爱情么？真正的爱情到底是什么样子。来的快去的也快么？对
数据仓库——维度表一致性墨染丶eye 背诵数据仓库
数据仓库基础笔记思维导图已经整理完毕，完整连接为：数据仓库基础知识笔记思维导图维度一致性问题从逻辑层面来看，当一系列星型模型共享一组公共维度时，所涉及的维度称为一致性维度。当维度表存在不一致时，短期的成功难以弥补长期的错误。维度时确保不同过程中信息集成起来实现横向钻取货活动的关键。造成横向钻取失败的原因维度结构的差别，因为维度的差别，分析工作涉及的领域从简单到复杂，但是都是通过复杂的报表来弥补设计
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
01-Git初识 Meereen Git git
01-Git初识概念：一个免费开源，分布式的代码版本控制系统，帮助开发团队维护代码作用：记录代码内容。切换代码版本，多人开发时高效合并代码内容如何学：个人本机使用：Git基础命令和概念多人共享使用：团队开发同一个项目的代码版本管理Git配置用户信息配置：用户名和邮箱，应用在每次提交代码版本时表明自己的身份命令：查看git版本号git-v配置用户名gitconfig--globaluser.name
【穿过丛林看见你】2015年在《诗歌报》读诗日记（一）快快_ce70
写完《三月的领土》和《手握一把锄头，在翻动诗歌的春天》之后，安稳的睡了个好觉，这是从2013年的五月之后，第一次睡的如此安稳和香甜。其实这对于我来说，也没有什么特别的意义和变故，就像我现在的生活在人人忙着踏青、写生、拍照的春天。在我脚下，没有领土的完整，也没有加剧的破碎。我曾经和现在都是个辛勤的“蜂农”，在这样一个角色里，尽管有人盗走了我所有的蜜，但不妨碍我对甜蜜的不懈追求和喜爱。翻开最近的阅读笔
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
【Git】常见命令(仅笔记) 好想有猫猫 Git Linux学习笔记 git 笔记 elasticsearch linux c++
文章目录创建/初始化本地仓库添加本地仓库配置项提交文件查看仓库状态回退仓库查看日志分支删除文件暂存工作区代码远程仓库使用`.gitigore`文件让git不追踪一些文件标签创建/初始化本地仓库gitinit添加本地仓库配置项gitconfig-l#以列表形式显示配置项gitconfiguser.name"ljh"#配置user.namegitconfiguser.email"[email protected]
摩托车加装车载手机充电usb方案/雅马哈USB充电方案开发诚芯微科技社交电子
长途骑行需要给手机与行车记录仪等设备供电，那么，加装USB充电器就相继在两轮电动车上应用起来了。摩托车加装usb充电方案主要应用于汽车、电动自行车、摩托车、房车、渡轮、游艇等交通工具。提供电动车USB充电器方案/摩托车加装usb充电方案/渡轮加装usb充电方案/游艇加装usb充电方案开发。摩托车加装车载手机充电usb方案、汽车游艇改装四孔面板装双USB车充点烟器5V/4A电动车USB充电器输入4.
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class