fearlesslpp

词向量笔记

词向量要点：
一. Efficient Estimation of Word Representations in Vector Space

vector(”King”) - vector(”Man”) + vector(”Woman”) is close to vec(“Queen”)
构建词向量的早期方法有LSA、LDA；
NNLM计算过于复杂，因为有隐藏层和投影层；因此本文将推出没有隐藏层的模型（可能不像神经网络那么精确，但更高效）；RNNLM没有投影层
CBOW的权重矩阵（输入层和投影层之间）对于每个词是共享的，各个词投影到相同的位置（进行叠加）
X = vector(”biggest”) - vector(”big”)+ vector(”small”);France is to Paris as Germany is to Berlin
可用于machine translation, information retrieval and question answering，sentiment analysis and paraphrase detection 等nlp任务；
cbow和skipgram分别适用于什么场景？
Skip-gram在semantic方面更好，cbow在syntactic方面更好

二. Distributed Representations of Words and Phrases and their Compositionality

提出Noise Contrastive Estimation (NCE）和negative sampling（NEG），比hierarchical softmax（HS）更简单；其中NEG是对NCE的简化，二者最大区别 NCE needs both samples and the numerical probabilities of the noise distribution, while Negative sampling uses only samples.
提高向量质量和训练速度；（ subsampling of frequent words during training）
支持短语表示；（treat the phrases as individual tokens during the training）、vec(“Russia”) + vec(“river”) is close to vec(“Volga River”)、vec(“Germany”) + vec(“capital”) is close to vec(“Berlin”)
Skip-gram需要最大化平均似然概率，其中的p(Wt+j|Wt) 需要用（full）softmax计算，但计算量太大，因此采用Hierarchical Softmax（从需要评估W个output nodes到只需要log2W个）； binary tree representation、random walk、Huffman tree ；
subsampling：频率越高的词被丢弃（不被采样）的概率也越大，因为a、the这些词没有太大信息价值；可以提高训练速度，同时训练出的词向量也更准确；
类比推理任务中，NEG比HS准确率更好；甚至比NCE略好；
非线性的RNN比线性的Skip-gram在类比推理任务效果更好（当训练集更大）；
以上这些对CBOW同样适用；因为模型简单，计算高效，适用于更大数据集，因此效果也更好；不同具体问题有不同最优超参数；

词向量有没有现成的、成熟的指标评价质量好坏？
The quality of these representations is measured in a word similarity task
To measure quality of the word vectors, we define a comprehensive test set that contains 5 types of semantic questions, and 9 types of syntactic questions.
（Semantic-Syntactic Word Relationship test set）

三. Distributed Representations of Sentences and Documents

目的和重点是训练Paragraph Vector（特征提取器）；机器学习需要固定长度的特征向量，和词袋比，具有以下优点：有词序、有词义；
文本可以是各种长度，ranging from sentences to document；
对于text representations、sentiment analysis task以及text classication task很有用；
Distributed Memory Model of Paragraph Vectors (PV-DM) 和Distributed Bag of Words version of Paragraph Vector(PV-DBOW)，前者与cbow对应、后者与Skip-gram对应；
PV-DM是根据 paragraph预测next word；paragraph vector和word vectors are averaged or concatenated；通常Using concatenation in PV-DM is often better than sum.
After being trained, the paragraph vectors can be used as features for the paragraph ;
首先训练得到模型的D、W、U、b等参数（已知段落），然后前向计算得到段落特征（未知段落）；推断阶段，输入的段落不能有新词，因为W是固定的
Paragraph Vector同样是从unlabeled data训练得到（与word2vec一样是无监督）；
PV-DM已经很好，但PV-DM和PV-DBOW结合使用更好，通常将两种向量结合作为最终的段落向量
使用Stanford Sentiment Treebank Dataset（是情感分析的benchmark，https://nlp.stanford.edu/sentiment/ ）；使用逻辑回归；
使用IMDB dataset训练多个句子（例如段落、文档），也是来自stanford；
信息抽取（Information Retrieval），从搜索引擎根据关键字查询得到页面（ how a web page matches the query），计算Paragraph Vector的距离（距离越接近的越有可能属于同一个query）；
重点是2.2节和2.3节
和word2vec一样，PV-DM也是在预测下一个词的同时，来训练得到矩阵或向量的，只不过将段落id和段落矩阵‘拉下水’，充当上下文信息（见图2），这样D和W就能同时训练得到
PV-DBOW不考虑词序，只把段落id和矩阵D作为输入（预测的是small window的词），不涉及词向量矩阵（注意，虽然模型简单了，但不容易理解）

word2vec+RNN只能训练单个句子的情感类别，因为不清楚如何结合多个句子之间的表示；而doc2vec可以为任意长的段落生成向量表示；
如果用IMDB dataset的话，只能用doc2vec了？

doc2vec比word2vec情感分析效果更好！
gensim的doc2vec
doc2vec和word2vec结合使用有2种方式：词向量相加和拼接

###########词向量深入思考与实战################

word2vec的编译、训练与使用

下载源码source-archive.zip，解压得到word2vec/trunk目录（源码地址https://code.google.com/archive/p/word2vec/）
利用cygwin进入trunk，执行./demo-word.sh（如果wget没安装，可手动下载text8.zip，并将后缀改为gz，将demo-word.sh中wget注释），如有权限问题，执行chmod 777 *
编译、训练结束会得到5个exe（分别对应5个c文件），以及vectors.bin（可研究下makefile文件）；Vocab size: 71291 Words in train file: 16718843
会提示输入单词或句子，得到距离最近的单词（Cosine distance）；如输入china得到taiwan等，nba得到basketball等，java得到servlet等；
执行./word-analogy vectors.bin进行单词的类比推理，会提示输入3个单词，输入 france paris china，得到一些单词，peking排第一，hangzhou第二，beijing第三。。。
注意：默认使用cbow和NEGATIVE SAMPLING训练

词向量和语言模型的关系：

到目前为止我了解到的所有训练方法都是在训练语言模型的同时，顺便得到词向量的（http://licstar.net/archives/328#s24）；
《Word2vec使用说明》也是说‘词向量有了，语言模型也有了’；
但Efficient Estimation of Word Representations in Vector Space（论文一）又说NNLM语言模型训练可分两步：首先训练词向量，再N-gram NNLM is trained on top of these distributed representations of words；
所以两种方法都存在！
论文一中又拿cbow、skip-gram和NNLM、RNNLM进行比较（比较训练得到的词向量质量，语义语法性能），是不是说明cbow、skip-gram其实也是语言模型呢（New Log-linear Models）？个人认为最好不要这么理解！它是和NNLM、RNNLM顺便得到的词向量进行比较；
论文一强调该论文目的是以上的第一步，即训练词向量，而不管后面训练NNLM，因此不能认为cbow、skip-gram是语言模型；
语言模型其实就是看一句话是不是正常人说出来的。这玩意很有用，比如机器翻译、语音识别得到若干候选之后，可以利用语言模型挑一个尽量靠谱的结果。在 NLP 的其它任务里也都能用到。

注意：
1）NNLM、RNNLM都属于神经网络语言模型，此外还有C&W的SENNA、M&H的HLBL、Huang的语义强化等；
2）统计语言模型除了n-gram，还有上下文无关模型、n-pos模型、基于决策树的语言模型、最大熵模型、自适应语言模型等；
3）seq2seq应该不是语言模型
4）cbow、skip-gram是New Log-linear Models，但不是语言模型！
5）Log-Bilinear模型、层次化Log-Bilinear模型是基于Log-linear一步一步改进的；（按道理应该只需要研究NNLM，但cbow、skip-gram不属于NNLM，反而和那些古老的模型有点关联，所以不得不再去研究历史模型）

C&W的SENNA对应的论文A Unified Architecture for Natural Language Processing: Deep Neural Networks with Multitask Learning、以及Natural Language Processing (Almost) from Scratch
（主要目的不是生成词向量，也不是训练语言模型，而是用词向量完成 NLP 里面的各种任务；训练过程比较特别，不是计算概率，而是对窗口打分）
M&H的HLBL对应的论文Three New Graphical Models for Statistical Language Modelling以及A scalable hierarchical distributed language model
RNNLM对应的论文Recurrent neural network based language model
Huang的语义强化基于C&W改进，对应论文Improving Word Representations via Global Context and Multiple Word Prototypes

对Bengio 03的NNLM理解：

模型可看成4层，输入层为词向量的one hot表示，输入层和第一个隐藏层的权重为词向量矩阵，这样就能用BP更新权重的值；
如果将模型看成3层，那么词向量就是输入层，但这样理解起来和常规的神经网络有出入，因为输入层通常不能被改变；
输出层的softmax表示每个词的概率，即当前面n个词是这些词，紧接着的下个词的概率分布；
由于softmax计算开销较高，因此有了层次softmax；
每次训练输入n个词的独热向量，并根据输出端下一个词（已确定），来更新权重，最终得到语言模型的各层参数（其中第一层参数就是词向量矩阵）；
因此可以说词向量是训练语言模型得到的副产物；训练好模型后，输入一句话的前几个词，就能计算出下一个词（最有可能）；

word2vec+rnn和embedding+rnn：前者先训练得到词向量，再用它训练别的；后者同时进行 --------有这种说法？
keras的model.add(Embedding(vocabulary_size, embedding_size, input_length=max_words))就属于后者？

《Word2vec的工作原理及应用探究》
distributed representation 中的 distributed 一词体现了词向量这样一个特点：将词语的不同句法和语义特征分布到它的每一个维度去表示

多义词怎么处理？每个词学习出多个词向量，能更好地处理多义词？------参见Huang的语义强化

语料对词向量的影响比模型的影响要重要得多得多得多（重要的事说三遍）

语料越大越好，但语料的领域更重要。领域选好了，可能只要 1/10 甚至 1/100 的语料，就能达到一个大规模泛领域语料的效果

对CBOW、Skip-gram 的理解：

Skip-gram 更慢一些，但是对低频词效果更好；对应的 CBOW 则速度更快一些
层次softmax对低频词效果更好；对应的 negative sampling 对高频词效果更好
窗口大小：Skip-gram 一般 10 左右，CBOW 一般 5 左右
层次softmax和NEG都和词频有关，前者根据词频构造huffman树，后者根据词频决定如何采样，即频率越高的词被采样的概率也越大（除了高频subsampling），见论文二
模型输入和NNLM一样，也是onehot，然后查表，只不过论文中没有说明，输出也是onehot，所以有两个词向量矩阵
如何把HS、NEG在论文原图中CBOW、Skip-gram 标出？？？貌似HS可以画，但NEG画不了（word2vec数学原理详解中也没给出）；
NEG使用逻辑回归进行分类！和Huffman树相比，只有一个逻辑回归，而后者有很多个！
W和W’都是词向量，也就是一个词有两个词向量，哪个作为最终的，有两种策略，要么加起来，要么拼接起来，CS224n采用拼接，他们管W中的向量叫input vector，W’中的向量叫output vector；
参见http://www.hankcs.com/nlp/word-vector-representations-word2vec.html
NEG中对词频特别高的如a、an、the进行了亚采样subsampling，但对其他词仍保持原词频分布进行采样（词频的power次方），即词频高的被采样概率也高，其中t是阈值threshold
总体没有反转，只是没那么陡；NEG就是Categorical Distribution Sampling+subsampling；参考https://en.wikipedia.org/wiki/Categorical_distribution
word2vec相对传统词袋、tf idf算是多少考虑了词序，但相对以往经典模型（NNLM、LBL、C&W），则不算考虑了词序（因为后一个词和后后一个词没有区分）
word2vec是逻辑回归，还是神经网络？有些人认为，它没有隐藏层，所以是log 线性模型，而不是神经网络，但根据one hot映射W得到词向量这部分是神经网络，
而且也有bp更新权重的过程；总体仍然是神经网络？
（当然，Huffman binary tree每个非叶子节点是一个二分类的逻辑回归！非叶子节点相当于一个神经元或感知机；叶子节点代表语料库中的一个词语）
层次softmax和NEG都是将多分类转化为二分类！（左右子树；正负样本）；二分类都有正负例，而神经网络多分类因为类别太多，不能叫正负例；
word2vec整体上是无监督；局部或细节上是监督的（即多分类的神经网络和softmax，二分类的层次softmax和NEG）；其中NEG可看成是自己构造正负样本，而常规的机器学习都是直接下载已标记的，如spam/ham
层次softmax和NEG可同时使用？看代码是可以，比如hs=1，negative>0，但效果如何不清楚，word2vec数学原理详解也提到了
huffman树可以用任意二叉树代替，只不过效率没它高；huffman树的节点编码正好和正负例对应，如编码1对应正例，0对应负例，或相反；
所有叶子节点的概率加起来是1；每个节点的概率等于路径上概率的连乘（每个概率由逻辑回归的sigmoid确定）；
word2vec只需对语料遍历一遍；另外如何实现当语料动态增加时的训练，即增量训练，目前不清楚

看https://www.jianshu.com/p/1cac5777cc41
http://www.hankcs.com/nlp/word2vec.html
http://www.hankcs.com/nlp/word-vector-representations-word2vec.html
http://www.360doc.com/content/17/0814/16/17572791_679142209.shtml

tf的word2vec训练与使用：（官网https://github.com/tensorflow/tensorflow/blob/master/tensorflow/examples/tutorials/word2vec/word2vec_basic.py）

直接运行python word2vec_basic.py，会从网上下载text8.zip并验证下载，然后解压，并转换成一个word的list（总长度为1700万左右），
制作一个词表，将不常见的词变成一个UNK标识符，词表的大小为5万，批量读取数据给skip-gram模型，默认skip_window=1, num_skips=2，
即从连续的3个词中生成2个样本；建立模型，词嵌入采用128维，会对常见的16个词进行近义词验证（如can、as、first等），使用nce
噪声词数量为64，构建输入层、embedding层（词嵌入矩阵）、nce loss、优化器，训练100001步，每隔2000步计算一次平均loss，每1万步
进行一次近义词验证（对每个常见词，打印最相邻的8个词），最终的词向量存在于final_embeddings，最后可视化，利用sklean的TSNE技术
对词向量进行降维（从128维变为2维，实际使用pca），将500个词的位置坐标保存为tsne.png
官网代码和作者给的略有不同，主要是将模型保存为ckpt，以及将词典保存为metadata.tsv
和word2vec的原版C代码相比，tf的实现更简单，主要是调用了框架的多个API，而不是都自己实现，比如tf.nn.nce_loss、tf.train.GradientDescentOptimizer、minimize(loss)等

https://github.com/tensorflow/models/blob/master/tutorials/embedding/word2vec.py是更专业、重量级的tf词向量实现
几点区别：

不用tf.nn.nce_loss，而用tf.nn.fixed_unigram_candidate_sampler和tf.nn.sigmoid_cross_entropy_with_logits重新定义实现了nce_loss方法
模块化、分解为多个函数，更清晰、更详细
定义tf.app和main函数，用户可以通过命令指定一些参数，能够进行交互
使用word2vec.skipgram_word2vec，首先编译得到word2vec_ops.so（so可看成python调用C++的一种方式）
使用_train_thread_body多线程

https://github.com/tensorflow/models/blob/master/tutorials/embedding/README.md如何编译和使用word2vec功能
注：按照说明操作，编译不通过，可能是tf版本问题，应该用tf1.9或1.10？
D:\Anaconda3\lib\site-packages\tensorflow\include/tensorflow/core/lib/random/random_distributions.h:614:27: 错误：‘M_PI’在此作用域中尚未声明
D:\Anaconda3\lib\site-packages\tensorflow\include/unsupported/Eigen/CXX11/src/Tensor/TensorRandom.h:53:20: 错误：‘::random’未被声明

https://www.tensorflow.org/extend/adding_an_op#building_the_op_library解析如何自定义op（operation），以及使用、注册和验证

打赏一下作者：

vue项目做导入excel（通过base64）
最近项目的需求，记录下笔记要求：1..xls后缀名文件2.文件不超过10M3.转成base64传给后端导入excel//点击导入exceluploadFile(res){letfile=res.filethis.getBase64(file).then(baseFile=>{letdata=baseFile.split(';')[1]//base64的截取,根据后端要求截取的后半截的this.sa
SerDes学习-提纲 Xuan.Yang serdes serdes 混合信号电路信号完整性
#记录一下学习serdes的笔记首先已有PLL的学习基础，国内serdes体系书籍比较少，大部分外文中文课程：b站，jrilee老师PLL、AIC、equalizer、CDR等均有讲解，较为系统，可按顺序学习，附主页链接：https://space.bilibili.com/1629031600/listsserdes两个很重要的东西PLLCDRDataLink/SerDesAmplifiersl
vue中导入导出Excel 前端小白一枚笔记 vue导入导出Excel
以下仅个人做笔记使用：简单版导出Excel1、安装依赖：cnpminstall--savexlsxfile-savercnpmiscript-loader-S2、下载两个js文件：Blob.js和Export2Excel.js（放在最后面）3、添加导出按钮：导出数据4、添加导出事件：derive(){this.$http.post('admin/service_list',{pre_page:th
Android笔记（十五）ContentProvider源码浅析 jametang25 andorid
ContentProvider作为四大组件之一，由于业务上用到的地方不多,目前业务是系统界面，属于系统应用，最适合使用ContentProvider来进行少量数据存储，我们业务中涉及到的Settings.system和Settings.Secure等数据库，就是通过ContentProvider来封装、用ContentResolver来访问的//通过ContentResolver来访问Settin
【力扣hot100】python刷题笔记之哈希 Animato. 哈希算法 leetcode 笔记
1.两数之和（简单）题目描述：给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案，并且你不能使用两次相同的元素。你可以按任意顺序返回答案。示例：解法一：暴力解法：双层循环（这里就不给代码了）解法二：哈希表（时间复杂度O(n)）算法思路：（1）先创建一个空字典当做哈希表来存储已经遍历过的
golang游戏开发学习笔记-开发一个简单的2D游戏(基础篇）
2.人物运动图（只展示第一帧）2.方块纹理图将资源准备完成之后，就能开始代码的开发了五.开始实现！1.资源管理在上一篇文章中我们将纹理和着色器分别封装成了两个类，这里我们创建一个资源管理类对这两个类进行管理，由于golang中是没有静态变量的，需要用包内变量对其进行模拟shader.gopackageresourceimport(“github.com/go-gl/gl/v4.1-core/gl”
【算法笔记】红黑树插入操作 PXM的算法星球算法笔记算法笔记
红黑树插入与调整详解一、红黑树的五大性质红黑树是一种自平衡的二叉搜索树（BST），其核心特性如下：颜色属性：每个节点非红即黑根属性：根节点必须为黑色叶子属性：所有的NIL叶子节点都是黑色红节点约束：红色节点的子节点必须为黑色（即无连续红节点）黑高平衡：从任一节点到其所有后代叶子节点的路径中，黑色节点数量相等二、插入操作流程阶段1：标准BST插入从根节点开始查找插入位置新节点总是红色按照BST规则插
Git 学习笔记笑衬人心。 git 学习笔记
Git简介Git是一个分布式版本控制系统，用于跟踪文件更改，协作开发软件项目。特点：分布式：每个开发者本地都有完整仓库。高效：分支和合并操作快速。安全：数据通过哈希存储，不易被篡改。安装GitWindows:下载地址：https://git-scm.com/安装后可使用GitBash。macOS:brewinstallgitLinux:sudoaptupdatesudoaptinstallgitG
路由器对数据包的处理过程分析笔记月生言己笔记智能路由器网络
虽然TCP-IP协议中传输数据会在各个路由器再次经过物理层、链路层、网络层的解封装、加工、封装、转发，但是对于两个主机间的运输层，在逻辑上，应用进程是直接通信的。路由器主要工作在网络层，但它也涉及到物理层和链路层的一些功能。以下是路由器在这三个层面上对数据进行的处理：物理层：在物理层，路由器负责接收和发送比特流（即电信号、光信号等）。这包括编码和解码信号，以及处理接口上的物理连接。路由器的每个端口
AD20学习笔记——BOM表输出 Fz@ EDA学习学习笔记
BOM表输出脚本链接GitHub上-lianlian33/InteractiveHtmlBomForAD网盘链接链接：https://pan.baidu.com/s/1uGpwDyWKNgzghY5EH1Aj8A?pwd=72tx提取码：72tx1、下载文件并解压2、复制文件路径3、将脚本导入AD①点击设置中的ScriptingSystem中的GlobalProjects，选择从文件夹安装。②粘贴
Java设计模式之抽象工厂模式（Abstract Factory）笔记 ikwil 设计模式专栏 java 设计模式抽象工厂模式
目录什么叫做抽象工厂模式抽象工厂模式作用抽象工厂模式特征对比抽象工厂和工厂方法抽象工厂模应用场景抽象工厂模式的实现定义抽象工厂接口实现具体产品类定义抽象工厂接口实现具体工厂类进行测试总结参考文献什么叫做抽象工厂模式抽象工厂模式（AbstractFactoryPattern）是一种创建型设计模式，用于提供一个接口，使得客户端能够创建一系列相关或依赖的对象，而无需指定它们的具体类。这个模式有助于确保一
ROS学习笔记5：常用API和模块导入
前言本人ROS小白，利用寒假时间学习ROS，在此以笔记的方式记录自己每天的学习过程。争取写满15篇(5/15)。环境：Ubuntu20.04、ROS1：noetic环境配置：严格按照下方学习链接的教程配置，基本一次成功。学习链接：【Autolabor初级教程】ROS机器人入门对应链接文档：ROS机器人入门课程《ROS理论与实践》笔记绝大部分代码使用Python语言编写。本期关键词：初始化，话题服务
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。努力毕业的小土博^_^ 深度学习学习笔记深度学习学习笔记人工智能机器学习
【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。文章目录【深度学习|学习笔记】什么是正则化？如何理解正则化？L0、L1、L2正则化的起源、发展、原理、应用和对比详解，附代码。前言一、什么是正则化？为什么需要它？✅
C++语言学习笔记：常对象和常引用
对于既需要共享、又需要防止改变的数据应该声明为常量。一、常对象1、声明对象时用const修饰，称之为常对象。const类型说明符对象名；2、常对象的数据成员值在对象的整个生存期间不能被改变。常对象必须进行初始化，而且不能被更新。3、在定义一个变量或常量时为它指定初值叫作初始化，而在定义一个变量或常量以后使用赋值运算符修改它的值叫作赋值。4、改变对象的数据成员值有两个途径：一是通过对象名访问其成员对
Django项目前后端类型中，用户注册功能实现笔记（第一部分）后端django
用户注册前端逻辑为了学会使用Vue.js的双向绑定实现用户的交互和页面局部刷新效果。1.用户注册页面绑定Vue数据1.准备div盒子标签......2.register.html绑定内容：变量、事件、错误提示等{{csrf_input}}用户名:[[error_name_message]]密码:请输入8-20位的密码确认密码:两次输入的密码不一致号:[[error_mobile_message]]
黑马JVM解析笔记（六）：深入理解JVM类加载机制与运行时优化 null不是我干的 JVM jvm 笔记
1.JVM类加载类加载是Java虚拟机将描述类.class文件加载到内存，并对数据进行校验、转换解析和初始化，最终形成可以被JVM直接使用的Java类型的过程。核心阶段：加载—>连接—>初始化1.1加载，以jdk1.8为例类加载器先把Person.class字节码解析为InstanceKlass（底层是c++）结构，存放一些关键信息和对象的引用，生命周期与类加载器相同（类卸载时才释放）然后就是把新
【学习】《算法图解》第七章学习笔记：树程序员
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
无线路由dns服务器地址,无线路由器更换DHCP地址段、DNS地址设置 weixin_39826080 无线路由dns服务器地址
随着科技的发展，越来越多的设备需要无线路由器连接，以便更快的速度上网，如智能手机、平板电脑、笔记本电脑，甚至是无线相机。而如果这些终端上网都需要事先指定好IP才能上网，那无线路由器就失去本身的一些特性，如DHCP功能，下面小编以TP-Linktl-941N为例，详解如何分配DHCP地址段并设置DNS地址？详细设置教程如下：1、使用网关地址(管理地址)登陆上路由器界面。一般路由器管理地址为192.1
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-block.py 红色的山茶花 YOLO 笔记深度学习
block.pyultralytics\nn\modules\block.py目录block.py1.所需的库和模块2.classDFL(nn.Module):3.classProto(nn.Module):4.classHGStem(nn.Module):5.classHGBlock(nn.Module):6.classSPP(nn.Module):7.classSPPF(nn.Module):
我的创作纪念日茉莉玫瑰花茶个人感想
一、初心：技术分享与自我提升成为一名创作者的初衷，源于我在技术学习和实战项目中的点滴积累。在日常的学习和工作中，我常常会遇到一些有趣的技术问题，也会掌握一些实用的解决方案。最初，我只是将这些内容记录在个人笔记中，但后来发现，通过分享这些经验，不仅可以帮助到更多有需要的人，还能促使自己更深入地思考和总结知识。于是，我决定在CSDN上开设博客，将自己的技术心得以文章的形式呈现出来。我的博客茉莉玫瑰花茶
RabbitMQ学习笔记：rabbitmq-server -detached Warning: PID file not written； -detached was passed 码炫课堂-码哥 rabbitmq专题 rabbitmq
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
ESP32学习笔记-读取SD卡并显示到屏幕上搞机械的假程序猿 ESP32学习笔记学习笔记 ESP32
硬件FireBeetle2ESP32-E开发板1.54"240x240IPS广视角TFT显示屏硬件接线测试代码//加载库#include"Arduino.h"#include"FS.h"#include"SD.h"#include"SPI.h"#include"DFRobot_GDL.h"//定义显示屏针脚#defineTFT_DCD2#defineTFT_CSD6#defineTFT_RSTD3
C++入门笔记张峻铖 C++c++
写在开头初衷：对于一个程序员/算法工程师来说，只会Python未免过于单薄了。出于未来找工作的需要，开始学习C++，并使用C++刷LeetCode。背景：本科有C语言课程，甚至学过汇编，研究生阶段主要使用Python。提醒：该系列文章以尽可能快地应用C++（刷题）为目的，暂以B站黑马程序员C++教程为教材，主要记录重点内容和对个人来讲不易理解或陌生的内容，具有较浓的个人笔记特点，因此，在全面性和权
C++入门笔记4 Bool类型的定义及使用做自己就好. c++从0到1 c++笔记开发语言
定义：bool是一种数据类型取值为false或者true定义：boolisFind=true;内存大小占一个字节使用bool的一些使用举例#includeusingnamespacestd;boolfun(inta,intb){returna+b>=10;}intmain(){boola=true;cout<
C++入门学习笔记杨建QAQ c++学习笔记
C++入门学习笔记1：命名空间2：C++输入&输出3：缺省参数4：函数重载5：引用6:内联函数1：命名空间在C语言的学习中变量、函数和类的名称将都存在于全局作用域中，可能会导致很多冲突，使用命名空间的目的是对标识符的名称进行本地化，以避免命名冲突或名字污染，namespace关键字的出现就是针对这种问题的。#include#includeintrand=10;//C语言没办法解决类似这样的命名冲突
【学习】《算法图解》第六章学习笔记：广度优先搜索自学也学好编程程序人生
前言《算法图解》第六章为我们介绍了一种基础且强大的图搜索算法——**广度优先搜索(Breadth-FirstSearch,BFS)**。这种算法能够系统地探索图中的节点，常用于解决两类核心问题：一是判断从一个节点到另一个节点是否存在路径；二是在无权图中找到两个节点之间的最短路径。本笔记将深入探讨图的基本概念、BFS的工作原理、其实现方式以及相关的性能分析。一、图（Graph）简介在讨论BFS之前，
【学习】《算法图解》第七章学习笔记：树自学也学好编程程序人生
前言在前面的章节中，我们学习了数组、链表、散列表等基本数据结构，以及一些基础算法。本章将介绍一种非常重要的数据结构——树(Tree)，特别是二叉搜索树(BinarySearchTree)。树结构在计算机科学中应用广泛，从文件系统到数据库再到人工智能，都能看到树的身影。《算法图解》第七章深入浅出地介绍了树的基本概念、实现和应用，帮助读者理解这一关键数据结构。一、树的基本概念（一）什么是树树是一种分层
衡水中学状元数学学习资料完整攻略向沙托夫问好
本文还有配套的精品资源，点击获取简介：《状元全科笔记衡水内部资料数学学习文档》提供了一个全面的数学学习资源，旨在通过衡水中学的教学经验和方法提升学生的数学成绩。资料包含基础知识、题型解析、模块训练、思维拓展和学习方法，引导学生深入理解数学概念，培养逻辑思维和解决问题的能力。文档结构清晰，内容详实，附带使用指南，帮助学生系统提升数学素养，实现学习效率和成绩的双重提高。1.状元学习方法分享在追求卓越成
SqlServer基础学习笔记 @半夏微凉科技技术拓展 #sqlserver sqlserver 数据库学习笔记 sqlServer学习笔记
SqlServer基础学习笔记介绍了SQLServer数据库管理系统的基础知识，包括数据库的创建、表的设计、SQL查询语句、数据类型、索引、以及常见的管理任务等内容，适合初学者入门学习。第一章：SQLServer简介1.1SQLServer概述SQLServer是由Microsoft公司开发的关系型数据库管理系统，用于存储和管理大量数据。它提供了可靠性、安全性和高性能的数据库解决方案，广泛应用于企
嵌入式笔记：常用接口之详解I2C总线失落的多巴胺 STM32 网络单片机
I2C(Inter-IntegratedCircuit)1.简介I2C(也称为IIC)是一种同步、多主、低速的串行通信协议，只需要两根线即可实现设备之间的数据传输，广泛应用于各种嵌入式设备中，这点在下文原理部分会进一步介绍。2.原理与特性1.双线通信I2C总线由两根信号线组成：SCL：即时钟线，由主设备（Master）产生时钟信号，用于同步数据传输。SDA：即数据线，用于主设备与从设备（Slave
多线程编程之存钱与取钱周凡杨 java thread 多线程存钱取钱
生活费问题是这样的：学生每月都需要生活费，家长一次预存一段时间的生活费，家长和学生使用统一的一个帐号，在学生每次取帐号中一部分钱，直到帐号中没钱时通知家长存钱，而家长看到帐户还有钱则不存钱，直到帐户没钱时才存钱。问题分析：首先问题中有三个实体，学生、家长、银行账户，所以设计程序时就要设计三个类。其中银行账户只有一个，学生和家长操作的是同一个银行账户，学生的行为是
java中数组与List相互转换的方法征客丶 JavaScript java jsonp
1.List转换成为数组。（这里的List是实体是ArrayList) 　　调用ArrayList的toArray方法。　　toArray 　　public T[] toArray(T[] a)返回一个按照正确的顺序包含此列表中所有元素的数组；返回数组的运行时类型就是指定数组的运行时类型。如果列表能放入指定的数组，则返回放入此列表元素的数组。否则，将根据指定数组的运行时类型和此列表的大小分
Shell 流程控制 daizj 流程控制 if else while case shell
Shell 流程控制和Java、PHP等语言不一样，sh的流程控制不可为空，如(以下为PHP流程控制写法)： <?php if(isset($_GET["q"])){ search(q);}else{// 不做任何事情} 在sh/bash里可不能这么写，如果else分支没有语句执行，就不要写这个else，就像这样 if else if if 语句语
Linux服务器新手操作之二周凡杨 Linux 简单操作
1.利用关键字搜寻Man Pages man -k keyword 其中-k 是选项，keyword是要搜寻的关键字如果现在想使用whoami命令，但是只记住了前3个字符who，就可以使用 man -k who来搜寻关键字who的man命令 [haself@HA5-DZ26 ~]$ man -k
socket聊天室之服务器搭建朱辉辉33 socket
因为我们做的是聊天室，所以会有多个客户端，每个客户端我们用一个线程去实现，通过搭建一个服务器来实现从每个客户端来读取信息和发送信息。我们先写客户端的线程。 public class ChatSocket extends Thread{ Socket socket; public ChatSocket(Socket socket){ this.sock
利用finereport建设保险公司决策分析系统的思路和方法老A不折腾 finereport 金融保险分析系统报表系统项目开发
决策分析系统呈现的是数据页面，也就是俗称的报表，报表与报表间、数据与数据间都按照一定的逻辑设定，是业务人员查看、分析数据的平台，更是辅助领导们运营决策的平台。底层数据决定上层分析，所以建设决策分析系统一般包括数据层处理（数据仓库建设）。项目背景介绍通常，保险公司信息化程度很高，基本上都有业务处理系统（像集团业务处理系统、老业务处理系统、个人代理人系统等）、数据服务系统（通过
始终要页面在ifream的最顶层林鹤霄
index.jsp中有ifream，但是session消失后要让login.jsp始终显示到ifream的最顶层。。。始终没搞定，后来反复琢磨之后，得到了解决办法，在这儿给大家分享下。。 index.jsp--->主要是加了颜色的那一句 <html> <iframe name="top" ></iframe> <ifram
MySQL binlog恢复数据 aigo mysql
1，先确保my.ini已经配置了binlog： # binlog log_bin = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.log log_bin_index = D:/mysql-5.6.21-winx64/log/binlog/mysql-bin.index log_error = D:/mysql-5.6.21-win
OCX打成CBA包并实现自动安装与自动升级 alxw4616 ocx cab
近来手上有个项目,需要使用ocx控件 (ocx是什么? http://baike.baidu.com/view/393671.htm) 在生产过程中我遇到了如下问题. 1. 如何让 ocx 自动安装? a) 如何签名? b) 如何打包? c) 如何安装到指定目录? 2.
Hashmap队列和PriorityQueue队列的应用百合不是茶 Hashmap队列 PriorityQueue队列
HashMap队列已经是学过了的,但是最近在用的时候不是很熟悉,刚刚重新看以一次, HashMap是K,v键 ,值 put()添加元素 //下面试HashMap去掉重复的 package com.hashMapandPriorityQueue; import java.util.H
JDK1.5 returnvalue实例 bijian1013 java thread java多线程 returnvalue
Callable接口：返回结果并且可能抛出异常的任务。实现者定义了一个不带任何参数的叫做 call 的方法。 Callable 接口类似于 Runnable，两者都是为那些其实例可能被另一个线程执行的类设计的。但是 Runnable 不会返回结果，并且无法抛出经过检查的异常。 ExecutorService接口方
angularjs指令中动态编译的方法(适用于有异步请求的情况) 内嵌指令无效 bijian1013 JavaScript AngularJS
在directive的link中有一个$http请求，当请求完成后根据返回的值动态做element.append('......');这个操作，能显示没问题，可问题是我动态组的HTML里面有ng-click，发现显示出来的内容根本不执行ng-click绑定的方法！
【Java范型二】Java范型详解之extend限定范型参数的类型 bit1129 extend
在第一篇中，定义范型类时，使用如下的方式： public class Generics<M, S, N> { //M,S,N是范型参数 } 这种方式定义的范型类有两个基本的问题： 1. 范型参数定义的实例字段，如private M m = null;由于M的类型在运行时才能确定，那么我们在类的方法中，无法使用m，这跟定义pri
【HBase十三】HBase知识点总结 bit1129 hbase
1. 数据从MemStore flush到磁盘的触发条件有哪些？ a.显式调用flush，比如flush 'mytable' b.MemStore中的数据容量超过flush的指定容量，hbase.hregion.memstore.flush.size,默认值是64M 2. Region的构成是怎么样？ 1个Region由若干个Store组成
服务器被DDOS攻击防御的SHELL脚本 ronin47
mkdir /root/bin vi /root/bin/dropip.sh #!/bin/bash/bin/netstat -na|grep ESTABLISHED|awk ‘{print $5}’|awk -F:‘{print $1}’|sort|uniq -c|sort -rn|head -10|grep -v -E ’192.168|127.0′|awk ‘{if($2!=null&a
java程序员生存手册-craps 游戏-一个简单的游戏 bylijinnan java
import java.util.Random; public class CrapsGame { /** * *一个简单的赌*博游戏，游戏规则如下： *玩家掷两个骰子，点数为1到6，如果第一次点数和为7或11，则玩家胜， *如果点数和为2、3或12，则玩家输， *如果和为其它点数，则记录第一次的点数和，然后继续掷骰，直至点数和等于第一次掷出的点
TOMCAT启动提示NB: JAVA_HOME should point to a JDK not a JRE解决开窍的石头 JAVA_HOME
当tomcat是解压的时候，用eclipse启动正常，点击startup.bat的时候启动报错; 报错如下： The JAVA_HOME environment variable is not defined correctly This environment variable is needed to run this program NB: JAVA_HOME shou
[操作系统内核]操作系统与互联网 comsci 操作系统
我首先申明：我这里所说的问题并不是针对哪个厂商的，仅仅是描述我对操作系统技术的一些看法操作系统是一种与硬件层关系非常密切的系统软件，按理说，这种系统软件应该是由设计CPU和硬件板卡的厂商开发的，和软件公司没有直接的关系，也就是说，操作系统应该由做硬件的厂商来设计和开发
富文本框ckeditor_4.4.7 文本框的简单使用支持IE11 cuityang 富文本框
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>知识库内容编辑</tit
Property null not found darrenzhu datagrid Flex Advanced propery null
When you got error message like "Property null not found ***", try to fix it by the following way: 1)if you are using AdvancedDatagrid, make sure you only update the data in the data prov
MySQl数据库字符串替换函数使用 dcj3sjt126com mysql 函数替换
需求：需要将数据表中一个字段的值里面的所有的 . 替换成 _ 原来的数据是 site.title site.keywords .... 替换后要为 site_title site_keywords 使用的SQL语句如下： updat
mac上终端起动MySQL的方法 dcj3sjt126com mysql mac
首先去官网下载: http://www.mysql.com/downloads/ 我下载了5.6.11的dmg然后安装,安装完成之后..如果要用终端去玩SQL.那么一开始要输入很长的:/usr/local/mysql/bin/mysql 这不方便啊,好想像windows下的cmd里面一样输入mysql -uroot -p1这样...上网查了下..可以实现滴. 打开终端,输入: 1
Gson使用一（Gson） eksliang json gson
转载请出自出处：http://eksliang.iteye.com/blog/2175401 一.概述从结构上看Json，所有的数据（data）最终都可以分解成三种类型：第一种类型是标量（scalar），也就是一个单独的字符串（string）或数字（numbers），比如"ickes"这个字符串。第二种类型是序列（sequence），又叫做数组（array）
android点滴4 gundumw100 android
Android 47个小知识 http://www.open-open.com/lib/view/open1422676091314.html Android实用代码七段（一） http://www.cnblogs.com/over140/archive/2012/09/26/2611999.html http://www.cnblogs.com/over140/arch
JavaWeb之JSP基本语法 ihuning javaweb
目录 JSP模版元素 JSP表达式 JSP脚本片断 EL表达式 JSP注释特殊字符序列的转义处理如何查找JSP页面中的错误 JSP模版元素 JSP页面中的静态HTML内容称之为JSP模版元素，在静态的HTML内容之中可以嵌套JSP
App Extension编程指南（iOS8/OS X v10.10）中文版啸笑天 ext
当iOS 8.0和OS X v10.10发布后，一个全新的概念出现在我们眼前，那就是应用扩展。顾名思义，应用扩展允许开发者扩展应用的自定义功能和内容，能够让用户在使用其他app时使用该项功能。你可以开发一个应用扩展来执行某些特定的任务，用户使用该扩展后就可以在多个上下文环境中执行该任务。比如说，你提供了一个能让用户把内容分
SQLServer实现无限级树结构 macroli oracle sql SQL Server
表结构如下：数据库id path titlesort 排序 1 0 首页 0 2 0,1 新闻 1 3 0,2 JAVA 2 4 0,3 JSP 3 5 0,2,3 业界动态 2 6 0,2,3 国内新闻 1 创建一个存储过程来实现，如果要在页面上使用可以设置一个返回变量将至传过去 create procedure test as begin decla
Css居中div，Css居中img，Css居中文本，Css垂直居中div qiaolevip 众观千象学习永无止境每天进步一点点 css
/**********Css居中Div**********/ div.center { width: 100px; margin: 0 auto; } /**********Css居中img**********/ img.center { display: block; margin-left: auto; margin-right: auto; }
Oracle 常用操作(实用) 吃猫的鱼 oracle
SQL>select text from all_source where owner=user and name=upper('&plsql_name'); SQL>select * from user_ind_columns where index_name=upper('&index_name'); 将表记录恢复到指定时间段以前
iOS中使用RSA对数据进行加密解密 witcheryne ios rsa iPhone objective c
RSA算法是一种非对称加密算法,常被用于加密数据传输.如果配合上数字摘要算法, 也可以用于文件签名. 本文将讨论如何在iOS中使用RSA传输加密数据. 本文环境 mac os openssl-1.0.1j, openssl需要使用1.x版本, 推荐使用[homebrew](http://brew.sh/)安装. Java 8 RSA基本原理 RS

词向量笔记

你可能感兴趣的:(词向量笔记)