fyinh_

Word Embedding 学习笔记

Word Embedding 学习笔记——GloVe 与 word2vec

完成日期：2019.02.25

文章目录

Word Embedding 学习笔记——GloVe 与 word2vec

一. Word Representation
二. One-hot Encoding
三. Word Embedding

3.1 Word Embedding

3.1.1 Frequency based Embedding——基于词频的方法
3.1.2 word2vec——非确定性的基于神经网络的预测模型

3.1.2.1 CBOW
3.1.2.2 skip-gram

3.1.3 GloVe——基于全局词频统计的词表征工具

3.1.3.1 GloVe的实现
3.1.3.2 GloVe的训练

3.1.4 Word Enbedding 的训练方法

四. Summary

最近在做一些关于序列标注相关的任务，所用的深度学习方法需要用到Word Embedding，所以就学习了一些Word Embedding的认识，看的主要是范永勇的博客，我觉得他写得很好，所以把自己学习到的相关知识记录一下。
因为实验室主要是做数据挖掘相关的工作，有非常丰富的语料资源，所以在做Word Embedding的时候就想到了用GloVe或者word2vec，看了大量的材料都说两种方法的效果其实差不多，所以在做实验的时候我两种Embedding都试了一下，看哪个比较适合自己的模型。扯蛋了这么久，我还是快点我的学习笔记吧= =

一. Word Representation

Word Representation是词的向量化表示，也就是把单词（word）按照某种规则表示成一个向量（vector）。

二. One-hot Encoding

One-hot Encoding是到目前为止最常用的词表示方法，这种方法把每个词表示为一个很长的向量。这个向量的维度是词表大小，其中绝大多数元素为 0，只有一个维度的值为 1，这个维度就代表了当前的词。
举个例子：语料库里面有两个句子 D1 : I like apple. D2 : I like pear. 从这个语料库中我们得到字典 [I, like, apple, pear]，那么单词 “I” 的one-hot encoding就是 [1000]，单词 “like” 就是 [0100]

三. Word Embedding

Word Embedding就是将单词word映射到另外一个空间，其中这个映射具有injective（单射函数）和structure-preserving（结构保存，比如在x所属空间上x₁2，那么映射后y所属空间y₁2的特点。）

3.1 Word Embedding

Word Embedding的类型分为两大类：Frequency based Embedding（基于词频） 和 Prediction based Embedding（基于预测）

3.1.1 Frequency based Embedding——基于词频的方法

Count Vector : 比如语料库有N个文本（document），统计出所有文本中不同单词的数量，结果组成一个矩阵，那么每一列就是一个向量，表示这个单词在不同的文档中的出现次数。
TF-IDF Vector：基于Count Vector 的算法进行了一些改进，计算公式为：tfidf_i,j = tf_i,j × idf_i
其中，tf_i,j指的是第i个单词在第j个文档出现的频次；idf_i = log(N/n)，其中N表示文档的总个数，n表示包含该单词的文档的数量。
Co-occurrence Vector：协同出现向量
co-occurrence 协同出现指的是两个单词 w₁ 和 w₂ 在一个context window范围内共同出现的次数，context window指的是某个单词w的上下文范围的大小。

3.1.2 word2vec——非确定性的基于神经网络的预测模型

word2vec是一个只有一个隐含层的神经网络，且激活函数（active function）是线性的，最后一层output采用softmax来计算概率，包括COBW（根据上下文来预测一个单词）和skip-gram（根据单词来预测上下文）。

3.1.2.1 CBOW

其中，V表示词库的大小；输入向量x₁, x₂,…, x_n的大小为1×V，它是这个word的one-hot encoding；神经元h₁, h₂,…, h_n表示hidden layer，大小为1×N；输出向量y₁, y₂,…, y_n表示的是一个概率分布向量，大小和输入向量一致。
CBOW的任务就是给定了一个长度为C个单词的上下文（单词的顺序无关）去预测最有可能的空缺单词，通过神经网络之后得到的预测结果是一个V维的向量，而这个向量代表的是词库里的每一个单词是空缺单词的概率，而神经网络中的Hidden Layer就是我们想要的词嵌入，它不仅得到了单词的语义特性，还把单词从V维空间映射了N维，这样做也实现了降维处理。

3.1.2.2 skip-gram

可以看到COBW是从上下文content去预测最有可能的空缺单词target word的过程中学习到词向量的表达，那么，我们也能从target word到content的预测中学习到word vector，这就是skip-gram模型，其模型图为：

3.1.3 GloVe——基于全局词频统计的词表征工具

GloVe——Global Vectors for Word Representation，它可以把一个单词表达成一个由实数组成的向量，这些向量捕捉到了单词之间的一些语义特性。

3.1.3.1 GloVe的实现

根据语料库（corpus）构建一个共现矩阵（Co-ocurrence Matrix）x，矩阵中的每一个元素x_ij代表单词i和上下文单词j在特定大小的上下文窗口（context window）内共同出现的次数。一般而言，这个单词的最小次数是1，但是GloVe不这么认为：它根据两个单词在上下文窗口的距离d，提出了一个衰减函数 decay = 1/d 用于计算权重，也就是说距离越远的两个单词所占总计数（total count）的权重越小。
构建词向量（Word Vector）和共现矩阵（Co-occurence Matrix）之间的近似关系：
之后我们再构造它的损失函数：

f(X_ij)的作用：在一个语料库中，存在很多单词它们一起出现的次数是很多的，那么我们希望：
（1）这些单词的权重要大于那些很少在一起出现的单词，所以这个函数要是非递减函数（non-decreasing）
（2）但我们也不希望这个权重过大（overweighted），当到达一定程度之后应该不再增加
（3）如果这两个单词没有在一起出现，也就是X_ij = 0，那么他们应该不参与到loss function的计算中去，也就是f(x)要满足f(0) = 0，因此得到：

3.1.3.2 GloVe的训练

由于label是log(X_ij)，因此训练方法使用基于梯度下降的方法。在论文中，作者采用了AdaGrad的梯度下降算法，对矩阵的X中的所有非零元素进行随机采样，学习曲率（learning rate）设为0.05，在vector size小于300的情况下迭代了50次，其他大小的vectors上迭代了100次，直至收敛。最终学习得到的是两个vector是w和~w，为了提高鲁棒性，最终选择了两者之和作为最终的vector（两者的初始化不同相当于加了不同的随机噪声，所以能提高鲁棒性）。

ps：Vector Dimension 在300时达到最佳，而Context Windows size大致在6-10之间。

3.1.4 Word Enbedding 的训练方法

Word Embedding的训练方法大致可以分为两类：一类是无监督或弱监督的预训练；一类是端对端（end to end）的有监督训练。
无监督或弱监督的预训练以word2vec为代表。这一类模型的特点是，不需要大量的人工标记样本就可以得到质量还不错的Embedding向量。不过因为缺少了任务导向，可能和要解决的问题还有一定的距离。因此，往往会在得到预训练的Embedding向量后，用少量人工标注的样本去fine-tune整个模型。
相比之下，端对端的有监督模型在最近几年里越来越受到人们的关注。与无监督模型相比，端对端的模型在结构上往往更加复杂。同时，也因为有着明确的任务导向，端对端模型学习到的Embedding向量也往往更加准确。例如，通过一个Embedding层和若干个卷积层连接而成的深度神经网络以实现对句子的情感分类，可以学习到语义更丰富的词向量表达。

四. Summary

我做命名实体识别实验的时候用了word2vec和GloVe，总的来说两种Word Embedding都对模型效果有所帮助，可是用GloVe的话模型的效果会更好，可能是因为GloVe更加适合我的模型吧。实际上如今现在做序列标注任务的方法都大同小异，基本都是用深度学习的方法，而且大家的神经网络结构也是差不多的，所以现在想做实验的时候要改网络结构然后得到较大的进步我觉得有点难（改网络结构是指大改），那么慢慢地大家就会从词嵌入等其他方面入手去改善模型，后续我会继续学习和使用一些其他的词嵌入方法，有时间和条件的话可能会自己试着实现word2vec。除了在词嵌入下功夫之外，也可以考虑一下引入序列本身一些固有的特征，这样应该会对模型的改进有所帮助。这都是我个人的一些小感想，要是各位觉得不对的话，欢迎和我交流哦~

你可能感兴趣的:(Word Embedding 学习笔记)

【大语言模型_5】xinference部署embedding模型和rerank模型没枕头我咋睡觉大语言模型语言模型 embedding 人工智能
一、安装xinferencepipinstallxinference二、启动xinference./xinference-local--host=0.0.0.0--port=5544三、注册本地模型1、注册embedding模型curl-XPOST"http://localhost:5544/v1/models"\-H"Content-Type:application/json"\-d'{"mod
Linux内核srio驱动,Zynq—Linux移植学习笔记（十四）：RapidIO驱动开发 weixin_39942572 Linux内核srio驱动
#defineDRIVER_NAME"xiic-rio"#defineSRIO_ZYNQ_BASEADDR0x40000000#defineSRIO_ZYNQ_NODE_BASEADDR0x10100#defineSRIO_ZYNQ_MAX_HOPCOUNT13structxiic_rio{structmutexlock;u8*data;};/*Weneedglobalvarriableforma
Kubernetes学习笔记-移除Nacos迁移至K8s 人生偌只如初见 Kubernetes J2EE kubernetes k8s java
项目服务的配置管理和服务注册发现由原先的Nacos全面迁移到Kubernetes上。一、移除Nacos移除Nacos组件依赖。com.alibaba.cloudspring-cloud-starter-alibaba-nacos-discoverycom.alibaba.cloudspring-cloud-starter-alibaba-nacos-configorg.springframewor
胡思又乱想（四）水军一号笔记
本月已上班13天，迟到7次，累积时长71分钟。感觉我对自己有点过于宽容了。今天终于没有迟到。坐到工位第一件事，快速梳理今天的工作，我习惯拿笔写下来。主要工作只有一个：完成一份项目结项报告PPT+Word。其他就是琐碎的售后处理，对接沟通，退换货的事。不出意外的话，今天毫无压力。按时要求自己喝水，自然还要按时上厕所，这样就不会一直坐着了。中午吃饭没有选到好吃的菜，土豆炖鸡块里的土豆竟然没有炖烂；青椒
AI学习教程DeepSeek使用教程合集免费下载 oneboxai 学习
1.DeepSeek本地部署2.Deepseek搭建个人知识库3.DeepSeek提示词详解4.Deepseek使用技巧大全5.DeepSeek提示词大全6.DeepSeek保姆级新手教程7.DeepSeek各类应用8.Deepseek写小说9.DeepSeekV3部署教程10.DeepseekwordExcel11.Deepseek科研论文12.Deepseek开发游戏13.大模型通用一-A1指
Mariadb5.5.68升级10.5 熊博主 Linux云计算架构工程师 mysql mariadb 运维 linux 服务器
Mariadb5.5.68升级10.5#提前备份好数据库[root@master~]#mysqldump-uroot-p--all-databases>alldb.sqlEnterpassword:[root@master~]#llalldb.sql-rw-r--r--.1rootroot51523011月1818:59alldb.sql#移除原来的mariadb数据库[root@master~]
用Python修改Word文档字体
在数字化办公场景中，Word文档作为主流文件格式承载着大量商务文书与学术资料。传统手动调整字体格式的操作模式存在显著局限性：当面对批量文档处理、动态内容生成或企业级模板维护时，逐一手工修改不仅效率低下，更难以保障格式规范的统一性。通过Python实现文档字体的程序化控制，能够有效构建自动化处理流程，在确保排版精准度的同时，显著提升文档批量化操作能力。本文将介绍如何使用Python修改Word文档段
快速入手-基于Django的mysql操作（四）神奇侠2024 django django
1、数据的增删改查defadd(request):UserInfo.objects.create(username="admin",password="1234561",age=18)UserInfo.objects.create(username="admin2",password="1234562",age=19)UserInfo.objects.create(username="admin3
金融、教育等行业如何高效利用wangEditor实现word文档网页化编辑？ 2501_90699850 金融 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：wangEditor前端：vue2,vue3,vue-cli,html5后端：java,jsp,springboot,asp.net,php,asp,.netcore,.netmvc,.netform群体：学生,个人用户,外包,自由职业者,中小型网站,博客,场景：数字门户,数字中台,站群,内网，外网，信创国产化环境，web截屏行业：医疗，教育，建筑，政府，党政，国
网页编辑器能否满足Word公式与图片的直接复制粘贴？ 2501_90699800 编辑器 word umeditor粘贴word ueditor粘贴word ueditor复制word ueditor上传word图片 ueditor导入word
要求：开源，免费，技术支持编辑器：百度ueditor前端：vue2,vue3,vue-cli,react,html5用户体验：Ctrl+V快捷键操作功能：导入Word,导入Excel,导入PPT(PowerPoint),导入PDF,复制粘贴word,导入微信公众号内容,web截屏平台：Windows,macOS,Linux,RedHat,CentOS,Ubuntu,中标麒麟,银河麒麟,统信UOS,
Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
谷歌：对比学习将LLM转为嵌入模型大模型任我行大模型-成熟基座人工智能自然语言处理语言模型论文笔记
标题：GeminiEmbedding:GeneralizableEmbeddingsfromGemini来源：arXiv,2503.07891摘要在本报告中，我们介绍了Gemini嵌入，这是一种最先进的嵌入模型，它利用了Gemini、Google最有能力的大型语言模型的力量。利用Gemini固有的多语言和代码理解能力，GeminiEmbedding为跨越多种语言和文本模式的文本生成高度可概括的嵌入
rust学习笔记16-206.反转链表(递归) 水蜜桃one 学习笔记链表
rust函数递归在14中已经提到，接下来我们把206.反转链表，用递归法实现递归函数通常包含两个主要部分：基准条件（BaseCase）：递归终止的条件，避免无限递归。递归步骤（RecursiveStep）：将问题分解为更小的子问题，并调用自身来解决这些子问题。//Definitionforsingly-linkedlist.#[derive(PartialEq,Eq,Clone,Debug)]pu
收集整理了一些wordpress开发中常用到的实用代码 wodrpress资源分享 wordpress wordpress
wordpress调用全站热门文章代码”,‘post_status’=>‘publish’,//只选公开的文章.‘post__not_in’=>array($post->ID),//排除当前文章‘caller_get_posts’=>1,//排除置顶文章.‘orderby’=>‘comment_count’,//依评论数排序.‘posts_per_page’=>$post_num);$query_
day11 学习笔记豆豆学习笔记 python
文章目录前言一、类方法二、静态方法三、构造方法四、魔术方法前言通过今天的学习，我掌握了更多Python中有关面向对象编程思想中方法的概念与操作，包括类方法，静态方法，构造方法，魔术方法一、类方法类方法是属于类的行为，一般使用类而非对象进行调用类方法需要使用@classmethod装饰器定义类方法至少有一个形参用于绑定类，约定为cls类和该类的实例都可以调用类方法，但一般不用实例进行调用类方法不能访
MarkDown 输出表格的方法龙之叶技术 Markdown markdown
MarkDown用来输出表格很简单，比Word手搓表格简单多了，而且方便修改。MarkDown代码：|A|B|C|D||:-|-:|:-:|-||1|b|c|d||2|b|c|d||3|b|c|d||4|b|c|d||5|b|c|d|显示效果：ABCD1bcd2bcd3bcd4bcd5bcdA列强制左对齐，B列强制右对齐，C列强制居中对齐，D列默认对齐。默认对齐在PC端网页显示为表格标题和内容都居
rag-给一篇几百页的pdf，如何从中找到关键信息并汇总出关系图蒸土豆的技术细节人工智能
小思考对pdf肯定要做模糊chunk，能用模型切分就用模型切分，不能用模型就用规则，规则要尽可能保存连续文本，特殊数据格式（图、表格）必须完整保存，必须能被捕捉到。这些独立的表格or图数据，也要单独做embedding，以其中的title和行列title信息作embedding材料。也不能忘了传统搜索方法，基于搜索的、基于传统词频的、基于关键字的。。。假设已经找到了信息所在的目标，如果它是个表格，
GitHub在push推送到远程仓库的时候显示Logon failed登录失败奕雨. Git github Git
具体问题描述git.exepush--progress"origin"master:masterLogonfailed,usectrl+ctocancelbasiccredentialprompt.remote:SupportforpasswordauthenticationwasremovedonAugust13,2021.这是因为Git推送失败的原因是GitHub已经不支持密码认证，你需要使用
python函数的多种参数使用形式红虾程序员 Python python 开发语言 pycharm
目录1.位置参数（PositionalArguments）2.关键字参数（KeywordArguments）3.默认参数（DefaultArguments）4.可变参数（VariablePositionalArguments）5.关键字可变参数（VariableKeywordArguments）6.特殊用法：传递列表或字典作为参数Python中函数的参数使用形式非常灵活，主要包括以下几种类型：位置
使用spring data MongoDB对MongoDB进行简单CURD操作示例其实我就是个萌新 spring mongodb java
本文章为作者个人学习笔记，仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机：localhost]spring.data.mongodb.port=[数据库端口，默认:27017]2.根据数据库文档定义实体类：@RequiredArgs
springboot邮件发送与接收读取（真实使用） dgqvhtlwq472235338 java 测试 ui
发送邮件org.springframework.bootspring-boot-starter-freemarkerorg.springframework.bootspring-boot-starter-mailorg.springframework.bootspring-boot-starter-webspring:mail:port:25username:****password:****pr
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
LeetCode每日一题——30. 串联所有单词的子串 hyk今天写算法了吗 #算法实例 leetcode 算法职场和发展数据结构 python
文章目录题目示例思路题解题目给定一个字符串s和一些长度相同的单词words。找出s中恰好可以由words中所有单词串联形成的子串的起始位置。注意子串要与words中的单词完全匹配，中间不能有其他字符，但不需要考虑words中单词串联的顺序。示例示例1：输入：s=“barfoothefoobarman”,words=[“foo”,“bar”]输出：[0,9]解释：从索引0和9开始的子串分别是“bar
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
java word转pdf三种方法（附有需要的jar）李逍遙️ word转pdf java
一.jacob1.jar下载jacob.jar和jacob-1.17-x64.dll下载提取码：01212.在jdk/bin目录下引入.dll文件（64位：jacob-1.17-x64.dll32位：jacob-1.17-x86.dll）3.转换代码importcom.jacob.activeX.ActiveXComponent;importcom.jacob.com.Dispatch;impor
numpy学习笔记3：三维数组 np.ones((2, 3, 4)) 的详细解释宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记3：三维数组np.ones((2,3,4))的详细解释以下是关于三维数组np.ones((2,3,4))的详细解释：1.三维数组的形状形状(2,3,4)表示：最外层维度：2个“层”（或“块”）；中间维度：每个层有3行；最内层维度：每行有4个元素。可以类比为：2本书（外层），每本书有3页（中间层），每页有4行文字（内层）。2.创建全1三维数组代码示例：importnumpyasnp
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
使用bat批量获取WORD中包含对应字符的段落，段落使用回车换行宇宙无敌花心大萝卜批处理文档处理 word 开发语言 bat 批处理 VBS
get_word_paragraphs.vbs'获取命令行参数IfWScript.Arguments.Count=0ThenWScript.Quit1EndIf'获取Word文档路径docPath=WScript.Arguments(0)'创建Word应用程序对象SetobjWord=CreateObject("Word.Application")objWord.Visible=False'打开W
Peach-Editor，一款Web版电子病例编辑器实验版本上线了大神1573 Peach-Editor 编辑器
经过一年多的辛苦钻研，一款web版本的电子病例编辑器基础word编辑功能版本终于和大家见面了，编辑器实现了参照传统文档编辑习惯，尽可能的还原原汁原味的文档编辑体验。目前初步完成了基础的文本编辑、表格、分页、页面控制等后续还加加入电子病例相关内容，整个编辑器的研发进度正在有序推进中，现将阶段性成果展示给大家。整体界面，沿用了传统的文档编辑习惯，菜单栏分为文件、编辑、插入、页面、审阅。编辑菜单内容主要
numpy学习笔记2：ones = np.ones((2, 4)) 的详解宁宁可可 #机器学习 #Python基础与进阶 numpy python 开发语言
numpy学习笔记2：ones=np.ones((2,4))的详解np.ones()是NumPy中用于创建全1数组的核心函数，其用法和参数与np.zeros()类似，但生成的数组元素值全部为1。以下是详细解释：1、语法numpy.ones(shape,dtype=float,order='C')作用：生成一个指定形状和数据类型的全1数组。参数：shape：数组的形状，以元组形式传递（如(2,4)表
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他