AItth

阅读笔记——GloVe

文章目录

1. 来源
2. 介绍
3. 入门（代码下载）
4. 下载预先训练好的词向量
- 4.1 预先训练好的词向量
- 4.2 用于预处理Twitter数据的Ruby[脚本](https://nlp.stanford.edu/projects/glove/preprocess-twitter.rb)
5. Giting GloVe
6. 强调
- 6.1 Nearest neighbors
- 6.2 线性子结构
7. 训练
8. 模型概述
9. 形象化
10. 发行史
11. 探讨

1. 来源

GloVe来自斯坦福的一篇论文

2. 介绍

Glove是一种无监督学习算法，用于获取单词的向量表示。对来自语料库的聚集的全局词-词共现统计信息进行训练，得到的表示形式展现了词向量空间有趣的线性子结构。

3. 入门（代码下载）

下载最新的代码
解压缩文件：解压缩Glove-master.zip
编译源代码：cd GloVe-master&&make
运行demo脚本：./demo.sh
参阅所包含的README以了解更多细节。

4. 下载预先训练好的词向量

4.1 预先训练好的词向量

这个数据提供在Public Domain Dedication and License,版本1.0，全文在pddl找到.
维基百科2014 + Gigaword 5 (6B tokens, 400K vocab，uncased，50d, 100d, 200d和300d vectors, 822 MB下载):gloves .6B.zip
Common Crawl (42B tokens, 190万vocab，uncased，300d vectors, 1.75 GB下载):gloves .42B.300d.zip
Common Crawl (840B tokens, 2.2M vocab, cased, 300d vectors, 2.03 GB download): glove.840B.300d.zip
Twitter (2B tweets, 27B tokens, 1.2M vocab, uncased, 25d, 50d, 100d, & 200d vectors, 1.42 GB download): glove.twitter.27B.zip

4.2 用于预处理Twitter数据的Ruby脚本

5. Giting GloVe

Jeffrey Pennington, Richard Socher, and Christopher D. Manning. 2014. GloVe: Global Vectors for Word Representation. [pdf]

6. 强调

6.1 Nearest neighbors

两个词向量之间的欧式距离（或余弦相似度）为测量对应词的语言或语义相似度提供了一种有效的方法。有时候，根据这个度量标准，最近邻结构揭示了罕见但相关的词汇，这些词汇不属于普通人的词汇。例如，以下是与目标词frog最接近的单词:
0. frog

frogs
toad
litoria
leptodactylidae
rana
lizard
eleutherodactylus

6.2 线性子结构

用于最近邻评估的相似性度量产生一个标量，量化两个词的相关性。这种简单性可能会有问题，因为两个给定的单词几乎总是表现出比单个数字所能捕捉到的更复杂的关系。例如，男人和女人可能被认为是相似的，因为这两个词都描述了人类;另一方面，这两个词通常被认为是相反的，因为它们突出了人类之间的主要差异。

为了从数量上捕捉区分男女所必需的细微差别，一个模型有必要将不止一个数字与字词组合联系起来。两个词向量之间的向量差是扩大鉴别数集的一个自然而简单的候选。GloVe的设计是为了使这种矢量差异尽可能多地捕捉两个词并置所指定的含义。

区分男人和女人的基本概念，即性或性别，可以用其他各种词对，如国王和王后或兄弟和姐妹来等效地加以说明。为了从数学上表述这个观察结果，我们可以预期男女、国王和王后以及兄弟姐妹的矢量差异可能都大致相等。这个属性和其他有趣的模式可以在下面的可视化中观察到。

7. 训练

GloVe模型是在一个全局词-词共现矩阵的非零条目上训练的，该矩阵列出了单词在给定语料库中相互共现的频率。填充这个矩阵需要一次遍历整个语料库来收集统计信息。对于大型语料库，这种传递在计算上可能很昂贵，但它是一次性的预先成本。随后的训练迭代速度要快得多，因为非零矩阵条目的数量通常要比语料库中的单词总数小得多。

8. 模型概述

GloVe本质上是一个带加权最小二乘目标的对数双线性模型。该模型的主要直觉是一个简单的观察，即单词-单词共现概率的比率有可能编码某种形式的含义。例如，考虑目标词ice和steam与词汇表中各种探测词的共现概率。以下是来自60亿单词语料库的一些实际概率:

正如人们所预料的那样，冰与固体的共存比与气体的共存更频繁，而蒸汽与气体的共存比与固体的共存更频繁。这两个词经常以它们共有的属性water来共现，但都很少与不相关的词fashion共现。只有在概率比率中，来自非歧视性词语(如水和时尚)的噪音才会被抵消，所以大值(远大于1)与冰的特性非常相关，而小值(远小于1)与蒸汽的特性非常相关。通过这种方式，概率比率编码了一些与热力学相抽象概念相关联的粗略意义形式。

GloVe的训练目标是学习单词向量，使它们的点积等于单词共现概率的对数。由于比率的对数等于对数的差，这个目标将共现概率的比率(对数)与词向量空间中的向量差联系起来。因为这些比率可以编码某种形式的意义，这些信息也被编码为矢量差异。由于这个原因，得到的单词向量在单词类比任务中执行得非常好，例如word2vec包中检查的那些任务。

9. 形象化

GloVe产生具有显着带状结构的词向量:

水平波段是由于模型中的乘法相互作用是按分量发生的这一事实造成的。虽然点积会产生附加的相互作用，但一般来说，个体维度交叉授粉的空间很小。

随着单词频率的增加，水平条带变得更加明显。事实上，作为词频的函数，有明显的长期趋势，而且它们不太可能有语言来源。这个特性并不是手套独有的——事实上，我还不知道有什么词向量学习模型可以避免这个问题。

垂直频带，如单词230k-233k附近的频带，是由于碰巧具有相似频率的相关单词(通常是数字)的局部密度。

10. 发行史

GloVev.1.2:代码中的小bug修复(内存，一个一个关闭，错误)。Eval代码现在也可以在Python和Octave中使用。最大数据文件的UTF-8编码固定。由拉塞尔·斯图尔特和克里斯托弗·曼宁准备。2015年10月。
GloVev.1.0:原始版本。杰弗里·彭宁顿准备的。2014年8月。

11. 探讨

GitHub:手套在GitHub上。对于bug报告和补丁，你最好使用GitHub问题和Pull requests特性。
Google Group:The Google Group全局向量可以用于关于GloVe的问题和一般讨论。

你可能感兴趣的:(阅读笔记)

阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
20220226号今日份（6）张雅苑Momo
考虑以下必备行程安排：1作息规律2三餐规律3早茶下午茶4晨练运动5阅读笔记6挚爱亲朋联络20220226号今日份快乐是有哪一些呢？1：视频号直播的持续今天已经是第221/190天啦今天主讲人在分享事上练的能力，事上见2：持续吉他练习今天已经第25天啦3：今天持续带动某人整理屋子，要加油哦，要持续哦今天的过程持续比较轻松愉快4：今天老佛爷入院的第四天，上阵父子兵，期待他们仨早起凯旋归来如何成为自己喜
24营2组锋妈11月13日作业及阅读笔记锋妈
第一部分，听课心得在《时间管理目标模型课程》中，主要学到了如下四点：一、为什么要制定目标二、怎么样制定目标三、制定目标后要做些什么四、立刻行动起来听完后，对照讲课提纲，是自身的存在的弱点，觉着最大的绊脚石是第四点立刻行动起来。因为再宏伟的目标，再强大的驱动力下，如果没有行动去执行，一切都是空谈。为了避免执行力弱化，结合自己目前实际情况，觉着尽量把目标制定的简单明了、可执行、可衡量、可反馈回顾的。只
他为了她努力发家致富，五年后她却要了他的命 ——《了不起的盖茨比》读后感一切来得及
《大亨小传》？又一译名春节期间，我参加了网易蜗牛读书举行的“7天CP读”活动。活动规则是在小程序里配对，两人共读一本书。我选的书是《了不起的盖茨比》，早就闻名，早就想读，却一直没开始的一本书。老话说得没错，男女搭配，干活不累。想不到读书也是如此。不到六天，我就读完了全书，写了近30条阅读笔记。与此同时，与我搭档的美女好像忙着发财，一直没动头。不过，我还是感谢她，感谢她赐予我阅读的力量！读完全书，我
A1/A2: S.O.S. Urgences, Chapitre 1 自观问渠
阅读笔记，Chapitre11.Allô!喂;公司接线员的用语：Allôbonjour，公司名。2.S.O.S.派遣医生上门服务3.请说！Jevousécoute./Jet'écoute.使用场景：我听你讲，你说吧。私人聊天，正式场合4.C'estpourqqn表示目的用pour5.Ilfaut用法Jepeuxvenir,maisilfautuneadresse.ilfaut+名词必须有某物Ilf
阅读笔记-有一种女人张海佩happy
来自@寒山说，致谢！有一种女人，咋一看性格温柔，为人谦和有礼，易接触，可走近发现她自带“疏离感“。她的疏离感并非源自“傲”，而是因她内心太过丰富，且过于敏感。她觉得人类的悲喜并不相同，故而选择保持距离，她的同理心强，共情力更强，她深深地理解他人的痛苦，绝不轻易伤害他人。她礼貌处世，既不向上奉承，也不向下贬低，不以物喜，不以己悲，是温柔到骨子里的人。她拥有自己的精神世界，她可能会沉迷于小说里的某句台
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
马克米勒维尼《动量大师超级交易员圆桌访谈录》阅读笔记59 小二菜园
问题59：你在分析中是否使用利润率或净资产收益率（ROE）？马克·米勒维尼：是的。我喜欢看到不断扩大的利润率。有时，这可能是一个公司业绩改善但销售为负背后的催化剂。但就像我说的，没有销售收入，你只能在一段时间内提高收益。净资产收益率是你应该用来比较你的股票与同一行业其他股票的东西，一般来说，更好的股票会有15-17%或更高的净资产收益率。大卫·瑞恩：它们都是值得关注的指标，也是我进一步研究公司盈利
《以色列——一个民族的重生》第四到第六章阅读笔记惠尔好我
在奥斯曼帝国统治时期，阿拉伯人就意识到，巴勒斯坦生活的犹太人将改变该地区的“阿拉伯属性”。第一次犹太移民潮中，欧洲犹太人带来的观念和现代性和当地犹太人以及阿拉伯人的意识形态发生冲突。可以说，当地人和外来者对国家和社会抱有的不同理念、对荣誉和记忆的不同感受以及许多其他方面的难以沟通，成为后来犹太人和阿拉伯人长期冲突的重要原因。反观中华民族强大的包容性，同化性，共生性带来了强大的生命力。为了架起各方沟
《少有人走的路》第三部分信仰和世界观分阅读笔记芦絮
爱的本质是拓展自我，必须进入未知的领域，放弃落后的，陈旧的自己，把陈腐过时的认知踩在脚下，抛弃狭隘的人生观。做到以上这些必须对过去提出疑问，怀疑和挑战，才能使我们走上神圣的自由之路！作者分别用三位患者举例说明，所有的一切习惯，宗教信仰基本都来源于父母，不幸的童年，所以一个人的心智与家人，朋友，环境是息息相关，我们要给自己输送正能量的东西，让自己充满正能量，做一个阳光的人！
llama_index 官方文档阅读笔记 (持续更新版) 皮卡丘ZPC AIGC for GPT 评分体系构架笔记 llama 人工智能语言模型
llama0.10.17版本阅读链接:LlamaIndexv0.10.17LlamaIndex是一个基于LLM的应用程序的数据框架，它受益于上下文增强。这种LLM系统被称为RAG系统，代表“检索-增强生成”。LlamaIndex提供了必要的抽象，以便更轻松地摄取、构建和访问私有或特定于域的数据，以便将这些数据安全可靠地注入LLM，以实现更准确的文本生成。为什么选择上下文增强？LLM的局限LLM在人
我理解的《月亮和六便士》（3）澎波先生
突然发现这样慢慢地阅读一本书，每天写所读部分的阅读笔记，挺有意思的。我个人觉得，这是个将书读厚的过程，虽然这个厚还只是对书本内容的解读，还没到联系实际的理解，但阅读本身就很有趣，也应该知足了。阅读笔记三：今天看到了48%，不得不说这部分其实有些狗血。这部分说到主人公、老戴和查理斯三人之间存在着某种奇怪的友情，直到查理斯病倒了，老戴说服他夫人勃朗仕让查理斯住在家里的画室，并且两人一起照顾查理斯。病后
《卓有成效的管理者》第一章阅读笔记与心得张建平深圳
自我管理这是一个做管理多年的朋友推荐给我的第一本德鲁克的书。开始以为是一本专门企业管理的书，看完才知道是一本自我管理的书。图片发自App彼得.德鲁克，号称管理科学“大师中的大师”。是“工业时代”到“知识时代”管理学的桥梁搭建者。图片发自App推荐他著作的牛人很多，就知道他的思想有多重要。如果不好好读，不深入读，不读以致用，就等于跟风装13（跟00后学的装B新词），等于没读。图片发自App这本书适合
阅读笔记3《有钱人和你想的不一样》230305财富蓝图 Mika罗盘上的点
重新设定为收入稳定增长的模式。认知“实现程序”为这个形式：设定→想法→感觉→行动=结果设定会产生想法；想法产生感觉；感觉产生行动；行动产生结果。我要再强调一次：潜意识所受到的制约，决定了思想；思想决定了选择；选择决定了行动，而行动就决定了结果。第一个改变的步骤：修改语言程式一、察觉：写下小时候听过的所有描述金钱、财富和有钱人的话语。二、理解：写下认为这些说法如何影响财务生活。三、划清界限：有没有看
近乎无事的悲哀——《风筝》阅读笔记天光云影好丹青
某一天，我们心底也会留有这样莫可名状的惆怅吗？———不算题记的题记对于从事现代文学教学与研究的人而言，如果硬要说有某一个作家是不可绕过的，那么，可以断定所有的人都会毫不犹豫地将神圣的一票投给“鲁迅”。不管你是否真正知晓中国的过去与现状，也不管你是否真的能够同鲁迅实现内在心灵上的共鸣，他之于这个国家的文学历史、之于这个国家本身的重要性，至少在今天都还是不言而喻的。刘再复1978年《略论鲁迅思想的发展
2-12 三观易碎d2阅读笔记二桥啊
摘抄：回头看整个成长时期最遗憾的事，就是我们自己糊涂的时候，那些引导我们的前辈没能给我们以真正的启迪想法：看到这句话时，我心一凉，我后悔的事情有很多，可不曾真正考虑过这一点，长辈们对我的教育大体没错，可是有的东西我明白得太晚，譬如学习的意义、恋爱、婚姻、性观念等问题，他们给我提供他们认为好的物质，然后有些观念形成得晚也事实上令我错失一些东西，好在我现在也在学习也在慢慢去明白，现如今我也在长辈的路上
Robotic TMS（三）：机器人TMS相关技术巴普蒂斯塔机器人学 TMS 机器人系统轨迹规划运动控制视觉私服
本文为阅读笔记，仅供学习交流使用！！！从之前的文章中可以归纳出与机器人辅助经颅磁刺激相关的一些重要技术。包括：机械臂的（1）运动轨迹跟踪技术；（2）视觉私服控制；（3）视觉标定技术；（4）轨迹规划；（5）位置和力控制；（6）安全问题。一、运动轨迹跟踪为了避免固定受试者的头部，应使用跟踪系统来引导和调整线圈的位置和方向。有许多类似的跟踪系统可供选择：空间连杆机构、超声波跟踪系统、磁场跟踪系统、以及光
Robotic TMS（一）：TMS（经颅磁刺激）介绍巴普蒂斯塔机器人学 TMS Robotic 神经科学脑科学机器人学
本文为阅读笔记，仅供学习交流使用！！！经颅磁刺激技术（TranscranialMagneticStimulation,TMS）是一种无痛、无创的绿色治疗方法，磁信号可以无衰减地透过颅骨而刺激到大脑神经。随着技术的发展，具有连续可调重复刺激的经颅磁刺激（rTMS）出现，并在临床精神病、神经疾病及康复领域获得越来越多的认可。经颅磁刺激技术得到了广泛的使用，国内的经颅磁刺激技术达到世界先进水平，在神经心
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
目标思维、效率思维、行动力思维蓝色多莉
阅读笔记第163/365天今日阅读《从怕学习到爱学习》——一本给父母的优等生养成指南作者：张萌第三章：高效行动力。一、目标思维。——孩子做事没耐心，不能持之以恒怎么办？1、做任何事都需要一个理由。孩子做事没有耐心，不能持久的原因：一是，缺乏兴趣。二是，缺少自制力。做事时注意力分散，不会分配精力。家长要帮助孩子找回性耐心，找回兴趣，提起做事的劲儿，需要让孩子拥有目标思维，利用目标思维帮助孩子找到自己
《登天的感觉》阅读笔记案例解析（2） dear心理咨询师黄倩雯
来询者之所以会对咨询者产生特殊的好感，主要是因为后者在前者头脑混乱，情绪低落之际，给予了对方由衷的理解和支持。
Circle Loss: A Unified Perspective of Pair Similarity Optimization简要阅读笔记 dailleson_ 机器学习机器学习数据挖掘神经网络深度学习自然语言处理
1.背景常见的分类损失函数可以概括为减小类内距离sns_nsn，增大类间距离sps_psp。优化目标如下：min(sn−sp)min(s_n-s_p)min(sn−sp)2.存在的问题优化不够灵活。优化目标对sns_nsn和sps_psp的惩罚作用是相等的，二者的系数都为1。例如{sn,sp}={0.1,0.5}\{s_n,s_p\}=\{0.1,0.5\}{sn,sp}={0.1,0.5}。这个
一对母女的深度阅读笔记：给孩子最强大脑不如陪孩子读遍好书朝南有飘窗
我们分享过不少“深度阅读”的方法，其中很重要的一点，是在阅读后，制作一份“研究报告”，比如设计精致的阅读海报（点此阅读），今天再分享一个妈妈带女儿用思维导图，围绕虚构类和非虚构类好书制作的读书笔记，不仅授予孩子检索、总结等技能，更塑造孩子不断求知的好习惯。虚构类图书：探究故事的背景提出问题，是引发思考的第一步。当孩子着迷于一个故事的时候，家长可以找到那个有趣的问题，引导孩子体会思考的乐趣。国外的孩
Nginx源码阅读笔记-内存池的设计 weixin_33701564 运维 python 数据结构与算法
2019独角兽企业重金招聘Python工程师标准>>>nginx的内存池设计的比较简单了，一个内存池中分为两个部分：超过max大小的内存分配，走大块内存分配，这部分内存管理由ngx_pool_large_t结构体负责。否则就是在ngx_pool_t遍历符合要求的ngx_pool_t结构体，找到符合要求大小的pool直接返回，否则就申请一块新的内存pool。nginx中所有请求都单独对应一个内存池，
核心2群3组耿艳菊2018.7.17阅读笔记耿艳菊
《少有人走的路》我们大多人趋向于逃避一切痛苦和折磨，对某些消极现象可能熟视无睹，对残酷的现实可能不闻不问，我们捍卫自己的意识，不让真实的信息侵入其中，心理学家把这种情形成为“意识的防卫机制”。每个人都可能采用这种机制，有意限制自己的认知范围和认知能力。我们生活在现实世界里，要想生活得更好，必须尽可能地了解世界的本质，但了解的过程无法一蹴而就。要洞悉世界的本质，认清自己和世界的关系，我们就可能经受各
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
阅读笔记李蓉乐平市湾头中小学
今日份阅读《成年人的世界没有容易二字》。这种鸡汤文，对人的发展真的没太大意义，通篇教你要如何努力，却教不了你真正的自律，每一条文字都能让你对号入座，却不能让你真正发生改变，不是说它不好，于本书而言是真正的鸡汤，但它能带给你智慧是有限的，一本好书，通常不会过多的去反映社会现实，和取悦读者，而是能够触及到生命意义让你有所反思的书。所以把这段话读给我班学生听，我只是一只蚂蚁撼不动大树，如若能撼动一片树叶
14.犹太人的智慧法则 | #阅读笔记#01-《财源滚滚：犹太人赚钱的十诫》拉布拉多滚雪球
这是拉布拉多滚雪球的第14篇原创投资者，特别是投资小白如大学生和初入职场者，受限于思维认知和人生经历匮乏等原因，在贸然进入资本市场后，往往损失惨重，并且不明白究竟为何亏损，进而反复遭到“市场先生”教育，最终只能铩羽而归，失去万般艰险得来的一点本金。本号在前期大多分享的是财经类著作，专注于资本市场历史案例和真实活动，需要读者具备一定的专业理论基础，对于缺乏财经知识积累的人全面系统地理解相关理念存在门
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
Java序列化进阶篇 g21121 java序列化
1.transient 类一旦实现了Serializable 接口即被声明为可序列化，然而某些情况下并不是所有的属性都需要序列化，想要人为的去阻止这些属性被序列化，就需要用到transient 关键字。
escape()、encodeURI()、encodeURIComponent()区别详解 aigo JavaScript Web
原文：http://blog.sina.com.cn/s/blog_4586764e0101khi0.html JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：,decodeURI,decodeURIComponent 。下面简单介绍一下它们的区别 1 escape()函
ArcgisEngine实现对地图的放大、缩小和平移 Cb123456 添加矢量数据对地图的放大、缩小和平移 Engine
ArcgisEngine实现对地图的放大、缩小和平移: 个人觉得是平移，不过网上的都是漫游，通俗的说就是把一个地图对象从一边拉到另一边而已。就看人说话吧. 具体实现: 一、引入命名空间 using ESRI.ArcGIS.Geometry; using ESRI.ArcGIS.Controls; 二、代码实现.
Java集合框架概述天子之骄 Java集合框架概述
集合框架集合框架可以理解为一个容器，该容器主要指映射(map)、集合(set)、数组(array)和列表(list)等抽象数据结构。从本质上来说，Java集合框架的主要组成是用来操作对象的接口。不同接口描述不同的数据类型。简单介绍： Collection接口是最基本的接口，它定义了List和Set，List又定义了LinkLi
旗正4.0页面跳转传值问题何必如此 java jsp
跳转和成功提示 a) 成功字段非空forward 成功字段非空forward，不会弹出成功字段，为jsp转发，页面能超链接传值,传输变量时需要拼接。接拼接方式list.jsp?test="+strweightUnit+"或list.jsp?test="+weightUnit+&qu
全网唯一:移动互联网服务器端开发课程 cocos2d-x小菜 web开发移动开发移动端开发移动互联程序员
移动互联网时代来了！ App市场爆发式增长为Web开发程序员带来新一轮机遇，近两年新增创业者，几乎全部选择了移动互联网项目！传统互联网企业中超过98%的门户网站已经或者正在从单一的网站入口转向PC、手机、Pad、智能电视等多端全平台兼容体系。据统计，AppStore中超过85%的App项目都选择了PHP作为后端程
Log4J通用配置|注意问题笔记 7454103 DAO apache tomcat log4j Web
关于日志的等级那些去百度就知道了！这几天要搭个新框架配置了日志记下来！做个备忘！ #这里定义能显示到的最低级别,若定义到INFO级别,则看不到DEBUG级别的信息了~! log4j.rootLogger=INFO,allLog # DAO层 log记录到dao.log 控制台和总日志文件 log4j.logger.DAO=INFO,dao,C
SQLServer TCP/IP 连接失败问题 ---SQL Server Configuration Manager darkranger sql c windows SQL Server XP
当你安装完之后,连接数据库的时候可能会发现你的TCP/IP 没有启动.. 发现需要启动客户端协议 : TCP/IP 需要打开 SQL Server Configuration Manager... 却发现无法打开 SQL Server Configuration Manager..?? 解决方法: C:\WINDOWS\system32目录搜索framedyn.
[置顶] 做有中国特色的程序员 aijuans 程序员
从出版业说起网络作品排到靠前的，都不会太难看，一般人不爱看某部作品也是因为不喜欢这个类型，而此人也不会全不喜欢这些网络作品。究其原因，是因为网络作品都是让人先白看的，看的好了才出了头。而纸质作品就不一定了，排行榜靠前的，有好作品，也有垃圾。许多大牛都是写了博客，后来出了书。这些书也都不次，可能有人让为不好，是因为技术书不像小说，小说在读故事，技术书是在学知识或温习知识，有些技术书读得可
document.domain 跨域问题 avords document
document.domain用来得到当前网页的域名。比如在地址栏里输入：javascript:alert(document.domain); //www.315ta.com我们也可以给document.domain属性赋值，不过是有限制的，你只能赋成当前的域名或者基础域名。比如：javascript:alert(document.domain = "315ta.com");
关于管理软件的一些思考 houxinyou 管理
工作好多看年了,一直在做管理软件,不知道是我最开始做的时候产生了一些惯性的思维,还是现在接触的管理软件水平有所下降.换过好多年公司,越来越感觉现在的管理软件做的越来越乱. 在我看来,管理软件不论是以前的结构化编程,还是现在的面向对象编程,不管是CS模式,还是BS模式.模块的划分是很重要的.当然,模块的划分有很多种方式.我只是以我自己的划分方式来说一下. 做为管理软件,就像现在讲究MVC这
NoSQL数据库之Redis数据库管理(String类型和hash类型) bijian1013 redis 数据库 NoSQL
一.Redis的数据类型 1.String类型及操作 String是最简单的类型，一个key对应一个value，string类型是二进制安全的。Redis的string可以包含任何数据，比如jpg图片或者序列化的对象。 Set方法：设置key对应的值为string类型的value
Tomcat 一些技巧征客丶 java tomcat dos
以下操作都是在windows 环境下一、Tomcat 启动时配置 JAVA_HOME 在 tomcat 安装目录，bin 文件夹下的 catalina.bat 或 setclasspath.bat 中添加 set JAVA_HOME=JAVA 安装目录 set JRE_HOME=JAVA 安装目录/jre 即可；二、查看Tomcat 版本在 tomcat 安装目
【Spark七十二】Spark的日志配置 bit1129 spark
在测试Spark Streaming时，大量的日志显示到控制台，影响了Spark Streaming程序代码的输出结果的查看(代码中通过println将输出打印到控制台上)，可以通过修改Spark的日志配置的方式，不让Spark Streaming把它的日志显示在console 在Spark的conf目录下，把log4j.properties.template修改为log4j.p
Haskell版冒泡排序 bookjovi 冒泡排序 haskell
面试的时候问的比较多的算法题要么是binary search，要么是冒泡排序，真的不想用写C写冒泡排序了，贴上个Haskell版的，思维简单，代码简单，下次谁要是再要我用C写冒泡排序，直接上个haskell版的，让他自己去理解吧。 sort [] = [] sort [x] = [x] sort (x:x1:xs) | x>x1 = x1:so
java 路径配置文件读取 bro_feng java
这几天做一个项目，关于路径做如下笔记，有需要供参考。取工程内的文件，一般都要用相对路径，这个自然不用多说。在src统计目录建配置文件目录res,在res中放入配置文件。读取文件使用方式： 1. MyTest.class.getResourceAsStream("/res/xx.properties") 2. properties.load(MyTest.
读《研磨设计模式》-代码笔记-简单工厂模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 个人理解：简单工厂模式就是IOC; * 客户端要用到某一对象，本来是由客户创建的，现在改成由工厂创建，客户直接取就好了 */ interface IProduct {
SVN与JIRA的关联 chenyu19891124 SVN
SVN与JIRA的关联一直都没能装成功，今天凝聚心思花了一天时间整合好了。下面是自己整理的步骤：一、搭建好SVN环境，尤其是要把SVN的服务注册成系统服务二、装好JIRA，自己用是jira-4.3.4破解版三、下载SVN与JIRA的插件并解压，然后拷贝插件包下lib包里的三个jar，放到Atlassian\JIRA 4.3.4\atlassian-jira\WEB-INF\lib下，再
JWFDv0.96 最新设计思路 comsci 数据结构算法工作企业应用公告
随着工作流技术的发展，工作流产品的应用范围也不断的在扩展，开始进入了像金融行业(我已经看到国有四大商业银行的工作流产品招标公告了)，实时生产控制和其它比较重要的工程领域，而
vi 保存复制内容格式粘贴 daizj vi 粘贴复制保存原格式不变形
vi是linux中非常好用的文本编辑工具，功能强大无比，但对于复制带有缩进格式的内容时，粘贴的时候内容错位很严重，不会按照复制时的格式排版，vi能不能在粘贴时，按复制进的格式进行粘贴呢？答案是肯定的，vi有一个很强大的命令可以实现此功能。在命令模式输入:set paste，则进入paste模式，这样再进行粘贴时
shell脚本运行时报错误：/bin/bash^M: bad interpreter 的解决办法 dongwei_6688 shell脚本
出现原因：windows上写的脚本，直接拷贝到linux系统上运行由于格式不兼容导致解决办法： 1. 比如文件名为myshell.sh，vim myshell.sh 2. 执行vim中的命令 : set ff?查看文件格式，如果显示fileformat=dos，证明文件格式有问题 3. 执行vim中的命令 :set fileformat=unix 将文件格式改过来就可以了，然后:w
高一上学期难记忆单词 dcj3sjt126com word english
honest 诚实的；正直的 argue 争论 classical 古典的 hammer 锤子 share 分享；共有 sorrow 悲哀；悲痛 adventure 冒险 error 错误；差错 closet 壁橱；储藏室 pronounce 发音；宣告 repeat 重做；重复 majority 大多数；大半 native 本国的，本地的，本国
hibernate查询返回DTO对象，DTO封装了多个pojo对象的属性 frankco POJO hibernate查询 DTO
DTO-数据传输对象；pojo-最纯粹的java对象与数据库中的表一一对应。简单讲：DTO起到业务数据的传递作用，pojo则与持久层数据库打交道。有时候我们需要查询返回DTO对象，因为DTO
Partition List hcx2013 partition
Given a linked list and a value x, partition it such that all nodes less than x come before nodes greater than or equal to x. You should preserve the original relative order of th
Spring MVC测试框架详解——客户端测试 jinnianshilongnian
上一篇《Spring MVC测试框架详解——服务端测试》已经介绍了服务端测试，接下来再看看如果测试Rest客户端，对于客户端测试以前经常使用的方法是启动一个内嵌的jetty/tomcat容器，然后发送真实的请求到相应的控制器；这种方式的缺点就是速度慢；自Spring 3.2开始提供了对RestTemplate的模拟服务器测试方式，也就是说使用RestTemplate测试时无须启动服务器，而是模拟一
关于推荐个人观点 liyonghui160com 推荐系统关于推荐个人观点
回想起来，我也做推荐了3年多了，最近公司做了调整招聘了很多算法工程师，以为需要多么高大上的算法才能搭建起来的，从实践中走过来，我只想说【不是这样的】第一次接触推荐系统是在四年前入职的时候，那时候，机器学习和大数据都是没有的概念，什么大数据处理开源软件根本不存在，我们用多台计算机web程序记录用户行为，用.net的w
不间断旋转的动画 pangyulei 动画
CABasicAnimation* rotationAnimation; rotationAnimation = [CABasicAnimation animationWithKeyPath:@"transform.rotation.z"]; rotationAnimation.toValue = [NSNumber numberWithFloat: M
自定义annotation sha1064616837 java enum annotation reflect
对象有的属性在页面上可编辑，有的属性在页面只可读，以前都是我们在页面上写死的，时间一久有时候会混乱，此处通过自定义annotation在类属性中定义。越来越发现Java的Annotation真心很强大，可以帮我们省去很多代码，让代码看上去简洁。下面这个例子主要用到了 1.自定义annotation：@interface，以及几个配合着自定义注解使用的几个注解 2.简单的反射 3.枚举
Spring 源码 up2pu spring
1.Spring源代码 https://github.com/SpringSource/spring-framework/branches/3.2.x 注：兼容svn检出 2.运行脚本 import-into-eclipse.bat 注：需要设置JAVA_HOME为jdk 1.7 build.gradle compileJava { sourceCompatibilit
利用word分词来计算文本相似度 yangshangchuan word word分词文本相似度余弦相似度简单共有词
word分词提供了多种文本相似度计算方式：方式一：余弦相似度，通过计算两个向量的夹角余弦值来评估他们的相似度实现类：org.apdplat.word.analysis.CosineTextSimilarity 用法如下： String text1 = "我爱购物"; String text2 = "我爱读书"; String text3 =

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他