Graph Convolutional Networks for Text Classification [阅读笔记]

Graph Convolutional Networks for Text Classification [阅读笔记]

简介
贡献
相关研究

传统文本分类方法
基于深度学习的文本分类方法
图神经网络

方法

图卷积网络（GCN）
文本图神经网络 Text GCN

图的构建
网络结构

结论

简介

文章基于词的共线和文档的词关系，构建了语料库的知识图谱。Text GCN初始化为word和doc的独热表示，然后他们共同学习word和doc的嵌入表示，文档带标签。实验表明，随着训练数据占比降低，Text GCN相对于最先进的比较方法的改进变得更加突出，这表明文本GCN对文本分类中训练数据较少的稳定性。

贡献

提出了一种基于GCN的文本分类方法。首次提出将整个语料库建模成一个异构网络，并同时学习神经网络的word和doc嵌入表示。
Text GCN方法不需要预训练word嵌入和专业知识。Text GCN方法还可以自动学习预测词和文档嵌入。

相关研究

传统文本分类方法

传统的文本分类方法主要基于特征工程和分类算法。特征工程中最常用到八字格特征（ bagof-words），后来，有人提出用其他复杂特征表示，如2011年提出的entities in ontologies和2012年提出的n-grams等。还有一些关于将文本转换为图和对图和子图形进行特征工程的研究等。这篇文章与上述方法不同的是，Text GCN可以学习节点嵌入的文本表示。

基于深度学习的文本分类方法

深度学习的文本分类方法可分为两种：一种是基于词嵌入的模型，另一种是基于深度神经网络。

最近几项研究表明，文本分类模型的分类效果很大程度上取决于词嵌入的有效性。有人提出将未监督的单词嵌入聚合为文档嵌入，然后将这些文档嵌入到一个类中；还有人提出共同学习单词/文档和文档标签嵌入。这篇文章提出的Text GCN思想与这些方法有相似之处，主要的区别在于，这些方法在学习单词嵌入后构建文本表示，而Text GCN同时学习单词和文档嵌入以进行文本分类。

基于深度神经网络的文本分类模型主要有两个代表性的CNN和RNN。CNN的基本架构与计算机视觉使用的卷积方式类似，不过使用的是一维卷积，而不是二维。LSTM是RNN的一种，有人提出往LSTM模型加入attention机制来提高模型的泛化能力。虽然这些方法都取得了一定的效果，并被广泛使用，但他们只关注局部连续的word序列，而没有使用到语料库中的global word信息。

图神经网络

图神经网络主要用于关系分类、机器翻译等。使用GCN对句子结构进行编码，构建知识图谱。在最近的一些GCN研究中，他们将一个doc视为word节点构成的图，或基于非常规可用的doc引用关系构建图谱。与之相反的是，我们构建语料库图谱时，同时将doc和word视为节点，加入到知识图谱中，并且不需要doc之间的内部关联信息。

方法

图卷积网络（GCN）

GCN是一个多层的神经网络，直接作用于图并能够基于节点的邻接关系，产生节点嵌入向量。本文使用的GCN迭代公式如下：
$L^{(1)} = \rho(\tilde{A}XW_0)$
$L^{(j+1)} = \rho(\tilde{A}L^{(j)}W_j)$
其中，
$A$ ：图G的邻接矩阵
$\tilde{A}$ ：矩阵A的正则化表示
$X$ ：包含图G中所有n个节点特征
$D$ ：图G的度矩阵（ $D_{ii} = \Sigma_jA_{ij}$ ）

文本图神经网络 Text GCN

图的构建

本文将word和doc作为节点，构建知识图谱，如下图所示：

图中：

节点总数 $V$ = doc（语料库）+unique word（词库）
边 $E$ = doc-word edge + word-word edge
doc-word edge边权重 $w e i g h t$ 基于word在doc中出现的信息，用 TF-IDF算法计算。
TF-IDF算法是一种简单快捷的文档特征词抽取方法，通过统计文档中的词频来对文档进行主题分类，用以评估一个word对一份doc或一个语料库中的其中一份doc的重要程度。word的重要性随着它在doc中出现的次数成正比增加，但同时会随着它在语料库中出现的频率成反比下降。
TF-IDF其主要思想是，如果某个词或短语在一篇文章中出现的频率TF高，并且在其他文章中很少出现，则认为此词或者短语具有很好的类别区分能力，适合用来分类。其计算方式为：
- TF(Term Frequency 词频)：某个word在该doc中出现的次数，计算公式如下：
  $tf_{i,j}=\frac{n_{i,j}}{\Sigma_kn_{k,j}}$
  其中， $n_{i,j}$ 表示词 $i$ 在文档 $j$ 中出现次数， $\Sigma_kn_{k,j}$ 是文档 $j$ 中所有词出现的次数之和
- IDF(Inverse Document Frequency 反文档频率)：包含word的doc数量的反比。如果包含word的doc越少，IDF越大，则说明词条具有很好的类别区分能力，是一个词普遍重要性的度量。计算公式如下：
  $idf_i=log\frac{|D|}{|\{j:t_i \in d_j\}|}$
  其中， $∣ D ∣$ 表示语料库中doc总数， $|\{j:t_i \in d_j\}|$ 表示包含词 $t_i$ 的doc数目。由于可能包含词 $t_i$ 的doc数目为0，通常分母改为 $|\{j:t_i \in d_j\}|+1$
- $T F I D F = T F * I D F$ 值越大，表示这个word对doc来说越重要。
word-word edge权重用固定大小的滑窗在语料库中滑动统计词共现信息，使用PMI(Point-wise Mutual Info)计算word-word边的权重。计算方式如下：
$A_{ij}=\left\{ \begin{array}{rcl} PMI(i,j) && i,j \in words, PMI(i,j) > 0 \\ TF-IDF_{ij} && i\in documents,j\in words \\ 1 && i=j \\ 0 && otherwise \\ \end{array} \right.$
PMI计算方式如下：
$PMI(i,j)=log\frac{P(i,j)}{P(i)P(j)}$
$P(i,j)=\frac{\#W(i,j)}{\#W},\ P(i)=\frac{\#W(i)}{\#W}$
其中，
$\#W(i)$ 表示包含词 $i$ 的滑窗数目
$\#W(i,j)$ 表示包含词 $i$ 和 $j$ 的滑窗数目
$\#W$ 表示滑窗总数
PMI值 >0 表示词 $i$ 和 $j$ 语义相关性强，<0 表示词 $i$ 和 $j$ 语义相关性弱或者没有相关性。因此本文只考虑将PMI值 >0 的words加入图G中。

网络结构

Text GCN使用双层GCN网络结构，第一层使用ReLU激活函数，第二层是softmax层。梯度下降法训练可以学到权重 $W_0$ 和 $W_1$ ，这样每一层都包含word和doc嵌入信息。公式如下：
$Z=softmax(\tilde{A}\ ReLU(\tilde{A}XW_0)\ W_1)$
损失函数为交叉熵：
$L=-\sum\limits_{d\in \Upsilon_D}\sum\limits_{f=1}^{F}{Y_{df}lnZ_{df}}$
其中， $\Upsilon_D$ 是所有带标签的document的索引集， $F$ 是特征向量维度，即类的总数。

双层GCN中，doc节点的标签信息可在两个同类或不同类节点之间传递，因此，即使图中没有直接的doc-doc边，双层GCN也可以实现信息在两个doc之间的交换。实验表明，双层GCN比单层GCN表现好，但是再增加GCN层数并不能有效提高实验效果。

结论

Text GCN可以捕获全局word之间的关联信息，并能高效利用有限的带标签doc信息。

参数敏感性
- 不同滑窗大小会影响模型准确率。实验表明，滑窗越大，平均准确率随之提高，当滑窗到达某一临界值时，平均准确率有所降低。因为当滑窗设置过小时，不能有效保留全局词的共现信息；当滑窗设置过大时，每个滑窗内关联度不够紧密的边的比例有所增加。
- 不同的嵌入表示维度也会影响模型准确率。当第一层的嵌入维度过低时，会丢失一些标签信息；当嵌入维度过高时，对模型的分类能力没有改善，甚至需要更多的训练时间。因此，选择一个合适的嵌入维度很重要。
模型缺点
虽然Text GCN有很强的文本分类能力和词、文档嵌入表示能力，但是模型的主要局限在于Text GCN模型有内在传导性，无标签的测试文档doc节点包含在GCN的训练集中。换句话说，Text GCN不能快速产生嵌入表示，并预测没有出现过的文档。可能的解决方案有介绍归纳法和fast GCN模型。
未来可能会引入注意力机制并研究无监督Text GCN框架，用于大规模无标签Text数据集上的表示学习。

原文链接：https://arxiv.org/abs/1809.05679

你可能感兴趣的:(阅读笔记)

阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
20220226号今日份（6）张雅苑Momo
考虑以下必备行程安排：1作息规律2三餐规律3早茶下午茶4晨练运动5阅读笔记6挚爱亲朋联络20220226号今日份快乐是有哪一些呢？1：视频号直播的持续今天已经是第221/190天啦今天主讲人在分享事上练的能力，事上见2：持续吉他练习今天已经第25天啦3：今天持续带动某人整理屋子，要加油哦，要持续哦今天的过程持续比较轻松愉快4：今天老佛爷入院的第四天，上阵父子兵，期待他们仨早起凯旋归来如何成为自己喜
24营2组锋妈11月13日作业及阅读笔记锋妈
第一部分，听课心得在《时间管理目标模型课程》中，主要学到了如下四点：一、为什么要制定目标二、怎么样制定目标三、制定目标后要做些什么四、立刻行动起来听完后，对照讲课提纲，是自身的存在的弱点，觉着最大的绊脚石是第四点立刻行动起来。因为再宏伟的目标，再强大的驱动力下，如果没有行动去执行，一切都是空谈。为了避免执行力弱化，结合自己目前实际情况，觉着尽量把目标制定的简单明了、可执行、可衡量、可反馈回顾的。只
他为了她努力发家致富，五年后她却要了他的命 ——《了不起的盖茨比》读后感一切来得及
《大亨小传》？又一译名春节期间，我参加了网易蜗牛读书举行的“7天CP读”活动。活动规则是在小程序里配对，两人共读一本书。我选的书是《了不起的盖茨比》，早就闻名，早就想读，却一直没开始的一本书。老话说得没错，男女搭配，干活不累。想不到读书也是如此。不到六天，我就读完了全书，写了近30条阅读笔记。与此同时，与我搭档的美女好像忙着发财，一直没动头。不过，我还是感谢她，感谢她赐予我阅读的力量！读完全书，我
A1/A2: S.O.S. Urgences, Chapitre 1 自观问渠
阅读笔记，Chapitre11.Allô!喂;公司接线员的用语：Allôbonjour，公司名。2.S.O.S.派遣医生上门服务3.请说！Jevousécoute./Jet'écoute.使用场景：我听你讲，你说吧。私人聊天，正式场合4.C'estpourqqn表示目的用pour5.Ilfaut用法Jepeuxvenir,maisilfautuneadresse.ilfaut+名词必须有某物Ilf
阅读笔记-有一种女人张海佩happy
来自@寒山说，致谢！有一种女人，咋一看性格温柔，为人谦和有礼，易接触，可走近发现她自带“疏离感“。她的疏离感并非源自“傲”，而是因她内心太过丰富，且过于敏感。她觉得人类的悲喜并不相同，故而选择保持距离，她的同理心强，共情力更强，她深深地理解他人的痛苦，绝不轻易伤害他人。她礼貌处世，既不向上奉承，也不向下贬低，不以物喜，不以己悲，是温柔到骨子里的人。她拥有自己的精神世界，她可能会沉迷于小说里的某句台
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
马克米勒维尼《动量大师超级交易员圆桌访谈录》阅读笔记59 小二菜园
问题59：你在分析中是否使用利润率或净资产收益率（ROE）？马克·米勒维尼：是的。我喜欢看到不断扩大的利润率。有时，这可能是一个公司业绩改善但销售为负背后的催化剂。但就像我说的，没有销售收入，你只能在一段时间内提高收益。净资产收益率是你应该用来比较你的股票与同一行业其他股票的东西，一般来说，更好的股票会有15-17%或更高的净资产收益率。大卫·瑞恩：它们都是值得关注的指标，也是我进一步研究公司盈利
《以色列——一个民族的重生》第四到第六章阅读笔记惠尔好我
在奥斯曼帝国统治时期，阿拉伯人就意识到，巴勒斯坦生活的犹太人将改变该地区的“阿拉伯属性”。第一次犹太移民潮中，欧洲犹太人带来的观念和现代性和当地犹太人以及阿拉伯人的意识形态发生冲突。可以说，当地人和外来者对国家和社会抱有的不同理念、对荣誉和记忆的不同感受以及许多其他方面的难以沟通，成为后来犹太人和阿拉伯人长期冲突的重要原因。反观中华民族强大的包容性，同化性，共生性带来了强大的生命力。为了架起各方沟
《少有人走的路》第三部分信仰和世界观分阅读笔记芦絮
爱的本质是拓展自我，必须进入未知的领域，放弃落后的，陈旧的自己，把陈腐过时的认知踩在脚下，抛弃狭隘的人生观。做到以上这些必须对过去提出疑问，怀疑和挑战，才能使我们走上神圣的自由之路！作者分别用三位患者举例说明，所有的一切习惯，宗教信仰基本都来源于父母，不幸的童年，所以一个人的心智与家人，朋友，环境是息息相关，我们要给自己输送正能量的东西，让自己充满正能量，做一个阳光的人！
llama_index 官方文档阅读笔记 (持续更新版) 皮卡丘ZPC AIGC for GPT 评分体系构架笔记 llama 人工智能语言模型
llama0.10.17版本阅读链接:LlamaIndexv0.10.17LlamaIndex是一个基于LLM的应用程序的数据框架，它受益于上下文增强。这种LLM系统被称为RAG系统，代表“检索-增强生成”。LlamaIndex提供了必要的抽象，以便更轻松地摄取、构建和访问私有或特定于域的数据，以便将这些数据安全可靠地注入LLM，以实现更准确的文本生成。为什么选择上下文增强？LLM的局限LLM在人
我理解的《月亮和六便士》（3）澎波先生
突然发现这样慢慢地阅读一本书，每天写所读部分的阅读笔记，挺有意思的。我个人觉得，这是个将书读厚的过程，虽然这个厚还只是对书本内容的解读，还没到联系实际的理解，但阅读本身就很有趣，也应该知足了。阅读笔记三：今天看到了48%，不得不说这部分其实有些狗血。这部分说到主人公、老戴和查理斯三人之间存在着某种奇怪的友情，直到查理斯病倒了，老戴说服他夫人勃朗仕让查理斯住在家里的画室，并且两人一起照顾查理斯。病后
《卓有成效的管理者》第一章阅读笔记与心得张建平深圳
自我管理这是一个做管理多年的朋友推荐给我的第一本德鲁克的书。开始以为是一本专门企业管理的书，看完才知道是一本自我管理的书。图片发自App彼得.德鲁克，号称管理科学“大师中的大师”。是“工业时代”到“知识时代”管理学的桥梁搭建者。图片发自App推荐他著作的牛人很多，就知道他的思想有多重要。如果不好好读，不深入读，不读以致用，就等于跟风装13（跟00后学的装B新词），等于没读。图片发自App这本书适合
阅读笔记3《有钱人和你想的不一样》230305财富蓝图 Mika罗盘上的点
重新设定为收入稳定增长的模式。认知“实现程序”为这个形式：设定→想法→感觉→行动=结果设定会产生想法；想法产生感觉；感觉产生行动；行动产生结果。我要再强调一次：潜意识所受到的制约，决定了思想；思想决定了选择；选择决定了行动，而行动就决定了结果。第一个改变的步骤：修改语言程式一、察觉：写下小时候听过的所有描述金钱、财富和有钱人的话语。二、理解：写下认为这些说法如何影响财务生活。三、划清界限：有没有看
近乎无事的悲哀——《风筝》阅读笔记天光云影好丹青
某一天，我们心底也会留有这样莫可名状的惆怅吗？———不算题记的题记对于从事现代文学教学与研究的人而言，如果硬要说有某一个作家是不可绕过的，那么，可以断定所有的人都会毫不犹豫地将神圣的一票投给“鲁迅”。不管你是否真正知晓中国的过去与现状，也不管你是否真的能够同鲁迅实现内在心灵上的共鸣，他之于这个国家的文学历史、之于这个国家本身的重要性，至少在今天都还是不言而喻的。刘再复1978年《略论鲁迅思想的发展
2-12 三观易碎d2阅读笔记二桥啊
摘抄：回头看整个成长时期最遗憾的事，就是我们自己糊涂的时候，那些引导我们的前辈没能给我们以真正的启迪想法：看到这句话时，我心一凉，我后悔的事情有很多，可不曾真正考虑过这一点，长辈们对我的教育大体没错，可是有的东西我明白得太晚，譬如学习的意义、恋爱、婚姻、性观念等问题，他们给我提供他们认为好的物质，然后有些观念形成得晚也事实上令我错失一些东西，好在我现在也在学习也在慢慢去明白，现如今我也在长辈的路上
Robotic TMS（三）：机器人TMS相关技术巴普蒂斯塔机器人学 TMS 机器人系统轨迹规划运动控制视觉私服
本文为阅读笔记，仅供学习交流使用！！！从之前的文章中可以归纳出与机器人辅助经颅磁刺激相关的一些重要技术。包括：机械臂的（1）运动轨迹跟踪技术；（2）视觉私服控制；（3）视觉标定技术；（4）轨迹规划；（5）位置和力控制；（6）安全问题。一、运动轨迹跟踪为了避免固定受试者的头部，应使用跟踪系统来引导和调整线圈的位置和方向。有许多类似的跟踪系统可供选择：空间连杆机构、超声波跟踪系统、磁场跟踪系统、以及光
Robotic TMS（一）：TMS（经颅磁刺激）介绍巴普蒂斯塔机器人学 TMS Robotic 神经科学脑科学机器人学
本文为阅读笔记，仅供学习交流使用！！！经颅磁刺激技术（TranscranialMagneticStimulation,TMS）是一种无痛、无创的绿色治疗方法，磁信号可以无衰减地透过颅骨而刺激到大脑神经。随着技术的发展，具有连续可调重复刺激的经颅磁刺激（rTMS）出现，并在临床精神病、神经疾病及康复领域获得越来越多的认可。经颅磁刺激技术得到了广泛的使用，国内的经颅磁刺激技术达到世界先进水平，在神经心
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
目标思维、效率思维、行动力思维蓝色多莉
阅读笔记第163/365天今日阅读《从怕学习到爱学习》——一本给父母的优等生养成指南作者：张萌第三章：高效行动力。一、目标思维。——孩子做事没耐心，不能持之以恒怎么办？1、做任何事都需要一个理由。孩子做事没有耐心，不能持久的原因：一是，缺乏兴趣。二是，缺少自制力。做事时注意力分散，不会分配精力。家长要帮助孩子找回性耐心，找回兴趣，提起做事的劲儿，需要让孩子拥有目标思维，利用目标思维帮助孩子找到自己
《登天的感觉》阅读笔记案例解析（2） dear心理咨询师黄倩雯
来询者之所以会对咨询者产生特殊的好感，主要是因为后者在前者头脑混乱，情绪低落之际，给予了对方由衷的理解和支持。
Circle Loss: A Unified Perspective of Pair Similarity Optimization简要阅读笔记 dailleson_ 机器学习机器学习数据挖掘神经网络深度学习自然语言处理
1.背景常见的分类损失函数可以概括为减小类内距离sns_nsn，增大类间距离sps_psp。优化目标如下：min(sn−sp)min(s_n-s_p)min(sn−sp)2.存在的问题优化不够灵活。优化目标对sns_nsn和sps_psp的惩罚作用是相等的，二者的系数都为1。例如{sn,sp}={0.1,0.5}\{s_n,s_p\}=\{0.1,0.5\}{sn,sp}={0.1,0.5}。这个
一对母女的深度阅读笔记：给孩子最强大脑不如陪孩子读遍好书朝南有飘窗
我们分享过不少“深度阅读”的方法，其中很重要的一点，是在阅读后，制作一份“研究报告”，比如设计精致的阅读海报（点此阅读），今天再分享一个妈妈带女儿用思维导图，围绕虚构类和非虚构类好书制作的读书笔记，不仅授予孩子检索、总结等技能，更塑造孩子不断求知的好习惯。虚构类图书：探究故事的背景提出问题，是引发思考的第一步。当孩子着迷于一个故事的时候，家长可以找到那个有趣的问题，引导孩子体会思考的乐趣。国外的孩
Nginx源码阅读笔记-内存池的设计 weixin_33701564 运维 python 数据结构与算法
2019独角兽企业重金招聘Python工程师标准>>>nginx的内存池设计的比较简单了，一个内存池中分为两个部分：超过max大小的内存分配，走大块内存分配，这部分内存管理由ngx_pool_large_t结构体负责。否则就是在ngx_pool_t遍历符合要求的ngx_pool_t结构体，找到符合要求大小的pool直接返回，否则就申请一块新的内存pool。nginx中所有请求都单独对应一个内存池，
核心2群3组耿艳菊2018.7.17阅读笔记耿艳菊
《少有人走的路》我们大多人趋向于逃避一切痛苦和折磨，对某些消极现象可能熟视无睹，对残酷的现实可能不闻不问，我们捍卫自己的意识，不让真实的信息侵入其中，心理学家把这种情形成为“意识的防卫机制”。每个人都可能采用这种机制，有意限制自己的认知范围和认知能力。我们生活在现实世界里，要想生活得更好，必须尽可能地了解世界的本质，但了解的过程无法一蹴而就。要洞悉世界的本质，认清自己和世界的关系，我们就可能经受各
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
阅读笔记李蓉乐平市湾头中小学
今日份阅读《成年人的世界没有容易二字》。这种鸡汤文，对人的发展真的没太大意义，通篇教你要如何努力，却教不了你真正的自律，每一条文字都能让你对号入座，却不能让你真正发生改变，不是说它不好，于本书而言是真正的鸡汤，但它能带给你智慧是有限的，一本好书，通常不会过多的去反映社会现实，和取悦读者，而是能够触及到生命意义让你有所反思的书。所以把这段话读给我班学生听，我只是一只蚂蚁撼不动大树，如若能撼动一片树叶
14.犹太人的智慧法则 | #阅读笔记#01-《财源滚滚：犹太人赚钱的十诫》拉布拉多滚雪球
这是拉布拉多滚雪球的第14篇原创投资者，特别是投资小白如大学生和初入职场者，受限于思维认知和人生经历匮乏等原因，在贸然进入资本市场后，往往损失惨重，并且不明白究竟为何亏损，进而反复遭到“市场先生”教育，最终只能铩羽而归，失去万般艰险得来的一点本金。本号在前期大多分享的是财经类著作，专注于资本市场历史案例和真实活动，需要读者具备一定的专业理论基础，对于缺乏财经知识积累的人全面系统地理解相关理念存在门
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
jQuery 跨域访问的三种方式 No 'Access-Control-Allow-Origin' header is present on the reque qiaolevip 每天进步一点点学习永无止境跨域众观千象
XMLHttpRequest cannot load http://v.xxx.com. No 'Access-Control-Allow-Origin' header is present on the requested resource. Origin 'http://localhost:63342' is therefore not allowed access. test.html:1
mysql 分区查询优化 annan211 java 分区优化 mysql
分区查询优化引入分区可以给查询带来一定的优势，但同时也会引入一些bug. 分区最大的优点就是优化器可以根据分区函数来过滤掉一些分区，通过分区过滤可以让查询扫描更少的数据。所以，对于访问分区表来说，很重要的一点是要在where 条件中带入分区，让优化器过滤掉无需访问的分区。可以通过查看explain执行计划，是否携带 partitions
MYSQL存储过程中使用游标 chicony Mysql存储过程
DELIMITER $$ DROP PROCEDURE IF EXISTS getUserInfo $$ CREATE PROCEDURE getUserInfo(in date_day datetime)-- -- 实例-- 存储过程名为：getUserInfo-- 参数为：date_day日期格式:2008-03-08-- BEGINdecla
mysql 和 sqlite 区别 Array_06 sqlite
转载： http://www.cnblogs.com/ygm900/p/3460663.html mysql 和 sqlite 区别 SQLITE是单机数据库。功能简约，小型化，追求最大磁盘效率 MYSQL是完善的服务器数据库。功能全面，综合化，追求最大并发效率 MYSQL、Sybase、Oracle等这些都是试用于服务器数据量大功能多需要安装，例如网站访问量比较大的。而sq
pinyin4j使用 oloz pinyin4j
首先需要pinyin4j的jar包支持；jar包已上传至附件内方法一:把汉字转换为拼音；例如：编程转换后则为biancheng /** * 将汉字转换为全拼 * @param src 你的需要转换的汉字 * @param isUPPERCASE 是否转换为大写的拼音； true:转换为大写；fal
微博发送私信随意而生微博
在前面文章中说了如和获取登陆时候所需要的cookie，现在只要拿到最后登陆所需要的cookie，然后抓包分析一下微博私信发送界面 http://weibo.com/message/history?uid=****&name=**** 可以发现其发送提交的Post请求和其中的数据，让后用程序模拟发送POST请求中的数据，带着cookie发送到私信的接入口，就可以实现发私信的功能了。
jsp 香水浓 jsp
JSP初始化容器载入JSP文件后，它会在为请求提供任何服务前调用jspInit()方法。如果您需要执行自定义的JSP初始化任务，复写jspInit()方法就行了 JSP执行这一阶段描述了JSP生命周期中一切与请求相关的交互行为，直到被销毁。当JSP网页完成初始化后
在 Windows 上安装 SVN Subversion 服务端 AdyZhang SVN
在 Windows 上安装 SVN Subversion 服务端2009-09-16高宏伟哈尔滨市道里区通达街291号最佳阅读效果请访问原地址：http://blog.donews.com/dukejoe/archive/2009/09/16/1560917.aspx 现在的Subversion已经足够稳定，而且已经进入了它的黄金时段。我们看到大量的项目都在使
android开发中如何使用 alertDialog从listView中删除数据？ aijuans android
我现在使用listView展示了很多的配置信息，我现在想在点击其中一条的时候填出 alertDialog,点击确认后就删除该条数据，（ ArrayAdapter ，ArrayList，listView 全部删除），我知道在下面的onItemLongClick 方法中参数 arg2 是选中的序号，但是我不知道如何继续处理下去 1 2 3
jdk-6u26-linux-x64.bin 安装 baalwolf linux
1.上传安装文件(jdk-6u26-linux-x64.bin) 2.修改权限 [root@localhost ~]# ls -l /usr/local/jdk-6u26-linux-x64.bin 3.执行安装文件 [root@localhost ~]# cd /usr/local [root@localhost local]# ./jdk-6u26-linux-x64.bin&nbs
MongoDB经典面试题集锦 BigBird2012 mongodb
1.什么是NoSQL数据库？NoSQL和RDBMS有什么区别？在哪些情况下使用和不使用NoSQL数据库？ NoSQL是非关系型数据库，NoSQL = Not Only SQL。关系型数据库采用的结构化的数据，NoSQL采用的是键值对的方式存储数据。在处理非结构化/半结构化的大数据时；在水平方向上进行扩展时；随时应对动态增加的数据项时可以优先考虑使用NoSQL数据库。在考虑数据库的成熟
JavaScript异步编程Promise模式的6个特性 bijian1013 JavaScript Promise
Promise是一个非常有价值的构造器，能够帮助你避免使用镶套匿名方法，而使用更具有可读性的方式组装异步代码。这里我们将介绍6个最简单的特性。在我们开始正式介绍之前，我们想看看Javascript Promise的样子： var p = new Promise(function(r
[Zookeeper学习笔记之八]Zookeeper源代码分析之Zookeeper.ZKWatchManager bit1129 zookeeper
ClientWatchManager接口 //接口的唯一方法materialize用于确定那些Watcher需要被通知 //确定Watcher需要三方面的因素1.事件状态 2.事件类型 3.znode的path public interface ClientWatchManager { /** * Return a set of watchers that should
【Scala十五】Scala核心九：隐式转换之二 bit1129 scala
隐式转换存在的必要性，在Java Swing中，按钮点击事件的处理，转换为Scala的的写法如下： val button = new JButton button.addActionListener( new ActionListener { def actionPerformed(event: ActionEvent) {
Android JSON数据的解析与封装小Demo ronin47
转自：http://www.open-open.com/lib/view/open1420529336406.html package com.example.jsondemo; import org.json.JSONArray; import org.json.JSONException; import org.json.JSONObject; impor
[设计]字体创意设计方法谈 brotherlamp UI ui自学 ui视频 ui教程 ui资料
从古至今，文字在我们的生活中是必不可少的事物，我们不能想象没有文字的世界将会是怎样。在平面设计中，UI设计师在文字上所花的心思和功夫最多，因为文字能直观地表达UI设计师所的意念。在文字上的创造设计，直接反映出平面作品的主题。如设计一幅戴尔笔记本电脑的广告海报，假设海报上没有出现“戴尔”两个文字，即使放上所有戴尔笔记本电脑的图片都不能让人们得知这些电脑是什么品牌。只要写上“戴尔笔
单调队列-用一个长度为k的窗在整数数列上移动，求窗里面所包含的数的最大值 bylijinnan java 算法面试题
import java.util.LinkedList; /* 单调队列滑动窗口单调队列是这样的一个队列：队列里面的元素是有序的，是递增或者递减题目：给定一个长度为N的整数数列a(i),i=0,1,...,N-1和窗长度k. 要求：f(i) = max{a(i-k+1),a(i-k+2),..., a(i)},i = 0,1,...,N-1 问题的另一种描述就
struts2处理一个form多个submit chiangfai struts2
web应用中，为完成不同工作，一个jsp的form标签可能有多个submit。如下代码： <s:form action="submit" method="post" namespace="/my"> <s:textfield name="msg" label="叙述：">
shell查找上个月，陷阱及野路子 chenchao051 shell
date -d "-1 month" +%F 以上这段代码，假如在2012/10/31执行，结果并不会出现你预计的9月份，而是会出现八月份，原因是10月份有31天，9月份30天，所以-1 month在10月份看来要减去31天，所以直接到了8月31日这天，这不靠谱。野路子解决：假设当天日期大于15号
mysql导出数据中文乱码问题 daizj mysql 中文乱码导数据
解决mysql导入导出数据乱码问题方法：１、进入mysql，通过如下命令查看数据库编码方式： mysql> show variables like 'character_set_%'; +--------------------------+----------------------------------------+ | Variable_name&nbs
SAE部署Smarty出现：Uncaught exception 'SmartyException' with message 'unable to write dcj3sjt126com PHP smarty sae
对于SAE出现的问题：Uncaught exception 'SmartyException' with message 'unable to write file...。官方给出了详细的FAQ：http://sae.sina.com.cn/?m=faqs&catId=11#show_213 解决方案为： 01 $path
《教父》系列台词 dcj3sjt126com
Your love is also your weak point. 你的所爱同时也是你的弱点。 If anything in this life is certain, if history has taught us anything, it is that you can kill anyone. 不顾家的人永远不可能成为一个真正的男人。 &
mongodb安装与使用 dyy_gusi mongo
一.MongoDB安装和启动,widndows和linux基本相同 1.下载数据库, linux:mongodb-linux-x86_64-ubuntu1404-3.0.3.tgz 2.解压文件,并且放置到合适的位置 tar -vxf mongodb-linux-x86_64-ubun
Git排除目录 geeksun git
在Git的版本控制中，可能有些文件是不需要加入控制的，那我们在提交代码时就需要忽略这些文件，下面讲讲应该怎么给Git配置一些忽略规则。有三种方法可以忽略掉这些文件，这三种方法都能达到目的，只不过适用情景不一样。 1. 针对单一工程排除文件这种方式会让这个工程的所有修改者在克隆代码的同时，也能克隆到过滤规则，而不用自己再写一份，这就能保证所有修改者应用的都是同一
Ubuntu 创建开机自启动脚本的方法 hongtoushizi ubuntu
转载自： http://rongjih.blog.163.com/blog/static/33574461201111504843245/ Ubuntu 创建开机自启动脚本的步骤如下： 1) 将你的启动脚本复制到 /etc/init.d目录下以下假设你的脚本文件名为 test。 2) 设置脚本文件的权限 $ sudo chmod 755
第八章流量复制/AB测试/协程 jinnianshilongnian nginx lua coroutine
流量复制在实际开发中经常涉及到项目的升级，而该升级不能简单的上线就完事了，需要验证该升级是否兼容老的上线，因此可能需要并行运行两个项目一段时间进行数据比对和校验，待没问题后再进行上线。这其实就需要进行流量复制，把流量复制到其他服务器上，一种方式是使用如tcpcopy引流；另外我们还可以使用nginx的HttpLuaModule模块中的ngx.location.capture_multi进行并发
电商系统商品表设计 lkl
DROP TABLE IF EXISTS `category`; -- 类目表 /*!40101 SET @saved_cs_client = @@character_set_client */; /*!40101 SET character_set_client = utf8 */; CREATE TABLE `category` ( `id` int(11) NOT NUL
修改phpMyAdmin导入SQL文件的大小限制 pda158 sql mysql
　用phpMyAdmin导入mysql数据库时，我的10M的数据库不能导入，提示mysql数据库最大只能导入2M。　　 phpMyAdmin数据库导入出错：　　You probably tried to upload too large file. Please refer to documentation for ways to workaround this limit.
Tomcat性能调优方案 Sobfist apache jvm tomcat 应用服务器
一、操作系统调优对于操作系统优化来说，是尽可能的增大可使用的内存容量、提高CPU的频率，保证文件系统的读写速率等。经过压力测试验证，在并发连接很多的情况下，CPU的处理能力越强，系统运行速度越快。。【适用场景】任何项目。二、Java虚拟机调优应该选择SUN的JVM，在满足项目需要的前提下，尽量选用版本较高的JVM，一般来说高版本产品在速度和效率上比低版本会有改进。 J
SQLServer学习笔记 vipbooks 数据结构 xml
1、create database school 创建数据库school 2、drop database school 删除数据库school 3、use school 连接到school数据库，使其成为当前数据库 4、create table class(classID int primary key identity not null) 创建一个名为class的表，其有一

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他