vivian_ll

论文笔记：Recurrent Convolutional Neural Networks for Text Classification

1 Abstract

文本分类是NLP的一项重要的基础任务。传统的文本分类需要特征工程，需要人类参与。而深度学习能够自动提取特征不需要人的参与。本文采用周期循环神经网络比卷积神经网络能够更加减少噪声，利用最大池化层选取一句话中最重要的特征。

首先在学习词的表达的时候，采用双向循环结构获取文本信息，比传统的基于窗口的神经网络更能减少噪声，而且在学习文本表达时可以大范围的保留词序。其次使用最大池化层获取文本主要成分，自动判断哪个特征在文本分类过程中起更重要的作用。

2 introduction

文本分类在很多应用中是非常重要的一部分。such as web searching, information filtering, and sentiment analysis。
feature representation:

bag-of-words: where unigrams, bigrams, n-grams or some exquisitely designed patterns are typically extracted as features.
several feature selection methods: frequency, MI, pLSA, LDA

传统的特征表达方法经常忽略了上下文的信息和词序信息，以及语义信息。
高阶n-gram，tree kernels被应用在特征表达，但是也有稀疏的缺点，影响准确性。
word embedding： word2vec 能够捕捉更多语法和语义特征。

Recursive Neural Network

效果完全依赖于文本树的构建，并且构建文本树所需的时间是O(n^2). 并且两个句子的关系也不能通过一颗树表现出来。因此不适合与长句子或者文本。

Recurrent Neural Network

优点：获取上下文信息。
缺点：有偏的模型（biased model），后面的词占得重要性更大。这样不好，因为每个词都可能是重要的词。
所以：Thus, it could reduce the effectiveness when it is used to capture the semantics of a whole document, because key components could appear anywhere in a document rather than at the end.

Convolutional Neural Network(CNN)

优点：无偏的模型（unbiased model），能够通过最大池化获得最重要的特征。
Thus, the CNN may better capture the semantic of texts compared to recursive or recurrent neural networks.
时间复杂度：O（n）
缺点：CNN卷积器的大小固定，如果选小了容易造成信息的丢失；如果选大了，会造成巨大的参数空间。
所以：Therefore, it raises a question: can we learn more contextual information than conventional window-based neural networks and represent the semantic of texts more precisely for text classification.

为了解决上面模型的缺陷，提出了本文的Recurrent Convolutional Neural Network (RCNN)

双向循环结构：比传统的基于窗口的神经网络噪声要小，能够最大化地提取上下文信息。

We apply a bi-directional recurrent structure, which may introduce considerably less noise compared to a traditional window- based neural network, to capture the contextual information to the greatest extent possible when learning word repre- sentations. Moreover, the model can reserve a larger range of the word ordering when learning representations of texts.

max-pooling layer池化层：自动决策哪个特征占有更加重要的作用。

We employ a max-pooling layer that automatically judges which features play key roles in text classification, to capture the key component in the texts.

时间复杂度：O（n）

我们的模型和目前最好的模型相比，并做了实验，取得了显著的效果。

3 related work

文本分类

传统的文本分类主要关注3个主题：特征工程，特征选择和使用不同的机器学习模型。
特征工程：广泛使用的特征工程是bag-of-words

For feature engineering, the most widely used feature is the bag-of-words feature. In addition, some more complex features have been designed, such as part-of-speech tags, noun phrases (Lewis 1992) and tree kernels (Post and Bergsma 2013).

特征选择：删除噪声特征：如去除停顿词，使用信息增益，L1正则

Feature selection aims at deleting noisy features and improving the classification performance. The most common feature selec- tion method is removing the stop words (e.g., “the”). Ad- vanced approaches use information gain, mutual informa- tion (Cover and Thomas 2012), or L1 regularization (Ng 2004) to select useful features

机器学习模型：LR，朴素贝叶斯，SVM

Machine learning algorithms often use classifiers such as logistic regression (LR), naive Bayes (NB), and support vector machine (SVM). However, these methods have the data sparsity problem.

深度学习网络

深度学习网络和词向量的研究解决了数据稀疏的问题。
词向量的研究使我们测量两个词向量的相似度来表征两个词之间的相似度。

With the pre-trained word embeddings, neural networks demonstrate their great performance in many NLP tasks. Socher et al. (2011b) use semi-supervised recursive autoen coders to predict the sentiment of a sentence. Socher et al. (2011a) proposed a method for paraphrase detection also with recurrent neural network. Socher et al. (2013) introduced recursive neural tensor network to analyse sentiment of phrases and sentences. Mikolov (2012) uses recurrent neural network to build language models. Kalchbrenner and Blunsom (2013) proposed a novel recurrent network for di- alogue act classification. Collobert et al. (2011) introduce convolutional neural network for semantic role labeling.

4 Model

Word Representation Learning

使用双向RNN分别学习当前词 $w_i$ 的左上下文表示 $c_l(w_i)$ 和右上下文表示 $c_r(w_i)$ ，再与当前词自身的表示 $e(w_i)$ 连接，构成卷积层的输入 $x_i$ 。具体如下:
$KaTeX parse error: No such environment: align at position 8: \begin{̲a̲l̲i̲g̲n̲}̲ c_l(w_i) = f(…$
$e(w_{i-1})$ is the word embedding of word $w_{i-1}$ ,which is a dense vector with $∣ e ∣$ real value elements.
任何文档中第一个单词的左侧上下文使用相同的共享参数 $c_{l}(w_{1})$ ，最后一个单词的右侧上下文共享参数 $c_{r}(w_{n})$ .
使用此模型时间复杂度仅为O(n)，与文本长度呈线性相关，大大地消除了歧义。
然后将 $x_i$ 作为 $w_i$ 的表示，输入到激活函数为tanh,kernel size为1的卷积层，得到 $w_i$ 的潜在语义向量(latent semantic vector) $y^{(2)}_i$ ,具体如下：
$y^{(2)}_i=tanh(W^{(2)}x_i+b^{(2)})$
将kernel size设置为1是因为 $x_i$ 中已经包含 $w_i$ 左右上下文的信息，无需再使用窗口大于1的filter进行特征提取。但是需要说明的是，在实践中仍然可以同时使用多种kernel size的filter，如[1, 2, 3]，可能取得更好的效果，一种可能的解释是窗口大于1的filter强化了 $w_i$ 的左右最近的上下文信息。此外，实践中可以使用更复杂的RNN来捕获 $w_i$ 的上下文信息如LSTM和GRU等。

Text Representation Learning

经过卷积层后，获得了所有词的表示，然后在经过最大池化层和全连接层得到文本的表示，最后通过softmax层进行分类。具体如下：
(1) Max-pooling layer
$y^{(3)}=\max \limits_{i=1}^{n} y^{(2)}_i$
(2) Fully connected layer
$y^{(4)}=W^{(4)}y^{(3)}+b^{(4)}$
(3) Softmax layer
$p_i=\frac{\exp(y^{(4)}_i)}{\sum_{k=1}^n \exp(y^{(4)}_k)}$
下图为上述过程的一个图解:

如图所示，先经过1层双向LSTM，该词的左侧的词正向输入进去得到一个词向量，该词的右侧反向输入进去得到一个词向量。再结合该词的词向量，生成一个 1 * 3k 的向量。

再经过全连接层，tanh为非线性函数，得到y2。

再经过最大池化层，得出最大化向量y3.

再经过全连接层，sigmod为非线性函数，得到最终的多分类。

Training

训练网络参数 $\left\{E,b^{(2)},^{(4)},c_{l}(w_{1}),c_{r}(w_{n}), W^{(2)},W^{(4)},W^{(l)},W^{(r)},W^{(sl)},W^{(sr)}\right\}$
最大化关于 $θ$ 的对数似然函数，使用随机梯度下降法来优化训练目标。
此处使用了一个常用技巧，即神经网络中的所有参数由均匀分布初始化而成。最大值或最小值的量级等于“fan-in”的平方根，“fan-in”是模型中上一层的网络节点数。

Pre-training Word Embedding

Recent research shows that neural networks can converge to a better local minima with a suitable unsupervised pre-training procedure。
本文中使用的是Skip-gram模型。

5 Experiments

Datasets

**20Newsgroups1** qwone.com/˜jason/20Newsgroups/ 数据集包含20个新闻组的信息，我们使用日期版本并选择四种主要类别（综合，政治，娱乐和宗教）.
**Fudan set2** 2www.datatang.com/data/44139 and 43543 复旦大学文件分类集合是一个中文文件分类集合，包含20个分类，包括艺术教育和能源。
**ACL Anthology Network3** old-site.clsp.jhu.edu/˜sbergsma/Stylo/ 该数据集包含了由ACL和相关组织发布的科学文献。它由五种语言注解：英语，日语，德语，中文和法语。
**Stanford Sentiment Treebank4** nlp.stanford.edu/sentiment/ 这个数据集包含了电影评论解析，和五种标签：非常消极，消极，中立，积极，非常积极。

Experiment Settings

数据预处理：

英文：use the Stanford Tokenizer5 to obtain the tokens
中文：use ICTCLAS6 to segment the words
不去停用词

ACL和SST有预定义的training、development和testing separation，其他数据集10%development和90%training。
评价指标20Newsgroups用Macro-F1，其他用accuracy。
超参数设置：

the learning rate of the SGD: 0.01
the hidden layer size: 100
the size of the context vector: 50 (left + right = 100)
the vector size of the word embedding: 50
Pre-training Word Embedding:
- using the default parameter in word2vec with the Skip-gram algorithm.
- use Wikipedia dumps in both English and Chinese
  ###Comparison of Methods
Bag of Words/Bigrams + LR/SVM
文本分类的基准主要使用单词或双词作为特征的机器学习算法。
分别使用LR和SVM（www.csie.ntu.edu.tw/˜cjlin/liblinear），每个特征的权重为术语出现的频率。
Average Embedding + LR
这个基准使用词嵌入的平均权重，随后应用到一个softmax层。每个单词的权重是它词频-逆向文件频率的值
LDA
在集中分类任务中，基于LDA的方法能够较好捕获文本的语义。我们选择两种方法用于比较：ClassifyLDA-EM和Labeled-LDA。
Tree Kernels
使用各种tree kernel作为特征，是ACL母语分类任务中最先进的工作。列举两个主要方法用以比较：the context-free grammar (CFG) produced by the Berkeley parser (Petrov et al. 2006) and the reranking feature set of Charniak and Johnson (2005) (C&J)。
RecursiveNN
我们使用两种递归结构比较：the Recursive Neural Network (RecursiveNN) (Socher et al. 2011a) 和它的改进版本 the Recursive Neural Tensor Networks (RNTNs)。
CNN
选择卷积神经网络用于比较。它的卷积内核只是简单的级联了预定义窗口大小的词嵌入。

Results and Discussion

NN vs. traditional methods: 在该论文的所有实验数据集上，神经网络比传统方法的效果都要好
- It proves that neural network based approach can effective compose the semantic representation of texts.
- Neural networks can capture more contextual information of features compared with traditional methods based on BoW model, and may suffer from the data sparsity problem less.
Convolution-based vs. RecursiveNN: 基于卷积的方法比基于递归神经网络的方法要好
- The convolution-based framework is more suitable for constructing the semantic representation of texts compared with previous neural networks.
- The main reason is that CNN can select more discriminative features through the max-pooling layer and capture contextual information through convolutional layer.
- By contrast, RecursiveNN can only capture contextual information using semantic composition under the constructed textual tree, which heavily depends on the performance of tree construction.
- A lower time complexity [O(n)] than the recursive-based approaches [O(n2)]
除了ACL和SST，在别的数据集上都是RCNN最好
RCNN vs. CFG and C&J: The RCNN可以捕获更长的模式(patterns)
- The RCNN does not require handcrafted feature sets, which means that it might be useful in low-resource languages.
RCNN vs. CNN: 在该论文的所有实验数据集上，RCNN比CNN更好
- The reason is the recurrent structure in the RCNN captures contextual information better than window-based structure in CNNs.

Contextual Information

如何能够更有效捕获上下文信息？通过CNNs与RCNNs对比，如下图，可以知道RCNN更好。

CNNs使用固定的词窗口(window of words), 实验结果受窗口大小影响
- A small window: a loss of some long-distance patterns,
- Large windows: data sparsity, a large number of parameters are more difficult to train
RCNNs使用循环结构捕获广泛的上下文信息
- The RCNN could capture contextual information with a recurrent structure that does not rely on the window size.
- The RCNN outperforms window-based CNNs because the recurrent structure can preserve longer contextual information and introduces less noise.

Learned Keywords

关键词在文本分类任务中非常重要的决策。因此论文列出了RCNN学习到的一些重要关键词（选择max-pooling层中最频繁被选中的词作为中心的trigram），并与RNTN学习到的关键词作为对比，如Table 3。观察到了如下现象：

In contrast to the most positive and most negative phrases in RNTN(Socheret al. 2013), RCNN does not rely on a syntactic parser, therefore, the presented n-grams are not typically “phrases”.
The results demonstrate that the most important words for positive sentiment are words such as “worth”, “sweetest”, and “wonderful”, and those for negative sentiment are words such as “awfully”, “bad”, and “boring”.

Conclusion

无新内容，略。

阅读笔记：阅读方法中的逻辑和转念施吉涛
聊聊一些阅读的方法论吧，别人家的读书方法刚开始想写，然后就不知道写什么了，因为作者写的非常的“精致”我有一种乡巴佬进城的感觉，看到精美的摆盘，精致的食材不知道该如何下口也就是《阅读的方法》，我们姑且来试一下强劲的大脑篇，第一节：逻辑通俗的来讲，也就是表达的排列和顺序，再进一步就是因果关系和关联实际上书已经看了大概一遍，但直到打算写一下笔记的时候，才发现作者讲的推理更多的是阅读的对象中呈现出的逻辑也
20220226号今日份（6）张雅苑Momo
考虑以下必备行程安排：1作息规律2三餐规律3早茶下午茶4晨练运动5阅读笔记6挚爱亲朋联络20220226号今日份快乐是有哪一些呢？1：视频号直播的持续今天已经是第221/190天啦今天主讲人在分享事上练的能力，事上见2：持续吉他练习今天已经第25天啦3：今天持续带动某人整理屋子，要加油哦，要持续哦今天的过程持续比较轻松愉快4：今天老佛爷入院的第四天，上阵父子兵，期待他们仨早起凯旋归来如何成为自己喜
24营2组锋妈11月13日作业及阅读笔记锋妈
第一部分，听课心得在《时间管理目标模型课程》中，主要学到了如下四点：一、为什么要制定目标二、怎么样制定目标三、制定目标后要做些什么四、立刻行动起来听完后，对照讲课提纲，是自身的存在的弱点，觉着最大的绊脚石是第四点立刻行动起来。因为再宏伟的目标，再强大的驱动力下，如果没有行动去执行，一切都是空谈。为了避免执行力弱化，结合自己目前实际情况，觉着尽量把目标制定的简单明了、可执行、可衡量、可反馈回顾的。只
他为了她努力发家致富，五年后她却要了他的命 ——《了不起的盖茨比》读后感一切来得及
《大亨小传》？又一译名春节期间，我参加了网易蜗牛读书举行的“7天CP读”活动。活动规则是在小程序里配对，两人共读一本书。我选的书是《了不起的盖茨比》，早就闻名，早就想读，却一直没开始的一本书。老话说得没错，男女搭配，干活不累。想不到读书也是如此。不到六天，我就读完了全书，写了近30条阅读笔记。与此同时，与我搭档的美女好像忙着发财，一直没动头。不过，我还是感谢她，感谢她赐予我阅读的力量！读完全书，我
A1/A2: S.O.S. Urgences, Chapitre 1 自观问渠
阅读笔记，Chapitre11.Allô!喂;公司接线员的用语：Allôbonjour，公司名。2.S.O.S.派遣医生上门服务3.请说！Jevousécoute./Jet'écoute.使用场景：我听你讲，你说吧。私人聊天，正式场合4.C'estpourqqn表示目的用pour5.Ilfaut用法Jepeuxvenir,maisilfautuneadresse.ilfaut+名词必须有某物Ilf
阅读笔记-有一种女人张海佩happy
来自@寒山说，致谢！有一种女人，咋一看性格温柔，为人谦和有礼，易接触，可走近发现她自带“疏离感“。她的疏离感并非源自“傲”，而是因她内心太过丰富，且过于敏感。她觉得人类的悲喜并不相同，故而选择保持距离，她的同理心强，共情力更强，她深深地理解他人的痛苦，绝不轻易伤害他人。她礼貌处世，既不向上奉承，也不向下贬低，不以物喜，不以己悲，是温柔到骨子里的人。她拥有自己的精神世界，她可能会沉迷于小说里的某句台
论文阅读笔记（十九）：YOLO9000: Better, Faster, Stronger __Sunshine__ 笔记 YOLO9000 detection classification
WeintroduceYOLO9000,astate-of-the-art,real-timeobjectdetectionsystemthatcandetectover9000objectcategories.FirstweproposevariousimprovementstotheYOLOdetectionmethod,bothnovelanddrawnfrompriorwork.Theim
论文阅读笔记: DINOv2: Learning Robust Visual Features without Supervision 小夏refresh 论文计算机视觉深度学习论文阅读笔记深度学习计算机视觉人工智能
DINOv2:LearningRobustVisualFeatureswithoutSupervision论文地址:https://arxiv.org/abs/2304.07193代码地址:https://github.com/facebookresearch/dinov2摘要大量数据上的预训练模型在NLP方面取得突破，为计算机视觉中的类似基础模型开辟了道路。这些模型可以通过生成通用视觉特征(即无
马克米勒维尼《动量大师超级交易员圆桌访谈录》阅读笔记59 小二菜园
问题59：你在分析中是否使用利润率或净资产收益率（ROE）？马克·米勒维尼：是的。我喜欢看到不断扩大的利润率。有时，这可能是一个公司业绩改善但销售为负背后的催化剂。但就像我说的，没有销售收入，你只能在一段时间内提高收益。净资产收益率是你应该用来比较你的股票与同一行业其他股票的东西，一般来说，更好的股票会有15-17%或更高的净资产收益率。大卫·瑞恩：它们都是值得关注的指标，也是我进一步研究公司盈利
《以色列——一个民族的重生》第四到第六章阅读笔记惠尔好我
在奥斯曼帝国统治时期，阿拉伯人就意识到，巴勒斯坦生活的犹太人将改变该地区的“阿拉伯属性”。第一次犹太移民潮中，欧洲犹太人带来的观念和现代性和当地犹太人以及阿拉伯人的意识形态发生冲突。可以说，当地人和外来者对国家和社会抱有的不同理念、对荣誉和记忆的不同感受以及许多其他方面的难以沟通，成为后来犹太人和阿拉伯人长期冲突的重要原因。反观中华民族强大的包容性，同化性，共生性带来了强大的生命力。为了架起各方沟
《少有人走的路》第三部分信仰和世界观分阅读笔记芦絮
爱的本质是拓展自我，必须进入未知的领域，放弃落后的，陈旧的自己，把陈腐过时的认知踩在脚下，抛弃狭隘的人生观。做到以上这些必须对过去提出疑问，怀疑和挑战，才能使我们走上神圣的自由之路！作者分别用三位患者举例说明，所有的一切习惯，宗教信仰基本都来源于父母，不幸的童年，所以一个人的心智与家人，朋友，环境是息息相关，我们要给自己输送正能量的东西，让自己充满正能量，做一个阳光的人！
llama_index 官方文档阅读笔记 (持续更新版) 皮卡丘ZPC AIGC for GPT 评分体系构架笔记 llama 人工智能语言模型
llama0.10.17版本阅读链接:LlamaIndexv0.10.17LlamaIndex是一个基于LLM的应用程序的数据框架，它受益于上下文增强。这种LLM系统被称为RAG系统，代表“检索-增强生成”。LlamaIndex提供了必要的抽象，以便更轻松地摄取、构建和访问私有或特定于域的数据，以便将这些数据安全可靠地注入LLM，以实现更准确的文本生成。为什么选择上下文增强？LLM的局限LLM在人
我理解的《月亮和六便士》（3）澎波先生
突然发现这样慢慢地阅读一本书，每天写所读部分的阅读笔记，挺有意思的。我个人觉得，这是个将书读厚的过程，虽然这个厚还只是对书本内容的解读，还没到联系实际的理解，但阅读本身就很有趣，也应该知足了。阅读笔记三：今天看到了48%，不得不说这部分其实有些狗血。这部分说到主人公、老戴和查理斯三人之间存在着某种奇怪的友情，直到查理斯病倒了，老戴说服他夫人勃朗仕让查理斯住在家里的画室，并且两人一起照顾查理斯。病后
《卓有成效的管理者》第一章阅读笔记与心得张建平深圳
自我管理这是一个做管理多年的朋友推荐给我的第一本德鲁克的书。开始以为是一本专门企业管理的书，看完才知道是一本自我管理的书。图片发自App彼得.德鲁克，号称管理科学“大师中的大师”。是“工业时代”到“知识时代”管理学的桥梁搭建者。图片发自App推荐他著作的牛人很多，就知道他的思想有多重要。如果不好好读，不深入读，不读以致用，就等于跟风装13（跟00后学的装B新词），等于没读。图片发自App这本书适合
阅读笔记3《有钱人和你想的不一样》230305财富蓝图 Mika罗盘上的点
重新设定为收入稳定增长的模式。认知“实现程序”为这个形式：设定→想法→感觉→行动=结果设定会产生想法；想法产生感觉；感觉产生行动；行动产生结果。我要再强调一次：潜意识所受到的制约，决定了思想；思想决定了选择；选择决定了行动，而行动就决定了结果。第一个改变的步骤：修改语言程式一、察觉：写下小时候听过的所有描述金钱、财富和有钱人的话语。二、理解：写下认为这些说法如何影响财务生活。三、划清界限：有没有看
近乎无事的悲哀——《风筝》阅读笔记天光云影好丹青
某一天，我们心底也会留有这样莫可名状的惆怅吗？———不算题记的题记对于从事现代文学教学与研究的人而言，如果硬要说有某一个作家是不可绕过的，那么，可以断定所有的人都会毫不犹豫地将神圣的一票投给“鲁迅”。不管你是否真正知晓中国的过去与现状，也不管你是否真的能够同鲁迅实现内在心灵上的共鸣，他之于这个国家的文学历史、之于这个国家本身的重要性，至少在今天都还是不言而喻的。刘再复1978年《略论鲁迅思想的发展
2-12 三观易碎d2阅读笔记二桥啊
摘抄：回头看整个成长时期最遗憾的事，就是我们自己糊涂的时候，那些引导我们的前辈没能给我们以真正的启迪想法：看到这句话时，我心一凉，我后悔的事情有很多，可不曾真正考虑过这一点，长辈们对我的教育大体没错，可是有的东西我明白得太晚，譬如学习的意义、恋爱、婚姻、性观念等问题，他们给我提供他们认为好的物质，然后有些观念形成得晚也事实上令我错失一些东西，好在我现在也在学习也在慢慢去明白，现如今我也在长辈的路上
Robotic TMS（三）：机器人TMS相关技术巴普蒂斯塔机器人学 TMS 机器人系统轨迹规划运动控制视觉私服
本文为阅读笔记，仅供学习交流使用！！！从之前的文章中可以归纳出与机器人辅助经颅磁刺激相关的一些重要技术。包括：机械臂的（1）运动轨迹跟踪技术；（2）视觉私服控制；（3）视觉标定技术；（4）轨迹规划；（5）位置和力控制；（6）安全问题。一、运动轨迹跟踪为了避免固定受试者的头部，应使用跟踪系统来引导和调整线圈的位置和方向。有许多类似的跟踪系统可供选择：空间连杆机构、超声波跟踪系统、磁场跟踪系统、以及光
Robotic TMS（一）：TMS（经颅磁刺激）介绍巴普蒂斯塔机器人学 TMS Robotic 神经科学脑科学机器人学
本文为阅读笔记，仅供学习交流使用！！！经颅磁刺激技术（TranscranialMagneticStimulation,TMS）是一种无痛、无创的绿色治疗方法，磁信号可以无衰减地透过颅骨而刺激到大脑神经。随着技术的发展，具有连续可调重复刺激的经颅磁刺激（rTMS）出现，并在临床精神病、神经疾病及康复领域获得越来越多的认可。经颅磁刺激技术得到了广泛的使用，国内的经颅磁刺激技术达到世界先进水平，在神经心
SAFEFL: MPC-friendly Framework for Private and Robust Federated Learning论文阅读笔记慘綠青年627 论文阅读笔记深度学习
SAFEFL:MPC-friendlyFrameworkforPrivateandRobustFederatedLearning适用于私有和鲁棒联邦学习的MPC友好框架SAFEFL，这是一个利用安全多方计算(MPC)来评估联邦学习(FL)技术在防止隐私推断和中毒攻击方面的有效性和性能的框架。概述传统机器学习（ML）：集中收集数据->隐私保护问题privacy-preservingML(PPML)采
目标思维、效率思维、行动力思维蓝色多莉
阅读笔记第163/365天今日阅读《从怕学习到爱学习》——一本给父母的优等生养成指南作者：张萌第三章：高效行动力。一、目标思维。——孩子做事没耐心，不能持之以恒怎么办？1、做任何事都需要一个理由。孩子做事没有耐心，不能持久的原因：一是，缺乏兴趣。二是，缺少自制力。做事时注意力分散，不会分配精力。家长要帮助孩子找回性耐心，找回兴趣，提起做事的劲儿，需要让孩子拥有目标思维，利用目标思维帮助孩子找到自己
《登天的感觉》阅读笔记案例解析（2） dear心理咨询师黄倩雯
来询者之所以会对咨询者产生特殊的好感，主要是因为后者在前者头脑混乱，情绪低落之际，给予了对方由衷的理解和支持。
Circle Loss: A Unified Perspective of Pair Similarity Optimization简要阅读笔记 dailleson_ 机器学习机器学习数据挖掘神经网络深度学习自然语言处理
1.背景常见的分类损失函数可以概括为减小类内距离sns_nsn，增大类间距离sps_psp。优化目标如下：min(sn−sp)min(s_n-s_p)min(sn−sp)2.存在的问题优化不够灵活。优化目标对sns_nsn和sps_psp的惩罚作用是相等的，二者的系数都为1。例如{sn,sp}={0.1,0.5}\{s_n,s_p\}=\{0.1,0.5\}{sn,sp}={0.1,0.5}。这个
一对母女的深度阅读笔记：给孩子最强大脑不如陪孩子读遍好书朝南有飘窗
我们分享过不少“深度阅读”的方法，其中很重要的一点，是在阅读后，制作一份“研究报告”，比如设计精致的阅读海报（点此阅读），今天再分享一个妈妈带女儿用思维导图，围绕虚构类和非虚构类好书制作的读书笔记，不仅授予孩子检索、总结等技能，更塑造孩子不断求知的好习惯。虚构类图书：探究故事的背景提出问题，是引发思考的第一步。当孩子着迷于一个故事的时候，家长可以找到那个有趣的问题，引导孩子体会思考的乐趣。国外的孩
Nginx源码阅读笔记-内存池的设计 weixin_33701564 运维 python 数据结构与算法
2019独角兽企业重金招聘Python工程师标准>>>nginx的内存池设计的比较简单了，一个内存池中分为两个部分：超过max大小的内存分配，走大块内存分配，这部分内存管理由ngx_pool_large_t结构体负责。否则就是在ngx_pool_t遍历符合要求的ngx_pool_t结构体，找到符合要求大小的pool直接返回，否则就申请一块新的内存pool。nginx中所有请求都单独对应一个内存池，
核心2群3组耿艳菊2018.7.17阅读笔记耿艳菊
《少有人走的路》我们大多人趋向于逃避一切痛苦和折磨，对某些消极现象可能熟视无睹，对残酷的现实可能不闻不问，我们捍卫自己的意识，不让真实的信息侵入其中，心理学家把这种情形成为“意识的防卫机制”。每个人都可能采用这种机制，有意限制自己的认知范围和认知能力。我们生活在现实世界里，要想生活得更好，必须尽可能地了解世界的本质，但了解的过程无法一蹴而就。要洞悉世界的本质，认清自己和世界的关系，我们就可能经受各
A Tutorial on Near-Field XL-MIMO Communications Towards 6G【论文阅读笔记】 Cc小跟班【论文阅读】相关论文阅读笔记
此系列是本人阅读论文过程中的简单笔记，比较随意且具有严重的偏向性（偏向自己研究方向和感兴趣的），随缘分享，共同进步~论文主要内容：建立XL-MIMO模型，考虑NUSW信道和非平稳性；基于近场信道模型，分析性能（SNRscalinglaws，波束聚焦、速率、DoF）XL-MIMO设计问题：信道估计、波束码本、波束训练、DAMXL-MIMO信道特性变化：UPW➡NUSW空间平稳–>空间非平稳（可视区域
阅读笔记李蓉乐平市湾头中小学
今日份阅读《成年人的世界没有容易二字》。这种鸡汤文，对人的发展真的没太大意义，通篇教你要如何努力，却教不了你真正的自律，每一条文字都能让你对号入座，却不能让你真正发生改变，不是说它不好，于本书而言是真正的鸡汤，但它能带给你智慧是有限的，一本好书，通常不会过多的去反映社会现实，和取悦读者，而是能够触及到生命意义让你有所反思的书。所以把这段话读给我班学生听，我只是一只蚂蚁撼不动大树，如若能撼动一片树叶
14.犹太人的智慧法则 | #阅读笔记#01-《财源滚滚：犹太人赚钱的十诫》拉布拉多滚雪球
这是拉布拉多滚雪球的第14篇原创投资者，特别是投资小白如大学生和初入职场者，受限于思维认知和人生经历匮乏等原因，在贸然进入资本市场后，往往损失惨重，并且不明白究竟为何亏损，进而反复遭到“市场先生”教育，最终只能铩羽而归，失去万般艰险得来的一点本金。本号在前期大多分享的是财经类著作，专注于资本市场历史案例和真实活动，需要读者具备一定的专业理论基础，对于缺乏财经知识积累的人全面系统地理解相关理念存在门
时序预测相关论文阅读笔记能力越小责任越小YA 论文阅读笔记时序预测 Transformer
笔记链接：【有道云笔记】读论文（记录）https://note.youdao.com/s/52ugLbot用于个人学习记录。
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end