稀饭粥9999

Distributed representations of words and phrases and their compositionality

Distributed representations of words and phrases and their compositionality

基本信息

@inproceedings{mikolov2013distributed,
title={Distributed representations of words and phrases and their compositionality},
author={Mikolov, Tomas and Sutskever, Ilya and Chen, Kai and Corrado, Greg S and Dean, Jeff},
booktitle={Advances in neural information processing systems},
pages={3111–3119},
year={2013}
}

Abstract

研究内容：
continuous Skip-gram model $\rightarrow$ distributed vector representations $\rightarrow$ capture precise syntactic and semantic word relationships
本文工作：提高词向量的质量与训练速度
- subsampling of the frequent words $\rightarrow$ 提高训练速度，学习更常规的单词表征
- negative sampling：hierarchical softmax的简单替代
词表征的inherent limitation：
- 无差异的对待词序信息
- 不能表达习语 $\rightarrow$ 本文：提出一个找到文本中习语的方法，展示学习习语向量表征的可能性。

Ⅰ. Introduction

word representations的提出及应用
- 词的分布式表达：聚类相似的单词 $\rightarrow$ 提高了自然语言处理任务的性能
- 提出：1986，Rumelhart, Hinton, and Williams
- 应用：statistical language modeling $\rightarrow$ 自动语音识别，机器翻译，等一系列NLP tasks
previous work：
- Mikolov, Skip-gram model (learn from unstructured text data)
- 优势：不包含稠密的矩阵乘法运算 $\rightarrow$ 计算高效 $\rightarrow$ 单机，100billion words, one day
词向量的特点：
- learned vectors explicitly encode many linguistic regularities and patterns
- linear translations：vec(“Madrid”) - vec(“Spain”) + vec(“France”) = vec(“Paris”)
本文工作：Skip-gram model的升级版
- subsampling of frequent words（训练）
  - 速度：signiﬁcant speedup (around 2x - 10x)
  - 低频词的表征：improves accuracy of the representations of less frequent words
- Noise Contrastive Estimation (NCE)的简单变体，替代了复杂的hierarchical softmax
  - 速度：results in faster training
  - 高频词的表征：better vector representations for frequent words
Word representations的局限：不能表征习语 $\rightarrow$ 令Skip-gram model可以表征习语是considerably more expressive
- 一项表征句子含义的技术：recursive autoencoders，使用phrase vector会比word vector表现更好
由word vector $\rightarrow$ phrase vector
- 方法：以data-driven的方式识别大量phrases $\rightarrow$ 将这些phrases当作individual tokens
- 测评：analogical reasoning tasks类比推理任务
- vec(“Montreal Canadiens”) - vec(“Montreal”) + vec(“Toronto”) = vec(“Toronto Maple Leafs”)
Skip-gram model的一些有趣性质：
- 我们发现简单的向量加法通常可以产生有意义的结果： vec(“Russia”) + vec(“river”) $\approx $ vec(“Volga River”)
- 语义合成性：通过对词向量表示的基本数学运算，可以获得不明显的语言理解程度

Ⅱ. The Skip-gram Model

训练目标：根据中心词，预测周围的单词
目标函数：最大化平均对数概率
$\max \frac{1}{T}\sum_{t=1}^{T}\sum_{-c\le j \le c,j\ne 0} log p(w_{t+j}\mid w_t)$
$p(w_O \mid w_I) = \frac{{exp(v'_{w_o}}^Tv_{w_I})}{\sum_{w=1}^{W}{exp(v'_{w}}^Tv_{w_I})}$
$c$ ：中心词的窗口大小， $c$ 越大 $\rightarrow$ high accuracy, expense of the training time
$v_w$ , $v'_w$ ：the “input” and “output” vector representations of w
备注：同一个单词有两个词向量，一个是作为中心词的词向量，一个是作为预测的周围单词的词向量
$W$ ：词典的大小
impractical不切实际的， $\bigtriangledown p(w_O \mid w_I)$ 与 $W$ 成比例，通常在( $10^5–10^7$ terms).

2.1 Hierarchical Softmax

利用hierarchical softax近似softmax的计算
- 首次提出：Morin and Bengio
- 计算复杂度有 $O (W)$ 变为了 $log_2(W)$
方法：利用二叉树表示输出层的W各单词，W各单词为其叶节点；对于每个节点，表征了子节点的相对概率；碘杠一了一种random walk为单词分配概率
计算：
$\mid w_i) = \prod_{j=1}^{L(w)-1}\sigma(【n(n(w,j+1)=ch(n(w,j))】 \cdot {v'_{n(w,j)}}^Tw_{wI})$
$n (w, j)$ ：从根节点到单词w的第j个中间节点
$L (w)$ ：cong根节点到单词w的路径长度
$c h (n)$ ：固定的子节点（左节点or右节点）
$【 x 】$ ：若x是true，则为1；反之为-1
$\sigma(x) = \frac{1}{1+exp(-x)} \rightarrow \sum_{w=1}^{W}p(w\mid w_I)=1$
特点：
- $\mid w_I)$ 与 $\bigtriangledown p(w_O \mid w_I)$ 的计算复杂度与 $L(w_O)$ 成比例
- 不同于标准的Skip-gram，为每个单词分配两个表征 $v_w$ ，与 $v'_w$ ，hierarchical softmax为每个单词分配一个词向量 $v_w$ ，以及为每个内部节点分配向量表征 $v'_n$
优势：has a considerable effect on the performance
- Mnith and Hinton提出了构建树结构的方法，并且分析了对训练时间与模型准确率的影响
- 本文：Huffman树，高频词的编码较短（靠近根节点） $\rightarrow$ fast training
- 在神经网络语言模型中，将单词按频率分组是一种非常简单的加速技术

2.2 Negative Sampling

Noise Constrastive Estimation (NCE)
- hierarchical softmax的替代选择
- 由Gutmann and Hyvarinen提出，Mnih and Teh应用于语言模型
- 思路：一个好的模型应该能够通过逻辑回归将数据与噪声区分开来
- 类似工作：hinge loss, Collobert and Weston, 将数据置于噪声之上来训练模型
NCE，近似，最大化softmax的log概率 $\rightarrow$ 只要保证vector的质量，可适度简化 $\rightarrow$ 定义了Negative sampling (NEG) $\rightarrow$ 代替 $P(w_O \mid w_I)$
$\sigma ({v'_{w_O}}^Tv_{w_I}) + \sum_{i=1}^{k}\mathbb{E}_{w_i \sim P_n(w)}[log \sigma{(-v'_{w_i}}^Tv_{w_I})]$
目标：利用logistic回归将目标词 $w_O$ 与噪声分布 $P_n(w)$ 进行区分，其中每个数据样本都有k个负样本。
经验值：
- small training datasets：$k=5 \sim 20 $
- large training datasets：$k=2 \sim 5 $
NCE与NEG的区别：
- NCE：需要样本及噪声分布的数值概率；NEG：需要样本
- NCE近似地最大化了softmax的对数概率，但是这个特性对我们的应用程序并不重要
噪声分布 $P_n(w)$ 的选择： $U(w)^{\frac{3}{4}}/Z$ ，均匀分布

2.3 Subsampling of Frequent Words

思想：高频出现的词，信息价值很少 $\rightarrow$ the经常与很多单词co-occurs $\rightarrow$ 经过长时间训练，词向量没有显著的改变 $\rightarrow$ 平衡rare and frequency words $\rightarrow$ 对每个词按概率进行discard
概率计算： $P(w_i) = 1- \sqrt{\frac{t}{f(w_i)}}$
$ f(w_i) $：单词$ w_i$的频率
$t$ ：阈值， $10^{-5}$
优势：
- 在保留频率排序的同时，对频率大于 $t$ 的词进行了启发式的子抽样
- 加快了学习速度，提高了罕见词词向量的准确性

Ⅲ. Empirical Results

对比方法：
- Hierarchical Softmax (HS)
- Noise Contrastive Estimation
- Negative Sampling
- Subsampling of frequent words
测评任务：analogicalreasoning task $\rightarrow$ 语义推理、语法推理
数据集：large dataset (news articles, one billion words, Google)，去除频次低于5的单词 $\rightarrow$ vocabulary of size 692K
结论：
- Negative Sampling优于Hierarchical Softmax，稍好于Noise Contrastive Estimation
- Subsampling of frequent words提高了几倍的训练速度，准确率
线性的skip-gram模型适合线性类比推理；增加训练样本也可显著改善sigmoidal recurrent neural networks 的性能 $\rightarrow$ 非线性模型也偏爱线性结构

Ⅳ. Learning Phrases

要学习短语的向量表示，我们首先要找到经常出现在一起的词，以及在其他上下文中不经常出现的词。
- New York Times, Toronto Maple Leafs; this is
方法：data-driven
$score(w_i,w_j) = \frac{count(w_iw_j)-\delta}{count(w_i) \times count(w_j)}$
$\delta$ ： discounting coefﬁcient $\rightarrow$ 防止短语包含许多不常用词汇
选取阈值；特别地，以递增的阈值运行2-4个轮回，允许构建多个单词的短语
测评：以新的包含短语的推断任务进行测评
实验结果：

4.1 Phrase Skip-Gram Results

Distributed representations of words and phrases and their compositionality_第5张图片

Distributed representations of words and phrases and their compositionality_第6张图片

Ⅴ. Additive Compositionality（语义合成性）

线性运算：推理；直接向量相加合成新的有意义的组合
原因：由training objective决定的
- The word vectors are in a linear relationship with the inputs to the softmax nonlinearity
- 用中心单词预测周围的单词 $\rightarrow$ 用中心单词表征周围单词的分布 $\rightarrow$ 这些值与输出层计算的概率呈对数关系 $\rightarrow$ 两个词向量的相加对应与两个上下文分布的乘积
- 由两个词向量分配高概率的词将具有高概率，而其他词将具有低概率
- vec(Russian) + vec(river) = vec(Volga River)

Ⅵ. Comparison to Published Word Representations

基于神经网络的词表征：
- Collobert and Weston
- Turian et al.
- Mnih and Hinton
empirical comparison
性能好的原因：高于原来3个数量级的训练数据
训练时间复杂度低

Ⅶ. Conclusion

训练单词的分布式表示（Skip-Gram算法）；表示中存在的线性结构；也可用于continuous bag-of-words.
模型高效的计算，可以训练高于几个数量级的数据 $\rightarrow$ 提升了词向量表示的准确性，特别是对于频次较低的单词。
subsampling of the frequent words $\rightarrow$ faster training; better representations of uncommon words
Negative sampling algorithm $\rightarrow$ extremely simple training method; learns accurate representations ( frequent words)
训练算法与超参数的选择：task speciﬁc decision
- the model architecture
- the size of the vectors
- the subsampling rate
- the size of the training window
词向量可以通过简单的向量加法得到有意义的组合
representations of phrases $\rightarrow$ recursive matrix-vector operations

参考资料

[1] word2vec原理(二) 基于Hierarchical Softmax的模型, by 刘建平Pinard

你可能感兴趣的:(paper)

python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
自动写论文的网站推荐这5款实用类工具小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款实用类工具推荐，特别是千笔-AIPassPaper。1.千笔-AIPassPaper千笔-AIPassPaper是一款功能强大且全面的AI论文写作助手，用户只需输入基本的研究需求和关键词，便能迅速生成一篇完整的论文。该工具利用先进的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
4款毕业论文参考文献格式生成器（附加详细步骤）小猪包333 写论文人工智能深度学习计算机视觉 AI写作
在撰写毕业论文时，参考文献的格式规范是至关重要的。为了帮助学生和学者们更高效地生成符合要求的参考文献格式，本文将详细介绍四款推荐的参考文献格式生成器，并提供详细的使用步骤。1.千笔-AIPassPaper千笔-AIPassPaper是一款先进的AI辅助论文写作工具，不仅能够自动生成大纲、开题报告，还能一键生成参考文献。AI论文，免费大纲，10分钟3万字https://www.aipaperpass
AI论文写作推荐哪个好？分享5款AI论文写作带数据图表网站小猪包333 写论文人工智能深度学习计算机视觉
在当今学术研究和写作领域，AI论文写作工具的出现极大地提高了写作效率和质量。这些工具不仅能够帮助研究人员快速生成论文草稿，还能进行内容优化、查重和排版等操作。以下是五款推荐的AI论文写作工具，包括千笔-AIPassPaper。千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文写作助手，旨在帮助用户快速生成高质量的论文内容。AI论文，免费大纲，10分钟3万字https:
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
端到端的自动驾驶论文与代码整理大别山伧父自动驾驶
LearningbyCheatinggithubcodearxivpaperconferenceonrobotlearning最新进展(May2021)Checkoutourlatestfollow-upwork:WorldonRails(2020)Checkoutoursubmissiontothe2020CARLAChallenge!pass
EP6 同一组件通过传递不同属性展示不同效果京城五 uniapp壁纸小程序项目实践前端学习脚步 css 前端 html
文件路径：E:/homework/uniappv3tswallpaper/pages/index/index.vue公告文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容文字内容每日推荐专题精选More+.homeLayout{.banner{width:750rpx;padding:30rpx0;swiper{width:10
EP7 底部tab切换页面标签京城五 uniapp壁纸小程序项目实践前端知识杂合前端 uniapp 小程序
文件路径：E:/homework/uniappv3tswallpaper/pages/classify/classify.vue.classify{padding:30rpx;display:grid;grid-template-columns:repeat(3,1fr);gap:15rpx;}文件路径：E:/homework/uniappv3tswallpaper/pages/user/user
探索任务的隐秘世界：推荐Task2Vec 邓越浪Henry
探索任务的隐秘世界：推荐Task2Vecaws-cv-task2vecOfficialcodeforthepaper"Task2Vec:TaskEmbeddingforMeta-Learning"(https://arxiv.org/abs/1902.03545,ICCV2019)项目地址:https://gitcode.com/gh_mirrors/aw/aws-cv-task2vec在机器学习
Coding and Paper Letter（十四） G小调的Qing歌
资源整理。1Coding:1.R语言包ungeviz，ggplot2的拓展包，专门用来作不确定性的可视化。ungeviz2.计算机图形学相关开源项目。计算机图形学光线追踪开源项目C++源码。computergraphicsraytracing计算机图形学格网开源项目C++源码。computergraphicsmeshes计算机图形学介绍开源项目。computergraphics3.R语言包GLMM
05-树9 Huffman Codes（C） L_glonar c语言数据结构
日常，这一次，耗费我三天，其实第二天时便已经将对整个框架有清晰的了解了，（看了解析了），但是一步步排除，确实让我学到了很多。In1953,DavidA.Huffmanpublishedhispaper"AMethodfortheConstructionofMinimum-RedundancyCodes",andhenceprintedhisnameinthehistoryofcomputersci
线性代数|机器学习-P33卷积神经网络ImageNet和卷积规则取个名字真难呐算法机器学习矩阵人工智能线性代数
文章目录1.ImageNet2.卷积计算2.1两个多项式卷积2.2函数卷积2.3循环卷积3.周期循环矩阵和非周期循环矩阵4.循环卷积特征值4.1卷积计算的分解4.2运算量4.3二维卷积公式5.KroneckerProduct1.ImageNetImageNet的论文paper链接如下：详细请直接阅读相关论文即可通过网盘分享的文件：imagenet_cvpr09.pdf链接:https://pan.
IJCAI2024 无脑敲代码，bug漫天飞会议
CallforPapers–IJCAI2024重要日期(所有时间都是地球上的任何地方，UTC-12)摘要提交截止日期:2024年1月10日作者信息截止日期:2024年1月16日论文全文截止日期:2024年1月17日附录和重新提交信息截止日期:2024年1月24日简易拒绝通知:2024年2月22日作者回复时间:2024年3月18日至21日书面通知:2024年4月16日会议:2024年8月3日星期六至
2019-01-12 q若水
Youcan'trewriteyourpast,butyoucangrabacleansheetofpaperandwriteyourfuture.你不能重写过去，但是你可以用一张干净的纸去书写你的未来。
第66期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用高级大语言模型
Bilingual engineering 201707 No.360 Alyee AlyeeBonnie
GamesandDailylife:Makealittlemousewithher.Steps1.Useorangepapertomakeacone2.Maketworoundearsandalongtailwiththeorangepaper3.Cutasmallpieceofblackpapertomakethemouseswhiskers4.Pasteallthepartstogether5
IROS2023 马少爷学术人工智能自然语言处理
1、论文要求论文征集提交给IROS会议文件审查委员会作为同行评审的档案出版物，所有被接受的论文都将在IEEEXplore上托管。邀请潜在作者提交代表原创作品的高质量论文。欢迎就主题以及智能机器人和应用的所有领域提交意见。请通过传统的PaperPlaza流程提交论文。格式指南LaTex模板MSWord模板论文长度应为六页（美国字母大小），最多可多出两页（每多出一页收费205美元，应在验收后付款）。页
探索智能边缘计算：Game-Theoretic-Deep-Reinforcement-Learning 瞿旺晟
探索智能边缘计算：Game-Theoretic-Deep-Reinforcement-LearningGame-Theoretic-Deep-Reinforcement-LearningCodeofPaper"JointTaskOffloadingandResourceOptimizationinNOMA-basedVehicularEdgeComputing:AGame-TheoreticDRL
乡村振兴战略下传统村落文化旅游设计 Paperback – Aug. 1 2022 Chinese edition by XU SHAO HUI (Author) 光明理论旅游人工智能媒体生活科技产品运营内容运营
乡村振兴战略下传统村落文化旅游设计Paperback–Aug.12022ChineseeditionbyXUSHAOHUI(Author)Language:Chinese.paperback.PubDate:2022-08-01.publisher:ChinaBuildingIndustryPress.description:Paperback.PubDate:2022-08-01Pages:20
第65期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全语言模型
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.基于第一性原理的大
特征点提取与匹配原文论文下载长沙有肥鱼视觉SLAM十四讲计算机视觉
ORB原文下载链接：(PDF)ORB:anefficientalternativetoSIFTorSURFSIFT原文下载链接：https://www.cs.ubc.ca/~lowe/papers/ijcv04.pdfSURF原文下载链接:https://www.cs.jhu.edu/~misha/ReadingSeminar/Papers/Bay08.pdfORB和AKAZE对比论文下载链接：h
后端JOIN、LEFT JOIN、RIGHT JOIN的理解 I like Code? java 后端
SELECTf_exam_record.*,f_exam_paper.PaperName,f_exam_paper.PaperTime,exam_class.classnameFROMf_exam_recordJOINf_exam_paperONf_exam_record.PaperId=f_exam_paper.PaperIdLEFTJOINexam_classonf_exam_record.c
仿华为车机功能之--修改Launcher3,增加横向滑动桌面空白处切换壁纸的功能 Kwanvin Android Launcher3深度定制开发华为 java android
本功能基于Android13Launcher3需求：模仿华为问界车机，实现横向滑动桌面空白处，切换壁纸功能（本质只是切换背景，没有切换壁纸）。实现效果：实现思路：第一步首先得增加手势识别第二步切换底图，不切换壁纸是因为切换壁纸动作太大，需要调用到WallpaperManager,耗时且会触发应用activity重启原生系统有识别上滑与下滑的动作，那我们应该增加一个左滑和右滑的动作识别禁止上滑出所有
开源的即时聊天解决方案Papercups 辣码甄源精品开源应用分享开源 github 信息与通信
Papercups：让聊天支持变得简单、私密、实时。-精选真开源，释放新价值。概览Papercups是一款开源的实时客户支持工具，它使用Elixir语言构建，为注重客户数据隐私和安全性的公司提供了一个自托管的解决方案。这款工具的设计理念是简化客户与企业之间的沟通流程，通过一个直观的聊天小部件嵌入到企业的网站中，实现无缝的实时交流。Papercups的聊天小部件不仅易于集成，还提供了丰富的自定义选项
今日欧美圈：Sam Smith专辑改期，The Box狂揽B榜十周冠胡萝卜音乐
新一期Billboard单曲榜上，《TheBox》狂揽十周冠，DuaLipa热单《Don'tStartNow》升至亚军，LilUziVert有三首歌曲进入前十。SamSmith新专辑《ToDieFor》发行日期推迟到6月5日。新单要来啦！LaurenJauregui宣布新单《Lento》将在3月20日发行。HarryStyles登上BeautyPapers写真释出！在《冰雪奇缘2》中为Honeym
Vblog#1 English learning for science research 一粒咖啡
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档Englishlearningforscienceresearchintroduction一、GOALsin1month二、PlanseverydaySummeryintroductionIstartedtowritepaperinEnglishinordertoimproveabilityofEnglishandunderstand
AIGC：Kolors: Effective Training of Diffusion Model for Photorealistic Text-to-Image Synthesis 微风❤水墨 AIGC
代码：GitHub-Kwai-Kolors/Kolors:KolorsTeam论文：Kolors/imgs/Kolors_paper.pdfatmaster·Kwai-Kolors/Kolors·GitHub模型：huaggingface:https://huggingface.co/Kwai-Kolors/Kolors-diffusersmodelscope:https://modelscope
PaperWeekly sapienst Papers PaperwithCode General ML
1.Python软件包解决DL在未见过的数据分布下性能差的问题：（1）神经网络和损失分离的模块化设计（2）强大便捷的基准测试能力（3）易于使用但难以修改（4）github:https://github.com/marrlab/domainlabTrainer和Models之间是什么关系Trainer和Models是DomainLab中的两个核心概念。Trainer是一个用于指导数据流向模型并计算S
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他