认认真真学习

Distributed Representations of Words and Phrases and their Compositionality--翻译

词和短语的分布表示及其构成

原作者：Tomas Mikolov等
#摘要

最近引入的连续Skip-gram模型是学习高质量分布向量表示的有效方法，分布向量表示可以捕获大量精确的句法和语义关系。在本文中，我们提出了几个扩展，提高了向量的质量和训练速度。通过对频繁的单词进行二次抽样，我们获得了显着的加速，同时还学习了更多的常规单词表示。我们还提出了一个分层soft max的简单替代方案，称为负采样。
单词表示的一个固有限制是：它们不关心词序，而且无法表示习惯用语。例如，不能简单地将“Canada/加拿大”和“Air/空中”的含义组合起来得到“Canada Air/加拿大航空公司”的含义。在这个例子的启发下，我们提出了一种在文本中查找短语的简单方法，并表明学习数百万个短语的好的向量表示是可能的。

#1 介绍

通过分组相似的单词，在向量空间中的分布表示可以帮助学习算法在NLP任务中获得更好的表现。最早使用单词表示可以追溯到1986年(Rumelhart，Hinton和Williams)。这个想法已经被应用于统计语言建模且取得了相当大的成功。后续工作包括应用于自动语音识别和机器翻译，以及大范围的NLP任务。
最近，Mikolov等人引入了Skip-gram模型，这是一种从大量非结构化文本数据中学习高质量向量表示的有效方法。与过去大部分用于学习word vectors的神经网络架构不同，Skip-gram模型的训练(参见图1)不涉及密集矩阵的乘法。这使得训练非常高效：一个优化过的单机实现可以在一天内训练超过1000亿字。
使用神经网

了许多语言规律和模式。有点令人惊讶的是，许多这些模式可以表示为线性翻译。例如，向量计算vec("Madrid")-vec("Spain")+vec("France")的结果比任何其他word vector更接近于vec("Paris")。

图1：Skip-gram模型架构。训练目标是学习善于预测附近单词的单词向量表示。

在本文中，我们提出了原始Skip-gram模型的几个扩展。在训练过程中，对频繁单词进行二次采样会导致显着的加速（大约2-10倍），并提高频率较低的单词表示的准确性。此外，我们提出了一种用于训练Skip-gram模型的简化NCE(噪声对比估计)。结果表明，与更复杂的分层softmax相比，它有更快的训练速度，而且频繁单词的向量表示也更好。
单词表示天生受限于惯用短语的表示。例如，“Boston Globe/波士顿环球报”是报纸，它不是“Boston/波士顿”和“Globe/地球”的含义的自然组合。因此，用向量来表示整个短语会使Skip-gram模型更具表现力。其他旨在通过组合单词向量（例如递归自动编码器）来表示句子意义的技术也将受益于使用短语向量而不是单词向量。
模型从基于单词扩展到基于短语模型相对简单。首先，我们使用数据驱动的方法识别大量的短语，然后在训练过程中将短语视为单独的标记。为了评估短语向量的质量，我们开发了一个包含单词和短语的类比推理任务测试集。测试集中一个典型类比对是"Montreal":"Montreal Canadiens" :: "Toronto":"TorontoMaple Leafs"如果最靠近vec("Montreal Canadiens") - vec("Montreal") + vec("Toronto")的表达是 vec("TorontoMaple Leafs")，则被认为回答正确。
最后，我们描述了Skip-gram模型的另一个有趣属性。我们发现简单的向量加法通常可以产生有意义的结果。例如，vec("俄罗斯")+vec("河流")接近 vec("伏尔加河")，而vec("德国")+vec("首都")接近 vec("柏林")。这种组合性表明，通过对单词向量表示使用基本的数学运算，可以获得非明显程度的语言理解。

#2 Skip-gram模型

Skip-gram模型的训练目标是找到可用于预测句子或文档中周围的单词的单词表示。更正式地，给出训练词w1 ,w2,w3,...,wT，Skip-gram模型的目标是使平均对数概率最大化：

其中c是训练上下文（可以是中心单词ωT的一个函数）的大小。较大的c意味着更多的训练例，因此可以导致更高的准确性，同时也意味着更多的训练时间。基本Skip-gram公式使用softmax函数:

来定义。其中Vω和V’ω分别为ω的输入和输出向量表示，W为词汇表中的单词数。这个公式是不切实际的，因为计算的花费与W成正比，通常会达到10^5-10^7的数量级。

##2.1 分层Softmax
分层 softmax是完全softmax的计算效率近似。它首先由Morin和Bengio在神经网络语言模型的上下文中引入。它的主要优点是，不需要评估神经网络中的W个输出节点以获得概率分布，仅需要评估约log2(W)个节点。
分层softmax使用二叉树表示输出层，其中W个字作为其叶，并且对于每个节点，显式地表示其子节点的相对概率。这些定义了一个可将概率分配给单词的随机游走。
更准确地说，从一条合适的路径，可以从根结点到达每个单词w。设n(w,j)为从root到单词w的路径上的第j个节点，L(w)为该路径的长度，则n(w,1)=root以及n(w,L(w))=w。另外，对每个内节点（注：内节点/inner node为有子节点的节点），令ch（n）为n的任意固定子节点，如果x为真，则令[x]为1，否则为-1。然后，分层softmax定义p（Wo| Wi ）如下：

其中。可以证明的是。这意味着计算和的消耗与L(WO)成正比，通常来说不超过logW。此外，不像Skip−gram的标准softmax公式（会把两个表示Vw和V’w分配给每个单词w），在分层softmax公式中对每个单词，有一个Vw且二叉树的每个内部节点n有一个V’n。
分层softmax使用的树结构对性能有相当大的影响。Mnih和Hinton探索了构建树结构的一些方法以及训练时间和结果模型精度的影响。在我们的工作中，我们使用一个二进制霍夫曼树，因为它将短代码分配给高频词，从而加快了训练速度。之前已经观察到，根据出现频率组合单词可以很好的作为基于神经网络的语言模型的一种简单加速技术。

##2.2 负采样
分层softmax的替代方案是噪声对比估计，由Gutmann和Hyvarinen引入，并由Mnih和Teh用于语言建模。NCE认为一个好的模型应该能够通过逻辑回归来区分数据和噪声。这类似于Collobert和Weston使用的铰链损失，他们通过对噪声上的数据进行排名来训练模型。
虽然NCE可以最大化softmax的对数概率，但是Skipgram模型只关注学习高质量的向量表示，因此只要向量表示保持其质量，我们可以随意简化NCE。我们通过以下公式定义负采样（NEG）:

图2：国家及其首都的1000维跳格向量的二维主成分分析投影。该图说明了模型自动组织概念并隐式学习概念之间关系的能力，因为在培训期间，我们没有提供任何关于首都意味着什么的监督信息。

用于替代Skip-gram中的每个logP(Wo∣Wi)项。因此，我们的任务是用逻辑回归将目标词Wo从噪声分布Pn(w)的区分开，其中每个数据样本存在k个负样本。我们的实验表明，小型训练数据集里k可以取5-20。而对于大型数据集，k可以小到2-5。负采样和NCE之间的主要区别在于，NCE需要噪声分布的样本和数值概率，而负采样仅使用样本。尽管NCE最大化了softmax的对数概率，但这个属性对我们的应用来说并不重要。
NCE和NEG均有噪声分布Pn(w)作为自由参数。我们调查了Pn(w)的一些选择，发现对于NCE和NEG的每个包括语言建模的任务来说，将一元模型分布（unigram distribution）U（w）提高到3/4的幂次方（）将显著优于一元模型和均匀分布。

##2.3 高频词的二次取样
在非常大的语料库中，最常见的单词很容易就出现数亿次（例如，"in", "the"和"a"）。这样的单词通常比其他低频词提供的信息值还要少。例如，对于Skip-gram来说，观察"French"和"Paris"的同时出现是有益的，但观察"French"和"the"同时出现的频率并没有什么用，因为在一个句子里几乎每个词都会频繁地和"the"同时出现。这个想法也可以反向应用: 高频词的向量表示在经过几百万个例子的训练之后并不会显著变化。
为了抵消罕见词和高频词之间的不平衡，我们使用简单的二次抽样：训练集中的每个单词Wi将有一定概率被丢弃，概率由以下公式计算：
正在上传…重新上传取消

正在上传…重新上传取消
表1：类比推理任务的各种300维Skip-gram模型的准确性。NEG-k代表每个正向样本的有k个负向样本的负采样; NCE表示噪声对比估计，HS-Huffman代表基于频率的码的分层Softmax。

其中f(wi)是单词Wi的频率，t是选择的阈值，通常10^-5左右。我们选择这个二次抽样公式是因为它主动地对频率大于t的词进行二次抽样，同时保持了频率的排名。虽然这个二次抽样公式是启发式选择的，但我们发现它在实践中运作良好。它加快了训练速度，甚至显着提高了罕见词所学向量的准确性，如以下几节所示。

#3 实证结果
在本节中，我们评估了分层Softmax，NCE，NEG和训练词的二次取样。我们使用了Mikolov等人介绍的类比推理任务。这个任务包含Germany" : "Berlin" :: "France": ?这样的类比，根据余弦距离，想解决这个问题，需要找到一个向量x使得vec(x)最接近vec("Berlin")-vec("Germany")+vec("France")（我们丢弃搜索中的输入单词）。对于这个具体的案例来说，如果x是"Paris"，我们可以认为它是正确答案。该任务有两大类：句法类比(如"quick: "quickly" :: "slow":"slowly")和语义类比(如国家到首都的关系)。

为了训练Skip-gram模型，我们使用了一个由各种新闻文章组成的大型数据集（内部Google数据集，有十亿字）。我们从词汇表中丢弃了在训练集中出现次数少于5的单词，最终词汇表的大小为692K。表1中列出了词类比测试集中的各种跳码模型的表现。表格显示，负采样优于类比推理任务中的分层Softmax，并且性能略好于NCE。高频词的二次采样使训练速度提高了几倍并且让词表示的准确率显著提高。

可以说，skip-gram模型的线性使它的向量更适合这样的线性类比推理。而Mikolov等的结果还表明，由于训练数据量的增长，标准sigmoidal RNN(高度非线性)所学的向量在此类任务上可以显著提高，这表明非线模型也倾向于线性结构的词表示。

#4 学习短语

如前所述，许多短语的意思不仅仅是单词含义的简单组合。要学习短语的向量表示，我们首先要找到经常一同出现但在其他语境中并不常见的单词。例如，"New York Times"和"Toronto Maple Leafs"在训练集中将被独一无二的token所取代，而"this is"将保持不变。

正在上传…重新上传取消
图2：短语类比推理任务示例（完整测试集有3218个例子）。目标是使用前三个短语计算第四个。我们最好的模型在这个数据集上达到了72％的准确度。

这样，我们可以形成许多合理的短语，而不会大大增加词汇量的大小。理论上，我们可以使用所有的n-gram训练Skip-gram模型，但是这太消耗内存。许多识别文本中短语的技术之前已经被开发出来了，然而，比较它们超过了我们的工作范围。我们决定使用一种简单的数据驱动方法，基于unigram和bigram的计数来形成短语：
转存失败重新上传取消

σ被用作折扣系数，防止形成太多由非常罕见的单词组成的短语。得分高于所选阈值的bigram将被用作短语。通常，我们逐渐减少阈值对训练数据进行2-4次传递，从而允许形成更长的短语(由数个单词组成)。我们用涉及短语的新模拟推理任务来评估的质量。表2显示了本任务中使用的五类类比的例子。此数据集在网络上公开提供。

##4.1 短语Skip-Gram实验结果
从前面实验的新闻数据开始，我们首先构建了基于短语的训练语料库，然后我们使用不同的超参数训练了几个Skip-Gram模型。如前所述，我们使用300维的向量和上下文大小5。该设置已经在短语数据集上实现了良好的性能，并且允许我们快速比较负采样和分层Softmax，无论是否二次采样高频token。结果总结在表3中。

转存失败重新上传取消
表3：短语类比数据集中Skip-gram模型的准确性。这些模型已经从新闻数据集中接受了大约十亿字的训练。

转存失败重新上传取消
表4：两个不同模型下，与给定短语最接近的实体的示例。
转存失败重新上传取消
表5：使用元素加法的向量合成性。使用最佳跳过图模型，显示了两个向量之和最近的四个标记。

结果表明，k=5时负采样已经达到可靠的精度，而使用k=15可以实现更好的性能。令人惊讶的是，我们发现在没有subsampling的情况下训练分层Softmax会得到较低的性能，而我们对频繁的单词进行subsampling时它成为表现最好的方法。这表明至少在某些情况下，subsampling可以导致更快的训练，而且可以提高精度。

为了最大化短语类比任务的准确性，我们使用约330亿字的数据集来增加训练数据的数量。我们使用维度为1000的分层softmax和上下文的整个句子。最终模型的精确度能达到72%。当我们将训练数据集的大小减小到6B字时，准确度略微降低至66％，这表明大量的训练数据是至关重要的。
为了进一步深入了解不同模型表示的token的不同，我们手动检查了各种模型的低频短语的最相似短语。表4显示了一个这样比较的样例。与之前的结果一致，似乎使用了分层softmax和subsampling的模型可学到短语的最佳表示。

#5 加法合成性
由Skip-gram模型学习的单词和短语表示显示了一个线性结构，从而通过简单地向量计算可以进行精确的模拟推理。有趣的是，我们发现Skip-gram 表示展现了另一种线性结构，使得有可能通过向量表示的元素级加法来有意义地组合单词。这种现象如表5所示。
向量的加法属性可以通过检查训练目标来解释。词向量与非线性softmax的输入呈线性关系。由于词向量被训练来预测句子中的周围单词，所以可以将向量视为一个单词出现在上下文的分布的表示。这些值与输出层计算的概率成对数地相关，所以两个词向量的和与两个上下文分布的乘积有关。该乘积在这里的作用为AND：被分配了两个有高概率词向量的单词将具有很高的概率，其他字将具有较低的概率。因此，如果“Volga River”与“Russian”和“river”一起出现在同一句话中，这后两个的word vector总和将生成一个接近“Volga River”的向量的特征向量。

#6 与已发布的单词表示法的比较
许多以前致力于基于神经网络的单词表示的作者已经发表了他们的结果模型以供进一步使用和比较：其中最著名的作者是Collobert和Weston[2]，Turian等人。[17] ，以及Mnih和Hinton[10]。我们从web3下载了他们的词向量。Mikolov等人。[8] 已经在单词类比任务中评估了这些单词表示法，其中Skip-gram模型以很大的幅度获得了最佳性能。

转存失败重新上传取消

表6：给定各种已知模型的最接近的标记示例，以及使用超过300亿个训练单词的短语训练的跳过语法模型。空单元格表示单词不在词汇表中。

为了更深入地了解学习向量质量的差异，我们通过在表6中显示不常用词的最近邻来提供经验比较。这些例子表明，在大型语料库上训练的大跳跃gram模型在学习表示的质量上明显优于所有其他模型。这在一定程度上可以归因于这样一个事实，即这个模型已经接受了大约300亿字的训练，这比先前工作中使用的典型大小的数据要多出大约两到三个数量级。有趣的是，尽管训练集要大得多，但是Skip-gram模型的训练时间只是先前模型架构所需时间复杂性的一小部分。

#7 结论

这项工作有几个关键的贡献。我们展示如何使用Skip-gram模型来训练单词和短语的分布式表示，并证明这些表示呈现线性结构，使准确的类比推理成为可能。本文介绍的技术也可用于训练[8]中引入的连续的bag-of-words模型。
得益于计算效率高的模型架构，我们成功地在比之前模型的数据量高了数个数量级的数据集上进行了训练。这导致了所学的单词和短语表示的质量有了显著的改善，特别是对于稀有的实体。我们还发现，高频词的二次抽样导致了更快的训练速度，并且使罕见单词的表示得到了显著的提升。我们文章的另一个贡献是负采样算法，这是一个非常简单的训练方法，可以学习准确的表示，尤其是对于高频单词。
训练算法和超参数的选择得由具体任务决定，因为我们发现不同的问题具有不同的最优超参数配置。在我们的实验中，影响性能的最关键的决策是模型架构的选择，向量的大小，二次采样率以及训练窗口的大小。
我们工作的一个非常有趣的结果是，使用简单的向量加法可以有意义地组合单词向量。本文中提到的另一个表示短语的方法是，简单地用一个single token来表示短语。这两种方法组合出了一种强大而简单的方法，用来表示更长的文本段同时具有最小的计算复杂度。因此，我们的工作可以被看作是使用递归矩阵-向量操作来尝试表示短语的现有方法的补充[16]。
我们将实现本文技术的代码发布为了一个开源项目（即word2vec）

拿下美赛M奖之必备软件和网站！东方建模. 数学建模
目录前言：一.题目翻译与理解：DeepL+知云文献翻译二.查找文献：国内外平台结合使用三.论文撰写：Word或LaTeX+Overleaf四.公式输入与思维导图：MathType+XMind五.阅读文献与文献管理：AdobeReader+Zotero六.模型求解与编程：MATLAB+Python+Lingo七.图形绘制与结果可视化：MATLAB+Python+Origin八.流程图与示意图：亿图图
[文献翻译]Towards Good Practices for Very Deep Two-Stream ConvNets 夏迪End
摘要：深度卷积网络已经在静态图像目标识别中取得了了的巨大成功。但是，对于视频的动作识别，深度卷积网络的改进不是那么明显。我们认为这样子的结果可能有两个原因。首先，与图像中非常深的模型（例如VGGNet[13]，GoogLeNet[15]）相比，当前的网络体系结构（例如，双流ConvNets[12]）相对较浅，因此它们的建模能力受到其深度的限制。其次，更重要的可能是，动作识别的训练数据集与Image
文献翻译（BRAU-Net++: U-Shaped Hybrid CNN-Transformer Network for Medical Image Segmentation）来自宇宙的曹先生文献翻译 cnn transformer 人工智能
BRAU-Net++:U-ShapedHybridCNN-TransformerNetworkforMedicalImageSegmentationBRAU-Net：用于医学图像分割的U形混合CNN变换网络LibinLan,Member,IEEE,PengzhouCai,LuJiang,XiaojuanLiu,YongmeiLi,andYudongZhang,SeniorMember,IEEE摘要
python文献翻译_英文学术文献翻译软件有哪些推荐？ weixin_39689297 python文献翻译
想要日读10篇英文Paper，别说，还真的可以！有了下面这8个免费的文献翻译工具，相信你阅读文献的速度会直线上升！适用场景：长篇文献直接将文档上传到网站，就可完成翻译。彩云小译翻译的结果有一个很大的特点：翻译结果直接嵌在英文下方！阅读非常方便！它还有对应的浏览器插件，安装后可翻译网页，也是内嵌的显示方式。另外，彩云小译还有APP，安卓苹果都可使用。适用场景：长篇文献这是搜狗出品的翻译工具。翻译结果
一些学术文献翻译软件推荐~ 不吃榴莲千层自然语言处理机器翻译 nlp
知云文献翻译做科研逃脱不了阅读文献，文献大多是PDF格式，需要一个使用起来极其方便的翻译软件。它可以直接打开PDF文件，左侧用文本工具选择一段话，右侧就给出翻译。而且还有多个翻译引擎可供选择。而且其中某些翻译引擎翻译文献类质量十分了得。比如谷歌生物医学专用引擎。您可以用它阅读文字型PDF，除了文献，也可以是PDF书籍。软件是免费的！官网：知云文献翻译官网-官方指定最新知云文献翻译(zhiyunwe
如何写出一篇合格且优秀的硕士毕业论文 Komorebi_9999 硕士毕业论文
一、软件、插件推荐谷歌浏览器、Edge浏览器（有自动翻译成中文的小插件）Scholarscope、EasyPubmed(浏览器插件，显示影响因子，被引用的次数，链接)知云文献翻译（文献阅读软件）EndnoteX9(插入参考文献，比较人性化，自己自动调整顺序)ZhiMap(公众号、思维导图)二、论文前期准备1.梳理论文结构，用ZhiMap这类工具做一个思维导图。2.实验的结果分析可以先整理一个PPT
文献翻译--ASpedia:人类选择性剪切的综合百科全书 ECHO1216
摘要：选择性剪接通过增加表达的mRNAs的多样性赋予人类基因组复杂性。通过高通量数据集的差异选择性剪接分析，已经鉴定出数百或数千个剪接区域。然而，很难解释每个拼接事件的功能影响。蛋白质结构域的形成和无义介导的衰退被认为是剪接的主要功能特征。然而，其他功能特征，如miRNA靶位点、磷酸化位点和单核苷酸变异直接受到选择性剪接的影响，并影响下游功能。因此，我们建立了一个ASpedia数据库:一个全面的人
2020-3-2晨间日记精进精致
今天是室友离开的日子起床：七点二十就寝：十一点天气：阴雨心情：不咋开心，没有室友，我就孤零零的一个人任务清单昨日完成的任务，最重要的三件事：1.带学生复习，个人感觉生物复习得很好，讲的也还OK2.锻炼身体，跑步，昨天下午跟室友还有两个孩子一起跑步，是我昨天最开心的事情了3.昨天英语文献翻译，查了大部分单词，很棒习惯养成：多学习，多锻炼学习·信息·阅读每天听新闻健康·饮食·锻炼还不错，因为没有零食吃
毕设随笔Day1——设计上的慌乱和毫无头绪... Climber47 毕设期间的碎碎念课程设计
前言——来自凌晨两点的吐槽最近开始着手做毕设了，毕设内容是一个微博客系统。近期需要每周一汇报，哎，得开工了。后端好说，自己两端实习都是做的这个，几个增删改查的接口写起来还是没啥麻烦。但是前端就头秃了，基本从零开始学，而且我这审美是完全不在线的…毕设计划中定的timeline‘，大概是一个月完成…现在第一周，正在搞头秃的开题报告和文献翻译。我真不理解，为什么要翻译一篇外文，即使大概率我也用不上他。开
医学英文文献翻译，如何选择专业公司英信翻译公司人工智能
随着国际化进程的加速，医学领域对于英文文献的需求也越来越大。然而，对于许多非英语母语的人来说，阅读和理解英文医学文献存在一定的困难。此时，医学英文文献翻译公司就显得尤为重要。那么，哪个翻译公司比较好呢？如何选择专业的医学翻译公司？业内人士指出，选择医学英文文献翻译公司时，首先要考虑的是公司的专业性。一个好的医学翻译公司应该具备专业的医学背景和翻译经验，能够准确、流畅地将英文医学文献翻译成中文。同时
英文文献翻译成中文，推荐哪个软件？ literature1492 翻译英文文献翻译
论文是我们每一个大学生都无法避开的话题，论文一般是由名称、作者、摘要、关键词、正文、参考文献和附录等部分组成。曾经的我也单纯的认为自己的论文是可以做到百分百手写的，但后来证明我想多了。其实参考文献在我们写论文的过程各种是最常见的，它不仅是我们论文中的理论依据和来源同时也是，文献的选择、参考和引用，都是需要斟酌的，引用得当的参考文献可以为我们的论文增添不少的亮点，也可以在答辩的时候帮我们更好的和导师
Linux/Ubuntu下英文文献翻译软件/工具推荐 LLL25655 linux ubuntu 自动翻译机器翻译
自己在Windows系统上使用到的英文文献翻译软件是知云文献翻译，本着试一试的态度，却一见如故。知云文献翻译官网-官方指定最新知云文献翻译及Xtranslator-win+mac版下载页面但是，自从因为研究学习的原因把主要的工作平台转到Linux/Ubuntu上后，自己却始终没有找到一款较能称心如意的翻译软件/工具。根据网上搜索和网友的推荐，自己曾做出过的尝试和遇到的问题如下：1.使用wine安装
Grounding DINO、TAG2TEXT、RAM、RAM++论文解读 tangjunjun-owen 语言模型-多模态大模型 grounding dino tag2text RAM RAM++大模型
提示：GroundingDINO、TAG2TEXT、RAM、RAM++论文解读文章目录前言一、GroundingDINO:MarryingDINOwithGroundedPre-TrainingforOpen-SetObjectDetection1、摘要2、背景3、部分文献翻译4、贡献5、模型结构解读a.模型整体结构b.特征增强结构c.解码结构6、实验有趣说明二、TAG2TEXT:GUIDINGV
有哪些论文降重的方法? 蜘蛛查重网
论文降重方法：1.外文文献翻译法每个人语言习惯不同，采用的措辞、语序都会略有不同。因此，即使是同一段文字，不同人翻译了之后，译文必然会不尽相同。可以适当翻译与你选题相关的外文文献，并进行润色，避免口语化的叙述，使之有条理、有逻辑，再嵌套入论文中。变化措辞法按照知网程序和算法，只要不出现连续多字重复，以及关键词的重复，就不会被标红。如果你的论文与其他论文有措辞方面的重合，完全不用推翻原有思路，可采用
文献翻译--哺乳动物器官发育中的选择性剪切模式 ECHO1216
摘要：选择性剪接(AS)在哺乳动物基因组中普遍存在，但跨物种比较主要局限于成体组织，大多数AS事件的功能仍不清楚。研究人员评估了六种哺乳动物和一只鸟类的七个器官产前和产后发育中的AS模式。分析表明，发育动态AS事件,特别是在大脑中普遍存在，实质上比非动态更加保守。在发育过程中，包含频率增加的盒式外显子显示出最强的保守和调控AS信号。新近出现的盒式外显子通常在睾丸发育的后期被整合，但在进化过程中保留
知云文献翻译——外语论文你get了吗？郝YH是人间理想优质安利论文阅读
今天博主分享一款实用的翻译软件，希望对大家日后的学习有所帮助。这个翻译网站，主要做文档翻译，可以上传PDF、Word、Excel这些格式，翻译语言也比较齐全。操作简单，功能多样的翻译软件;知云文献翻译最新版可以直接对PDF文件进行翻译，不需要将文件改成TXT格式;知云文献翻译最新版不仅关联了多款搜索引擎翻译，还关联了多款职业专用的翻译频道。软件拥有非常强大的翻译功能，可以帮助用户轻松对外文文献资料
【软件推荐】我的常用Windows软件 Hello Dam 软件推荐 Win软件推荐
文章目录前言ColorsLite（颜色吸取）Everything（文件搜索）知云文献翻译DirectoryOpus（文件管理器）Snipaste（截图）AxMath（公式编辑器）Deskpin（窗口固定）Hayo（AI）剪映（视频剪辑）OBS（录屏）PotPlayer（视频播放器）Todesk（远程控制）Typora（Markdown文件编辑器）飞书（构建知识库）Xmind（思维导图）QuickL
文献翻译与阅读《ChatRule: Mining Logical Rules with Large Language Models for Knowledge Graph Reasoning》啾啾啾666 文献阅读机器学习语言模型知识图谱人工智能
目录知识图谱与大模型如何结合？一、预备知识1prompt提示词2AI指令的实用意义3AI指令编写的方法，编写AI提示词（Prompt）的一般步骤4AI提示词（Prompt）的学习重点与意义：4Prompt的应用场景5Prompt也存在一些挑战和限制6大语言模型的预训练：思维链(Chain-of-thought，CoT)原理详解6.1背景6.2定义6.3思维链用于上下文学习的方法(In-contex
【2018 Nature】Review Disease Primers - Epilepsy 【文献翻译】 Lucy@IshtarXu 新项目医学信号处理
第一遍，使用的机翻…生物方面的内容因为不懂所以没有审核过，之后再优化摘要癫痫影响所有年龄组，是最常见和最致残的神经系统疾病之一。癫痫的准确诊断至关重要，因为一些患者会被误诊为癫痫，而另一些患者则会得到错误的诊断。事实上，诊断错误很常见，许多患者无法得到正确的治疗，这往往会带来严重后果。虽然许多患者使用单一药物控制癫痫发作，但其他患者需要多种药物、切除手术、神经调节装置或饮食疗法。此外，三分之一的患
【文献翻译】Contrastive Boundary Learning：对比边界学习在点云分割中的应用 Garcia • Kirlant 3D点云实例分割计算机视觉
摘要点云分割是理解三维环境的基础。然而，目前的三维点云分割方法对场景边界的分割效果较差，导致整体分割性能下降。本文主要研究场景边界的分割。因此，我们首先探索指标来评估分割性能的场景边界。针对边界分割性能不理想的问题，我们提出了一种新的对比边界学习(CBL)框架用于点云分割。具体地说，本文提出的CBL通过在多尺度场景背景的帮助下对比点的表征，增强了跨边界点之间的特征识别。通过在三种不同的基线方法上应
matlab图形设计界面文献翻译,毕业设计基于matlab的数字图像识别的设计与实现文献翻译V8.1（资料4）... 曹野狐 matlab图形设计界面文献翻译
《【毕业设计】基于matlab的数字图像识别的设计与实现文献翻译.doc》由会员分享，可免费在线阅读全文，更多与《毕业设计基于matlab的数字图像识别的设计与实现文献翻译(V8.1)》相关文档资源请在帮帮文库(www.woc88.com)数亿文档库存里搜索。1、网络在水文预报中的应用逐渐增多[]。lt取得了可喜的新进展。ltgtamamamamamamamam上个世纪年代中后期，在国外一些发达国
【文献翻译】MDC-Checker：一种新的多域配置网络风险评估框架 Mrong1013967 安全配置网络安全
摘要在满足实际需求的同时，生成正确的网络配置以最小化攻击面是一项具有挑战性的任务，特别是当考虑到分散在物理、网络和信息领域的配置之间的相互依赖关系时。由于不同域中的配置通常是单独生成的，而它们之间的复杂相互关系是独立的，因此会引入额外的漏洞。本文提出了一种新的风险评估框架MDC-Checker，以帮助网络管理员评估所涉及的风险。首先，该框架从多个域配置和网络文档中提取语义。然后，依次建立多域语义图
(自适应PSO)外文文献翻译 qq_37287755
自适应PSO抽象：在当今世界，各种分析需要大量的在线数据。很难有效地存储，管理和检索如此大量的数据，尤其是在运行时连续获取数据时。这产生了以更动态的方式在类似组中组织这样的数据的需要。本质上不具有自适应性，传统算法（如K-means）无法在运行时容纳新到达的数据，无需重新初始化。在这种方法中，我们使用自适应粒子群优化（APSO）算法对流媒体推文进行聚类。该算法是自适应的，因为它可以有效且高效地容纳
论文外文文献查找、翻译 Litter Start~ 纯经验分享经验分享
学习目标：如何查找下载英文文献，并翻译学习内容：查找英文文献下载英文文献翻译、阅读英文文献学习步骤：最近在写毕业论文，遇到了英文文献的翻译，还有我们学校需要写英译汉、汉译英，我在网上找了好多办法，在这里给大家分享一个我觉得很好用的吧~第一步，去知网搜索我们想要查找的相关文献内容：复制英文题目，到学术镜像网站谷歌学术镜像_Google镜像站在谷歌学术里面粘贴我们刚刚的题目，点击学术搜索（随便哪一个都
文献翻译--转录因子对可变剪接调控网络的多层控制 ECHO1216
https://www.sciencedirect.com/science/article/pii/S1097276517300370摘要：协调的可变剪接事件网络在发育和疾病中起着至关重要的作用。然而，对调节这些网络的因素缺乏全面的了解。我们描述了一个高通量系统，用于系统地将反式作用因子与内源性RNA调节事件联系起来。利用这个系统，我们确定了数百个与不同调控层相关的因子，这些调控层积极或消极地控制
基于Qt C++的工具箱项目源码，含命令行工具、桌面宠物、文献翻译、文件处理工具、医学图像浏览器、插件市场、设置扩展等工具云哲-吉吉2021 c++宠物服务器
一、介绍1.基本信息完整代码下载地址：基于QtC++的工具箱项目源码TBox是一款基于QtC++的工具箱。用户可以自行选择安装所需的工具（以插件的形式），将TBox打造成专属于自己的效率软件。TBox基本界面展示如下：2.使用说明（1）安装插件：用户有两种安装方式可选，一种是将插件安装包拖入到TBox首页，TBox将会自行识别插件包信息，并引导用户安装；另一种是通过[插件市场]插件搜索可安装的插件
[文献翻译]Video-based AI for beat-to-beat assessment of cardiac function JACOBWHY 医学图像分割人工智能机器学习深度学习算法
【文献翻译】Video-basedAIforbeat-to-beatassessmentofcardiacfunction摘要引言基于视频的深度学习模型模型性能评估推广到不同的医院讨论方法数据管理datacurationEchoNet-Dynamic开发与训练逐拍(beattobeat)评估增加测试时间评估模型性能和前瞻性临床验证外部医疗保健系统测试数据集专家临床医生的重新评估统计分析摘要准确的心
【学术】知云文献及划词翻译软件(XTranslator)的安装及使用岳涛@心馨电脑学术软件自动翻译
文章目录一、知云文献翻译1.1知云文献翻译是什么1.2知云文献翻译下载地址1.3知云文献翻译安装1.4知云文献翻译使用1.4.1使用方法1.4.2解除限制1.4.3软件特点1.4.4翻译PDF1.5Windows版使用文档1.6解锁所有翻译引擎二、知云划词翻译(Xtranslator)2.1知云划词翻译(Xtranslator)是什么2.2知云划词翻译(Xtranslator)下载地址2.3XTr
【文献翻译】ICE-BA: Incremental, Consistent and Efficient Bundle Adjustment for Visual-Inertial SLAM YuYunTan 计算机视觉论文翻译 CVPR2018 ICEBA VI-SLAM 论文翻译计算机视觉
文章目录前言文献信息【文献翻译】CVPR2018论文：ICE-BA：视觉惯性SLAM的增量，一致和高效的束调整摘要1、引言2、相关工作3、框架3.1约束函数3.2局部和全局优化4、VI-SLAM的高效求解器4.1一般增量BA解决器4.2局部BA的改进4.3IBA的增量PCG5、相对边缘化6、评估6.1算法验证6.2局部准确性6.3解决器精度6.4与GoogleTango进行定性比较7、结论前言
论文查找: arXiv，论文阅读：知云文献翻译, 完美组合！码农的后花园 java 人工智能 iot 编程语言 informix
点击上方“码农的后花园”，选择“星标” 公众号精选文章，第一时间送达我相信大家在查阅学习某些相关技术、或者在写毕业论文、等各种论文的时候大部分都是在知网上查找的，但是知网上大部分检索到的论文都是中文版，且有大部分是本科生写的；在我们想要阅读一些外文资料时，查找起来比较费力，且在阅读困难、编辑上也不够方便。今天就向大家推荐一下论文发表和检索平台arXiv,和可以同时用5大翻译引擎、编辑标注的PDF
继之前的线程循环加到窗口中运行 3213213333332132 java thread JFrame JPanel
之前写了有关java线程的循环执行和结束，因为想制作成exe文件，想把执行的效果加到窗口上，所以就结合了JFrame和JPanel写了这个程序，这里直接贴出代码，在窗口上运行的效果下面有附图。 package thread; import java.awt.Graphics; import java.text.SimpleDateFormat; import java.util
linux 常用命令 BlueSkator linux 命令
1.grep 相信这个命令可以说是大家最常用的命令之一了。尤其是查询生产环境的日志，这个命令绝对是必不可少的。但之前总是习惯于使用（grep -n 关键字文件名）查出关键字以及该关键字所在的行数，然后再用（sed -n '100,200p' 文件名），去查出该关键字之后的日志内容。但其实还有更简便的办法，就是用（grep -B n、-A n、-C n 关键
php heredoc原文档和nowdoc语法 dcj3sjt126com PHP heredoc nowdoc
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body> <?
overflow的属性周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
《我所了解的Java》——总体目录 g21121 java
准备用一年左右时间写一个系列的文章《我所了解的Java》，目录及内容会不断完善及调整。在编写相关内容时难免出现笔误、代码无法执行、名词理解错误等，请大家及时指出，我会第一时间更正。 &n
[简单]docx4j常用方法小结 53873039oycg docx
本代码基于docx4j-3.2.0，在office word 2007上测试通过。代码如下: import java.io.File; import java.io.FileInputStream; import ja
Spring配置学习云端月影 spring配置
首先来看一个标准的Spring配置文件 applicationContext.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&q
Java新手入门的30个基本概念三 aijuans java 新手 java 入门
17.Java中的每一个类都是从Object类扩展而来的。　　18.object类中的equal和toString方法。　　equal用于测试一个对象是否同另一个对象相等。　　toString返回一个代表该对象的字符串,几乎每一个类都会重载该方法,以便返回当前状态的正确表示.(toString 方法是一个很重要的方法)　　 19.通用编程:任何类类型的所有值都可以同object类性的变量来代替。　
《2008 IBM Rational 软件开发高峰论坛会议》小记 antonyup_2006 软件测试敏捷开发项目管理 IBM 活动
我一直想写些总结,用于交流和备忘,然都没提笔,今以一篇参加活动的感受小记开个头,呵呵! 其实参加《2008 IBM Rational 软件开发高峰论坛会议》是9月4号,那天刚好调休.但接着项目颇为忙,所以今天在中秋佳节的假期里整理了下. 参加这次活动是一个朋友给的一个邀请书,才知道有这样的一个活动,虽然现在项目暂时没用到IBM的解决方案,但觉的参与这样一个活动可以拓宽下视野和相关知识.
PL/SQL的过程编程,异常,声明变量,PL/SQL块百合不是茶 PL/SQL的过程编程异常 PL/SQL块声明变量
PL/SQL; 过程; 符号; 变量; PL/SQL块; 输出; 异常; PL/SQL 是过程语言(Procedural Language)与结构化查询语言(SQL)结合而成的编程语言PL/SQL 是对 SQL 的扩展,sql的执行时每次都要写操作
Mockito(三)--完整功能介绍 bijian1013 持续集成 mockito 单元测试
mockito官网：http://code.google.com/p/mockito/，打开documentation可以看到官方最新的文档资料。一.使用mockito验证行为 //首先要import Mockito import static org.mockito.Mockito.*; //mo
精通Oracle10编程SQL(8)使用复合数据类型 bijian1013 oracle 数据库 plsql
/* *使用复合数据类型 */ --PL/SQL记录 --定义PL/SQL记录 --自定义PL/SQL记录 DECLARE TYPE emp_record_type IS RECORD( name emp.ename%TYPE, salary emp.sal%TYPE, dno emp.deptno%TYPE ); emp_
【Linux常用命令一】grep命令 bit1129 Linux常用命令
grep命令格式 grep [option] pattern [file-list] grep命令用于在指定的文件(一个或者多个,file-list)中查找包含模式串(pattern)的行,[option]用于控制grep命令的查找方式。 pattern可以是普通字符串，也可以是正则表达式，当查找的字符串包含正则表达式字符或者特
mybatis3入门学习笔记白糖_ sql ibatis qq jdbc 配置管理
MyBatis 的前身就是iBatis，是一个数据持久层(ORM)框架。 MyBatis 是支持普通 SQL 查询，存储过程和高级映射的优秀持久层框架。MyBatis对JDBC进行了一次很浅的封装。以前也学过iBatis，因为MyBatis是iBatis的升级版本，最初以为改动应该不大，实际结果是MyBatis对配置文件进行了一些大的改动，使整个框架更加方便人性化。
Linux 命令神器：lsof 入门 ronin47 lsof
lsof是系统管理/安全的尤伯工具。我大多数时候用它来从系统获得与网络连接相关的信息，但那只是这个强大而又鲜为人知的应用的第一步。将这个工具称之为lsof真实名副其实，因为它是指“列出打开文件（lists openfiles）”。而有一点要切记，在Unix中一切（包括网络套接口）都是文件。有趣的是，lsof也是有着最多
java实现两个大数相加，可能存在溢出。 bylijinnan java实现
import java.math.BigInteger; import java.util.regex.Matcher; import java.util.regex.Pattern; public class BigIntegerAddition { /** * 题目：java实现两个大数相加，可能存在溢出。 * 如123456789 + 987654321
Kettle学习资料分享，附大神用Kettle的一套流程完成对整个数据库迁移方法 Kai_Ge Kettle
Kettle学习资料分享 Kettle 3.2 使用说明书目录概述..........................................................................................................................................7 1.Kettle 资源库管
[货币与金融]钢之炼金术士 comsci 金融
自古以来,都有一些人在从事炼金术的工作.........但是很少有成功的那么随着人类在理论物理和工程物理上面取得的一些突破性进展...... 炼金术这个古老
Toast原来也可以多样化 dai_lm android toast
Style 1：默认 Toast def = Toast.makeText(this, "default", Toast.LENGTH_SHORT); def.show(); Style 2：顶部显示 Toast top = Toast.makeText(this, "top", Toast.LENGTH_SHORT); t
java数据计算的几种解决方法3 datamachine java hadoop ibatis r-langue r
4、iBatis 简单敏捷因此强大的数据计算层。和Hibernate不同，它鼓励写SQL，所以学习成本最低。同时它用最小的代价实现了计算脚本和JAVA代码的解耦，只用20%的代价就实现了hibernate 80%的功能,没实现的20%是计算脚本和数据库的解耦。复杂计算环境是它的弱项，比如：分布式计算、复杂计算、非数据
向网页中插入透明Flash的方法和技巧 dcj3sjt126com html Web Flash
将 Flash 作品插入网页的时候，我们有时候会需要将它设为透明，有时候我们需要在Flash的背面插入一些漂亮的图片，搭配出漂亮的效果……下面我们介绍一些将Flash插入网页中的一些透明的设置技巧。　　一、Swf透明、无坐标控制　　首先教大家最简单的插入Flash的代码，透明，无坐标控制：　　注意wmode="transparent"是控制Flash是否透明
ios UICollectionView的使用 dcj3sjt126com
UICollectionView的使用有两种方法，一种是继承UICollectionViewController，这个Controller会自带一个UICollectionView；另外一种是作为一个视图放在普通的UIViewController里面。个人更喜欢第二种。下面采用第二种方式简单介绍一下UICollectionView的使用。 1.UIViewController实现委托，代码如
Eos平台java公共逻辑蕃薯耀 Eos平台java公共逻辑 Eos平台 java公共逻辑
Eos平台java公共逻辑 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:20:4
SpringMVC4零配置--Web上下文配置【MvcConfig】 hanqunfeng springmvc4
与SpringSecurity的配置类似，spring同样为我们提供了一个实现类WebMvcConfigurationSupport和一个注解@EnableWebMvc以帮助我们减少bean的声明。 applicationContext-MvcConfig.xml  <
解决ie和其他浏览器poi下载excel文件名乱码 jackyrong Excel
使用poi,做传统的excel导出，然后想在浏览器中，让用户选择另存为，保存用户下载的xls文件，这个时候，可能的是在ie下出现乱码（ie,9,10,11),但在firefox,chrome下没乱码，因此必须综合判断，编写一个工具类： /** * * @Title: pro
挥洒泪水的青春 lampcy 编程生活程序员
2015年2月28日，我辞职了，离开了相处一年的触控，转过身--挥洒掉泪水，毅然来到了兄弟连，背负着许多的不解、质疑——”你一个零基础、脑子又不聪明的人，还敢跨行业，选择Unity3D？“，”真是不自量力••••••“，”真是初生牛犊不怕虎•••••“，••••••我只是淡淡一笑，拎着行李----坐上了通向挥洒泪水的青春之地——兄弟连！这就是我青春的分割线，不后悔，只会去用泪水浇灌——已经来到
稳增长之中国股市两点意见-----严控做空，建立涨跌停版停牌重组机制 nannan408
对于股市，我们国家的监管还是有点拼的，但始终拼不过飞流直下的恐慌，为什么呢？笔者首先支持股市的监管。对于股市越管越荡的现象，笔者认为首先是做空力量超过了股市自身的升力，并且对于跌停停牌重组的快速反应还没建立好，上市公司对于股价下跌没有很好的利好支撑。我们来看美国和香港是怎么应对股灾的。美国是靠禁止重要股票做空，在
动态设置iframe高度(iframe高度自适应) Rainbow702 JavaScript iframe contentDocument 高度自适应局部刷新
如果需要对画面中的部分区域作局部刷新，大家可能都会想到使用ajax。但有些情况下，须使用在页面中嵌入一个iframe来作局部刷新。对于使用iframe的情况，发现有一个问题，就是iframe中的页面的高度可能会很高，但是外面页面并不会被iframe内部页面给撑开，如下面的结构： <div id="content"> <div id=&quo
用Rapael做图表 tntxia rap
function drawReport(paper,attr,data){ var width = attr.width; var height = attr.height; var max = 0; &nbs
HTML5 bootstrap2网页兼容（支持IE10以下） xiaoluode html5 bootstrap
<!DOCTYPE html> <html> <head lang="zh-CN"> <meta charset="UTF-8"> <meta http-equiv="X-UA-Compatible" content="IE=edge">

Distributed Representations of Words and Phrases and their Compositionality--翻译

词和短语的分布表示及其构成

#1 介绍

你可能感兴趣的:(文献翻译)