TOP生物信息

第3周：利用大豆小RNA图谱鉴定来自编码基因区的phasiRNA

原文来源：Arikit S , Xia R , Kakrana A , et al. An Atlas of Soybean Small RNAs Identifies Phased siRNAs from Hundreds of Coding Genes[J]. The Plant Cell Online, 2014, 26(12):4584-4601.

理解为产生phasiRNA的PHAS位点与编码蛋白的基因区有重叠可能更准确。
侵删

小RNA是一类普遍存在的，多功能的抑制物，包括（1）microRNA（miRNA），由mRNA形成的茎环结构加工而成; （2）小干扰RNA（siRNA），在植物中通常由需要依赖RNA的 RNA聚合酶的过程衍生。我们构建并分析了大豆小RNA的表达图谱，鉴定了超过500个产生21个核苷酸的phased siRNAs（phasiRNA;来自PHAS位点）的位点，其中483个与注释的蛋白质编码基因有重叠。通过整合miRNA与RNA end（PARE）数据的分析，检测到127个PHAS位点上的20个miRNA靶标。 PHAS位点的主要类别（208，占41％）与NB-LRR基因相对应；这些小RNA中的一部分优先在根瘤中积累。在PHAS位点中，还观察到TAS3的新代表和非经典相位模式。由miR4392触发的非编码PHAS位点优先在花药中积累；预测phasiRNA靶向转座因子，在大豆生殖发育中具有峰值丰度。因此，phasiRNA在双子叶植物中显示出巨大的多样性。我们鉴定了新的miRNA并评估了miRBase中记录的大豆miRNA的准确性，显着改善了大豆miRNA注释，促进了miRBase注释的改进并鉴定了高严谨性的新miRNA及其靶标。

文章做了些什么：

鉴定产生phasiRNA的位点，并注释（提供位置信息）
能识别PHAS区域的miRNA触发物
phasiRNA的靶基因
鉴定miRNA，与已知数据库比较看数据库里的准不准，看能不能改正或是添加
miRNA的靶基因
结合具体的生物学问题看看小RNA在什么条件下在哪些组织中高表达

介绍

小非编码RNA在发育，细胞分化，适应生物和非生物胁迫以及基因组稳定性方面具有重要作用。小RNA的主要活性是通过靶标降解，翻译抑制或通过指导染色质修饰来对特定mRNA或基因表达模式进行负调控。迄今已鉴定出几种不同类型的小RNA。在植物中，研究最多的小RNA是microRNA（miRNA）和小干扰RNA（siRNA）;这些是由不同的前体和不同的途径产生的。通常长度为21至22个核苷酸的miRNA衍生自通过RNA聚合酶II从MIRNA基因转录的长非编码RNA前体。miRNA前体形成由DICER-LIKE1（DCL1）或其他DCL酶（极少数）加工的茎环结构，产生3’具有两个核苷酸突出的单个小RNA双链体（miRNA / miRNA *）。小RNA双链体的一条链是成熟miRNA，被称为引导链，它会结合到Argonaute（AGO）蛋白上以形成效应复合物（所谓的用于RNA诱导的沉默复合物——RISC），其指导miRNA靶标降解或翻译抑制。双链体的另一条链，即miRNA *或passenger strand，迅速降解，通常不会积累。 siRNA通常来自完全互补的长双链RNA（dsRNA）前体，这些前体一般由RNA依赖性的RNA聚合酶（RDR）形成，也可能由退火了的正义/反义转录物形成。已经在植物中定义了几类siRNA，主要类别是异染色质siRNA，它在胞嘧啶甲基化和抑制性组蛋白修饰的建立和维持中起关键作用。 siRNA还能够作为移动信号起作用，通过siRNA的运动使沉默效应从细胞扩散到其它细胞或更长距离。

科学家已经鉴定了一类相当有趣的siRNA，它们是长双链RNA前体以21个核苷酸为增量来逐步裂解的产物，产生定相的或完全间隔排列的小RNA。这些siRNA，即所谓的相位排列siRNA（phasiRNA），由特定的引导miRNA切割而产生，遵循单击或双击模式，分别对应一个22nt或两个21nt的miRNA的靶位点。切割的未加帽的mRNA产物用作RDR6的底物，产生dsRNA前体，然后被DCL4切割以产生21-核苷酸的定相siRNA。一些定相siRNA已经显示在靶基因的反式调节中起作用;因此，这类siRNA最初被称为tasiRNA，但是更多的基因位点产生具有未知反式作用的相同相位模式（PHAS基因座）的siRNA，因此一般用“phasiRNA”进行描述。tasiRNA通过对互补靶位点进行切割来调节mRNA，这如同许多植物miRNA一样。最着名的tasiRNA是由TRANS-ACTING SIRNA GENE3（TAS3）产生的反式小干扰RNA-生长素响应因子（tasiARF）的集合。tasiARF在抑制生长素响应因子基因（ARF2，ARF3 / ETTIN和ARF4）中起作用。已经在许多植物物种中鉴定出许多phasiRNA，包括拟南芥，水稻（Oryza sativa）和葡萄（Vitis vinifera）。已知PHAS基因座的数量在物种之间差异很大，从野生稻（Oryza rufipogon）中的800多个到拟南芥中的不到30个。在豆科植物中，分别在Medicago truncatula和大豆（Glycine max）中鉴定出114和41个PHAS基因座。

大豆在经济上是世界上最重要的豆类，它是蛋白质和食用油的主要来源之一。大豆的基因组序列现在可公开获得。基因组序列与下一代测序技术产生的数据一起，使得能够在全基因组范围内鉴定和定量小RNA。迄今为止，已在大豆中鉴定出数百种miRNA。然而，许多新注释的miRNA及其靶标尚未得到很好的验证，甚至注释的miRNA也经常在更强大的实验数据后进行校正。PHAS基因座比miRNA的注释更差。与Medicago truncatula相比，在大豆中鉴定出的PHAS位点要少得多。凭借广泛的小RNA数据和更高的测序深度，可以发现更多的PHAS。在这项研究中，我们分析了从不同组织中创建的大量小RNA文库，以构建小RNA的表达图谱并全面鉴定大豆中的PHAS基因座。我们证明大豆中的许多蛋白质编码基因是PHAS基因座。除了先前被鉴定为豆科植物PHAS基因座的NB-LRR之外，我们发现了数百种其他产生phasiRNA的蛋白质编码基因。我们整合了RNA末端（PARE）数据的并行分析，以确定这些PHAS基因座的miRNA触发因子。从这些数据中，我们验证了在miRBase（版本20）中记录的大豆miRNA并且鉴定了新的miRNA，证明了许多先前报道的miRNA具有siRNA的特征。基于表达分析，我们证明了phasiRNA以及已知和新发现的miRNA在不同组织和不同处理下的特异性表达。

总结

第一段

小RNA的重要性及作用方式（降解，抑制；根据和靶位点的结合紧密程度来分，结合紧密直接降解，不太紧密就抑制/干扰/微调）
植物中小RNA的分类，miRNA的发生和作用过程，异染色质siRNA作用

第二段

phasiRNA的形成过程，命名原因，在物种中的含量

第三段

全基因组范围内搜索鉴定小RNA已成为可能
大豆中小RNA的研究现状：没有很好的验证，以及注释差
这篇文章做了些什么，在上一个总结的基础上，加上整合PARE数据确定PHAS基因的miRNA触发位点，差异表达分析

结果

大豆小RNA和PARE文库的构建和测序

我们从大豆的营养和生殖组织构建并分析了69个小RNA文库，包括花，叶和发育中的根瘤；此外，我们整合了种子和种皮组织的公共数据。叶组织来源于充分浇水或干旱胁迫下的植物，或使用模拟生物胁迫的处理（即鞭毛蛋白和几丁质处理）。花组织的小RNA文库由未开放的花，开放的花，子房和花药制备。在接种后10,15,20,25和30天从发育中的根瘤取样制备根瘤的小RNA文库。我们构建的文库（即，除了来自公开数据库的种子相关数据之外的所有文库）包括每个样品的两到三个生物学重复。

充分利用公共数据库，构建文库时明确什么实验条件什么组织

保留了18至34个核苷酸范围内的小RNA reads，从所有文库中总共得到1,967,153,698个reads。去除与结构RNA（主要是rRNA或tRNA一类的）相匹配的序列后，保留了1,158,661,201个基因组匹配的reads（占总数的58.9％），相应的有138,436,684个独特的序列（能匹配到基因组的reads的11.9％，总reads数的7.0％）（我的理解是reads的种类）。将每个文库中的序列丰度标准化为TP5M。在根瘤文库中发现有最高比例的独特序列（27.5％），而在叶片文库中发现有最低比例（6.6％），可能反映了叶片中sRNA复杂性的饱和度（也就是没那么复杂，种类少），因而其具有最高的reads丰度。对reads长度分布的分析表明，不同长度的小RNA在不同组织中的比例不同（补充图1）。在几乎所有组织中，21和24个核苷酸的总reads丰度比例高于其他长度的小RNA，并且在组内重复和不同组织中一致；一个例外是在叶组织中，其中24核苷酸的reads的总丰度的比例大大降低（补充图1A，1C，1E和1G）。后一种情况与拟南芥叶片不同，其中24核苷酸reads的丰度很高（补充图2）。在所有组织中24个核苷酸类reads中独特reads的比例大于21个核苷酸类reads，可能反映出，这些通常是来自一系列基因组重复序列的异染色质siRNA（补充图1B，1E，1F和1H）。如上所述，叶片文库具有相对较少的独特reads，其中最突出的类型（68％）是miRNA（补充图2）。在叶片文库中，miRNA主要仅包含三种：miR398c，miR3522变体和miR166a，并且在这些序列中，miR398c占21个核苷酸小RNA的22.5％。叶片中相当多的21个核苷酸小RNA来自基因间区（19％）。这些基因间区内的相关序列是最多样化的，占独特reads的69％。在生殖组织中，22个核苷酸的独特reads的比例很高，并且与21个核苷酸的小RNA相当（补充图1B），而在根瘤和种子组织中，22个核苷酸独特reads的占比高于21个核苷酸（补充图1F）。所有匹配基因组的reads用于miRNA评估和定相基因座鉴定（见下文）。

这一段给了很多比例，每一个的意思，是怎么算的要清楚
在叶片文库中，miRNA主要仅包含三种：miR398c，miR3522变体和miR166a —— 后面多注意一下这里的鉴定是怎么做到的

重新评估已注释的miRNA

miRBase版本20（http://www.mirbase.org）可追溯至2013年11月，包含来自70多种植物的超过6000个MIRNA基因。在大豆中，来自505种前体的554种成熟miRNA已经被记录。在miRBase中记录的许多miRNA基于与其他物种中保守miRNA的相似性进行计算鉴定（基于序列保守性的预测鉴定），一些通过小RNA文库深度测序验证了，很少一部分通过PARE数据（也称为降解组数据）验证其功能。在没有实验验证的情况下，如PARE数据或cDNA末端的5’快速扩增（PARE data or 5’-rapid amplification of cDNA ends），miRNA功能的预测结果可能比较模糊。对水稻miRNA的分析表明，许多预测的miRNA是不典型的，缺乏常规miRNA特征，或者它们是像siRNA的miRNA（siRNA-like）而不是典型的miRNA。siRNA-like miRNA的特性包括小RNA是多样的，分布式的，低丰度的并且在生成它们的基因位点的两条链上都能发现。使用小RNA深度测序数据结合PARE文库对miRBase中注释的水稻miRNA进行的分析极大地改善了典型miRNA的表征结果。在我们的研究中，使用迄今为止产生的最大的大豆小RNA数据集以及PARE数据，使我们能够评估miRBase注释的大豆miRNA（version 20）并发现新的miRNA。表征典型植物miRNA的标准基于Meyers等人，并且评估miRNA的过程基本上如Jeong等人所述。在除去与大豆1.1版基因组无法比较的注释miRNA后，530个先前报道的miRNA被重新评估以将每个miRNA表征为（A）弱表达的miRNA，其难以评估，但类似于异染色质siRNA;（B）与siRNA高度相似且可能是siRNA;（C）一种略微符合（原文：marginally meets）严格定义的miRNA（可能包括新进化的miRNA）;（D）符合明确定义的miRNA所有标准的典型miRNA（参见方法；每个类的实例显示在补充图3中）。基于Meyers等人的miRNA家族标准，我们还通过与拟南芥的比较来评估大豆miRNA的保守性。在大豆和拟南芥之间产生231个保守的miRNA，在miRNA列表中相应地分配了名称（补充数据集1B）；这些miRNA明显适合D类，即明确定义的miRNA。

可以基于序列保守性来预测鉴定miRNA
降解组数据验证miRNA的功能，降解组测序是对什么进行测序，mRNA吗？

降解组测序（Degradome Sequencing）正是利用高通量测序技术结合生物信息学手段对这些mRNA降解片段进行大规模鉴定，进而鉴定miRNA调控靶基因的技术——miRNA的功能研究手段。降解组测序原理

siRNA-like miRNA的特点，也反映了siRNA的特点
530个先前报道的miRNA

（A）弱表达的miRNA
（B）与siRNA高度相似且可能是siRNA
（C）略微符合严格定义的miRNA（可能包括新进化的miRNA）
（D）典型miRNA

基于Meyers等人的miRNA家族标准，通过与拟南芥的比较来评估大豆miRNA的保守性。具体怎么做的？

评估miRNA并将基因座分类为上述类别的过程主要涉及三个标准，包括它们的丰度，丰度比和链比。通过检查与每个miRNA基因座匹配的两个最丰富的小RNA（“top1 + top2”）的reads计数来计算丰度，对于真实的miRNA，其通常代表miRNA双链体的两条链。总共530个miRNA的总丰度范围从低至1 TP5M到最高丰度4410万TP5M（miR166的两个最丰富的序列变体）和3690万TP5M（miR1507）。我们将191个miRNA前体指定为“弱表达”基因座；这些位点匹配reads的丰度<924 TP5M，低于保守miRNA基因座的95％（补充数据集1B）。对于第二个标准，丰度比，我们检查了两个最丰富的小RNA（top1 + top2）和所有与每个miRNA基因座匹配的小RNA之间的丰度比，而对于第三个标准，链的偏向性，每一个茎环结构是这样算的：有义链的小RNA序列的总丰度除以两条链的总丰度。在保守的miRNA中，95％的丰度比为0.565或更高，而在非保守miRNA只有17.5％的丰度比为0.565或更高（补充数据集1B）。按照Jeong等人的做法，我们将丰度比小于0.4的miRNA基因座定义为“siRNA-like”miRNA基因座，将比率在0.4和0.5之间的miRNA基因座指定为“marginal”miRNA基因座，与补充图3中显示的例子一致。95％的保守miRNA前体具有0.978或更高的链比，而只有23％（71/299）的非保守miRNA符合该值。我们认为具有小于0.8链比的miRNA前体作为“siRNA-like”miRNA，具有0.8到0.9链比的miRNA前体作为“marginal miRNA”。综合第二和第三标准，我们能够将312个miRNA分类为典型的miRNA，203个miRNA作为siRNA-like miRNA，15个miRNA作为marginal miRNA；312个miRNA包括从第一个标准（补充数据集1B）定义的191个弱表达的miRNA。“典型miRNA”类中的大多数miRNA长度为21和22个核苷酸，而“siRNA-like”类miRNA主要在已注释的miRNA中，它们具有24个核苷酸大小（补充数据集1B）。后一组miRBase中有的 siRNA-like ，24核苷酸的miRNA可能被错误地注释。

丰度：利用与每个miRNA基因座匹配的两个最丰富的小RNA（“top1 + top2”）的reads计数来计算丰度
丰度比：两个最丰富的小RNA（top1 + top2）和所有与每个miRNA基因座匹配的小RNA之间的丰度比
链的偏向性：每一个茎环结构是这样算的，有义链的小RNA序列的总丰度除以两条链的总丰度
191个miRNA前体被定义为“弱表达”基因座，因为丰度小
丰度比小于0.4的miRNA基因座定义为“siRNA-like”miRNA基因座，在0.4和0.5之间的miRNA基因座指定为“marginal”miRNA基因座
链比小于0.8的miRNA前体作为“siRNA-like”miRNA，链比在0.8到0.9之间的miRNA前体作为“marginal miRNA”
将312个miRNA分类为典型的miRNA（包括了191个弱表达的miRNA），203个miRNA作为siRNA-like miRNA，15个miRNA作为marginal miRNA

大豆中新miRNA和miRNA变体的鉴定

除了对先前报道的miRNA重新评估之外，我们还使用小RNA数据来鉴定新的miRNA并注释miRNA变体。用于鉴定新miRNA的流程改编自Jeong等人（补充图4）。在排除t / r / sn / snoRNA后使用124,526,477个不同的reads，对18至26个核苷酸之间的所有基因组匹配的reads进行过滤以获得reads丰度，包括那些至少在一个文库中 >= 50 TP5M。比对到大豆染色体中超过20个位置的reads也被丢弃，因为它们过于重复而不能成为miRNA。在124,526,447个reads中，有29,133个序列通过第一个过滤条件，包括198个与已知miRNA匹配的序列。如Jeong等人所述，通过miREAP（https://sourceforge.net/projects / mireap）分析通过第一组过滤条件的候选前体。总计获得了对应4047个前体的2523个序列。在198个已报告的miRNA中，只有120个通过了第二个过滤条件。然后使用第三个过滤条件来评估单链bias（有义/总的 >= 0.9）和丰度bias（[top1 + top2] /总的>= 0.7），为了保证一个前体仅产生一个或两个最主要的miRNA。总共对应361个前体的180个小RNA序列通过该过滤条件，包括71个已知的miRNA。应用第四个过滤条件以鉴定高质量的茎环结构，使用CentroidFold进行分析。来自332个前体的共151个候选序列通过了此过滤条件；来自上一步的所有71种已知miRNA也都通过了。在71种已知的miRNA中，与miRBase中记录的miRNA相比，我们发现44种变体（补充图4）。在排除已知的miRNA后，将22个高可信度候选序列指定为新的miRNA（补充数据集1C）。还通过比较小RNA reads和miRBase（补充数据集1D）中记录的那些来鉴定miRNA变体。发现大约20个长度不等的序列，和miRBase中记录的miRNA相比较，包含不同的核苷酸替换。这些miRNA变体的长度在19至24个核苷酸之间变化，包括1至4个核苷酸的替换。还在先前报道的miRNA（补充数据集1D）的相同前体上从不同位置鉴定了10种新miRNA。因此，能够从我们的数据集中鉴定出大量新的和已知的大豆miRNA。

重点是流程图和过滤条件

大豆不同组织和不同处理中miRNA的丰度差异

对所有69个小RNA文库中的新的和已知的miRNA及其变体进行丰度计数的差异评估。我们的数据的层次聚类揭示了许多miRNA表现出组织优先积累。我们选择了三组miRNA进行更详细的分析。第一组是显示组织优先水平的所有新型miRNA（图1A）。在22种新型miRNA中，6种仅在种子组织中观察到，包括gma-miR10196，gma-miR10195，gma-miR10191，gma-miR10188，gma-miR10194和gma-miR9756（图1A）。类似地，gma-miR10200富含于根瘤，gma-miR5030b富含于叶片。这些新型miRNA中的一些富含于一种以上的组织中；即，gma-miR10201，gma-miR10186，gma-miR10198，gma-miR10193和gma-miR9749在生殖组织和根瘤中富集（图1A）。第二组是在生殖组织中高度富集的miRNA。该组包括gma-miR395c，gma-miR395d，gma-miR395g，gma-miR169s，gma-miR156f和gma-miR4392（图1B）。在花组织中优先观察到的miRNA中，其中一些在花药中显示出高度富集，即gma-miR4392，gma-miR393和gma-miR167e。有趣的是，gma-miR4392在生殖组织中高度丰富，特别是在花药中，但在其他组织中几乎不存在（图1B，并在下面更详细地分析）。还存在优先存在于生殖组织以及根瘤中的miRNA，即miR172c，miR159b和miR395g（图1B）。以组织优先方式观察到的最后一组miRNA包括在发育中的根瘤中强烈存在但在其他组织中少量存在的miRNA。这些包括miR171b，miR171r，miR159f，miR172d和miR43945p（图1B）。不适合我们的三组中的任何一组的是许多富含种子组织的miRNA，即gma-miR176e / f和gma-miR1512c。这些种子特异性miRNA在其原始研究中得到了很好的描述。

探究了不同组织（或组织组合）中的miRNA富集差异。

一个家族中的miRNA在组织中差异累积；例如，包含22个成员的大型miR171家族显示出多样的富集模式（补充图5）。一些在根瘤富集，即gma-miR171s，gma-miR171r和gma-miR171b-3p，而其他的是富含于花和叶的。来自单个前体的miRNA的加工变体也以不同方式累积；变体gma-miR156c.2在子叶中高度富集，而gma-miR156c.1不存在（补充数据集1D）。gma-miR156c在大多数或所有组织中，但优先在种皮组织中表达。类似地，gma-miR3522.1优先在种子组织和叶组织中鉴定，而gma-miR3522仅在种子组织中以低水平存在（补充数据集1D）。

什么叫基因家族？如何定义一个基因家族？什么样的序列才能被算作一个基因家族中的一个成员？

我们接下来发现了在应激处理中差异表达的miRNA。这是使用R软件包baySeq完成的，条件需满足似然值>=0.95，错误发现率<0.01。通过这些阈值，在两种基因型（IA3023和LD003309）的水胁迫叶中没有miRNA差异表达；然而，最接近的是gma-miR1446，富含于干旱胁迫的叶子（补充数据集1E;图1A）。我们发现9种miRNA在鞭毛处理的Dassel基因型中上调，可能模仿生物应激（补充数据集1E），而我们无法鉴定由几丁质处理产生的任何差异表达的miRNA。在我们的文库中，比起不同的处理，在不同的组织中，差异miRNA富集的现象更明显。

图1.新的和组织优先miRNA的表达谱。
（A）在该研究中鉴定的新miRNA包括许多在特定组织或器官中差异富集的miRNA。
（B）对先前描述的大豆miRNA的分析还揭示了花，叶和根瘤中一系列的组织bias。

使用PARE文库进行miRNA靶标验证

使用PARE数据能够快速且精确地进行miRNA指导的靶标降解的实验验证。我们从花，叶和根瘤组织构建了PARE文库，并利用种子的公共PARE数据，包括超过6500万个不同的reads（补充数据集1F）。在PARE验证的miRBase注释的大豆miRNA靶标中，我们验证了262个miRNA的392个靶标，其中大多数是典型的miRNA。其中，261个与注释为蛋白质编码基因重叠，其余在基因间区或未注释的基因（补充数据集1G）。每个miRNA的靶标数量范围从1到23。在新miRNA和变体中，鉴定了8个新miRNA的9个靶标，并鉴定了33个新miRNA变体的129个靶标。其中，新miRNA和新miRNA变体的8和86个靶标分别与注释基因重叠，其余定位于基因间区（补充数据集1H），其可以是未注释的基因或非编码转录物如TAS基因座。

降解组数据从生信角度如何分析？
找出靶标之后，如何注释（定位于基因区，基因间区）？可以用Annovar吗？

全基因组范围内鉴定生成Phased siRNA的位点及其触发物

产生相位排列siRNA的植物基因座，即所谓的PHAS基因座，包括蛋白质编码和非编码转录物；豆科植物M. truncatula富含这种基因座，在其他植物物种中这种基因座的数量不定。我们将所有69个小RNA文库结合起来鉴定大豆PHAS基因座，随后通过逆向计算评估其miRNA触发物。以phasing P value <= 0.001（严格阈值）（图2A）为条件，鉴定了504个基因组上的PHAS基因座。其中，483（95.8％）与注释的蛋白质编码基因有重叠。这些PHAS基因座的主要类别（208个，占41.0％）对应NB-LRR类基因，其编码79个Toll白细胞介素1受体（TIR）-NB-LRR，5个coiled-coil (CC)-NB-LRR，和89个其他NB-LRR（图2A）。这些phasi-NB-LRR（pNL）占大豆基因组中鉴定的所有NB-LRR的65％（208/319），包括Kang等人鉴定的那些，加上使用Greenphyl DB鉴定的另外35个phasi-NBLRR基因（补充数据集1I）。大多数pNL基因座聚集在染色体3,6,13,15和16上，其含有30,21,15,14和40个pNL（图2C）。在不同pNL之间phasiRNA的水平不同，一些在所有分析组织中显示高水平的siRNA，但是其他phasiRNA在特定组织中累积，如根瘤（图2B）。许多receptor-like kinase-encoding基因也产生phasiRNA，但这些只是大豆中已知的600个receptor-like kinase-encoding基因的一小部分（25个基因座）。在拟南芥中，大多数编码蛋白质的PHAS基因是含有三角状五肽重复区(PPR)的蛋白区域，但在大豆中我们发现仅有15个PPR编码PHAS基因座。几种不同的转录因子家族占PHAS基因座的15％（图2A），包括来自Aux / IAA和生长素响应因子家族的18个PHAS基因座（AUX-IAA-ARF），APETALA2中的10个PHAS基因座和乙烯 - 响应元件结合蛋白（AP2-EREBPs）基因家族，以及来自编码MYB / HD样蛋白的基因的另外10个PHAS基因座（图2A）。参与小RNA生物发生的基因，即DCL（5个基因座），SUPPRESSOR OF GENE SILENCING3（3个基因座）和AGO2（1个基因座）也是大豆PHAS基因座之一，表明可能发生反馈调节。最后，大量（126）的PHAS基因座与功能未知的基因重叠，其中许多是基因组中的单拷贝，表明顺式而非反式活性（图2A;补充数据集1I）。由于我们这次的数据集更广泛、更深入，504大豆PHAS基因座显着大于且包括我们之前在大豆中鉴定的41个基因座。

与蛋白质编码基因不同，一组21个PHAS基因座预测是非编码基因。这包括6个TAS3-like的基因座和先前报道的未命名的TAS-like基因座。两个TAS3基因座（TAS3a和TAS3b）高度富集（这里应该是指它们产生的phasiRNA吧），并且与拟南芥非常相似，而另外四个TAS3旁系同源物（TAS3c-f）在phasiRNA丰度，序列保守性或触发物排列方面不同（图3）。除花组织外，TAS3c和TAS3d产生的phasiRNA很少（图3A）；TAS3a和TAS3b在大多数组织中稳定积累，在根瘤发育的过程中具有丰富的含量（图3A）。 TAS3e-和TAS3f-衍生的phasiRNA在根瘤中检测不到（图3A）。此外，我们还发现了非编码PHAS基因座，其仅在花药中产生phasiRNA，见下文。

借助（结合了AGO蛋白的miRNA）的触发物切割双链靶标而产生phasiRNA，在这个过程中RDR6酶负责合成dsRNA，这是DCL4酶加工成定相的21个核苷酸的sRNA的底物。为了鉴定PHAS基因座的miRNA触发物，我们整合了大豆miRNA和PARE数据。确定了127个PHAS基因座的20个miRNA触发物，每个触发物靶向1至20个基因座（补充数据集1I）。 3个miRNA触发超过10个PHAS基因座，包括gma-miR167e（触发10个PHAS基因座），gma-miR2109（11个基因座）和gma-miR1510b-3p（20个基因座）；前者靶向ARF6和ARF8转录因子，后两者主要触发pNL。最后，我们观察到：在拟南芥触发phasiRNA发生的miRNA中观察到的特征——前体具有不对称凸起的茎环结构，在我们发现的许多miRNA触发物中都没有。

图2.编码蛋白质的PHAS基因。
比起其他研究过的植物基因组，大豆基因组含有更多的编码蛋白质的产生phasiRNA的基因座。
（A）编码PHAS基因座的类别和数量。
（B）NB-LRR家族中PHAS基因的表达谱和层次聚类。
（C）大豆基因组中phasi-NB-LRR基因的分布和聚类。

TAS3的新基因座和相位模式

在植物中，许多定相基因座由one-hit的22个核苷酸的miRNA触发，在切割位点下游产生phasiRNA；对于我们鉴定的大豆中的定相基因座也是如此（补充数据集1I）。TAS3基因座通常由miR390通过two-hit途径在两个位点结合触发，引发tasiARF产生。从所有六个大豆TAS3基因座产生保守的tasiARF：两个由TAS3a / b [597D（+）和598D（+）]产生，并且仅一个（597D（+））来自TAS3c / d / e / f（图3B）。在tasiARF GmTAS3c-597D（+）和GmTAS3d-597D（+）的第9和10位发现了单核苷酸变体（C-to-U）（图3B）。6个大豆TAS3基因座中的4个，TAS3a / b / c / d，其靶位点与经典的双击模型一致（图3C）；另外两个，TAS3e和f，都是非典型的。 TAS3e具有三个gma-miR390结合位点，基本上是three-hit基因座，中间位点被切割以启动下游加工和598D（+）产生（图3C）。相对于拟南芥TAS3，大豆TAS3e具有非经典的定相方向，在21-核苷酸gma-miR390切割的位点的下游而不是上游。类似地，TAS3f中的定相是5’ miR390靶位点的下游，但gma-miR390结合位点的位置和数目是TAS3基因座的典型位点（图3C）。

我们的数据还表明tasiRNA可以在two-hit生物发生中起作用以触发额外的secondary siRNA。来自TAS3的tasiARF靶向并切割来自ARF3 / ETT和ARF4基因的转录物。在大豆中，ARF3 / ETT（Glyma13g24240）和ARF4（Glyma12g07560）的转录本不仅被tasiARFs GmTAS3a,b 597D(+)和GmTAS3a,b 598D(+)切割，而且ARF靶标也产生了phasiRNA（图4A;补充图7）。因此，两种tasiARF都是phasiRNA触发物，如使用two-hit途径从切割位点下游处理所证明的。更重要的是，这表明siRNA还可以通过生物发生的two-hit机制起到phasiRNA触发的作用（图4B）。

图3.大豆TAS3 TasiRNA的触发物和加工机制。
（A）来自大豆基因组中存在的六个TAS3基因座中的tasiRNA的总和在花，叶，根瘤和种子组织中的富集模式。 TAS3a和TAS3b是相同的，因此不能单独测量。
（B）源自TAS3a / b / c / d / e / f的TasiARF。所有TAS3 598D（+）和597D（+）siRNA的验证目标均在生长素响应因子（ARF）家族中，与其相对良好的保守序列一致（数据未显示）。
（C）在大豆TAS3基因座处存在两个或三个miR390靶位点，并且相对于这些靶位点的定相方向表明在TAS3e和TAS3f处由21个核苷酸的miRNA触发的siRNA的非典型加工方向。

图4.由TasiARF触发的ARF3 PHAS-Locus。
（A）大豆TAS3衍生的tasiARF在两个相同的位点靶向ARF3，通过PARE验证切割的59位点（下图）和未观察到切割的39位点。这种双击的tasiARF活性产生了定相siRNA（中图）。 y轴是phasing “score”，其是定相显著性的估计P值（参见方法）。较低的两个图像是我们的Web浏览器，显示小RNA（中间）或PARE数据（下部），橙色虚线表示tasiARF切割位点。有色斑点是在y轴上显示丰度的小RNA；浅蓝色斑点表示21个核苷酸的sRNA，绿色表示22个核苷酸的sRNA，橙色表示24个核苷酸的sRNA，其他颜色对应其他sRNA大小。红色框是带注释的外显子（粉红色是非翻译区域）。紫色线表示重复区的k-mer频数。
（B）来自图A的数据表明two-hit的phasiRNA生物发生的级联反应，其中21个核苷酸（nt）miR390触发21个核苷酸的tasiARF生物发生，并且通过two-hit机制，tasiARF触发来自ARF3和ARF4的额外二级siRNA的生成（参见补充图7在线）。 ARF siRNA可以顺式或反式起作用。

图5.源自Arogenate脱氢酶基因座的花药中高度富集的PhasiRNA。
（A）涉及雄激素脱氢酶的生化途径。
（B）来自雄激素脱氢酶相关基因座的phasiRNA产生的示意过程。在左侧，将形成发夹的基因片段加工成phasiRNA。
（C）来自不同组织中的两种arogenate dehydrogenase PHAS基因的miRNA触发物和phasiRNA的reads丰度水平（红色条）和基因表达水平（绿色条），其被标准化为RP5M和RP25M。

PhasiRNAs在不同组织和不同处理中的差异表达

方法

植物材料

为了获得生殖组织，大豆（Glycine max）栽培品种Williams 82在16小时光照/ 8小时黑暗，25℃的温室中培养。分别收集未开花、开花一天的花组织。从未开的花中解剖出花药和子房组织。为了获得根瘤组织，在接种大豆根瘤菌USDA110菌株后10,15,20,25和30天收集发育中的根瘤。为了获得水胁迫下的样品，将近交系IA3023和LD00-3309播种于两个盆中，一个作为对照，另一个胁迫处理。植物生长至V1阶段，并且所有盆2天灌溉一次至田间容量（1600mL水）。在V1阶段，胁迫组不予以灌溉，并且对照盆被灌溉直到实验结束。一旦处于胁迫下的植物的50％达到永久枯萎点（叶片水势为-8 至 -10 bars），从对照和胁迫组中收集叶样品。对于病原菌模拟处理，来自三个大豆品种Williams 82，Dassel和Vinton 81的叶样品用几丁质八聚体和水对照处理30分钟。来自相同品种的叶样品也用从细菌鞭毛蛋白22中保守22个氨基酸的肽和水处理30分钟。在RNA提取之前，立即将从所有组织收集的样品在液氮中冷冻。

sRNA和PARE的RNA提取和测序

使用Concert Plant RNA Reagent（Invitrogen / Life Technologies）从植物材料中分离总RNA。使用TruSeq Small RNA样品制备试剂盒（Illumina）构建小RNA文库。如前所述构建PARE文库（Zhai等，2014）。文库在Delaware Biotechnology Institute（Newark，DE）的Illumina HiSequation 2000上测序。

测序数据的计算分析

去除原始测序数据的接头序列，然后使用Bowtie（Langmead等人，2009）将其定位到大豆基因组（DOE-JGI Community Sequencing Program v1.1）。与大豆基因组完全匹配的reads（不包括那些匹配的tRNA，rRNA，snRNA和snoRNA）用于进一步研究。从miRBase（版本20; http://www.mirbase.org/）检索大豆成熟miRNA及其前体。

如何确定有没有匹配到tRNA，rRNA，snRNA和snoRNA？

miRNA预测流程

miRNA预测流程在补充图4中概述。该过程中的各个步骤使用Perl脚本（Jeong等，2011）与miREAP结合进行(https://sourceforge.net/projects/mireap/)和CentroidFold (Sato et al., 2009)。miREAP用于评估miRNA和miRNA *的配对，其参数设置为允许miRNA和miRNA *（-d 400）之间的最大距离为400个核苷酸，在前体末端延伸25个核苷酸（-f 25），关闭针对动物miRNA优化的过滤设置，包括对植物miRNA特征的微调（我们的miREAP修改版可根据要求使用）。此外，还要求两个miRNA特征：基于保守miRNA的特征，单链偏向性>=0.9，丰度偏向性>=0.7。CentroidFold按照默认设置使用，来显示整个miRNA前体结构，以进行手动评估。

miRNA靶基因预测和PARE验证

394个microRNA的全基因组靶基因被鉴定和验证;这涵盖了312个典型的miRNA，15个marginal miRNA，44个新的miRNA变体和23个新的miRNA。使用sPARTA包进行验证（Kakrana等，2015）。使用sPARTA的内置目标预测模块miRferno进行目标预测，其具有标准评分方案，分数阈值为<=7，随后是基于PARE的预测目标验证。以校正P值<=0.05并且在切割位点具有PARE reads丰度>=5为过滤条件，经验证的miRNA-靶基因相互作用被用于进一步解释。

定相分析

将sRNA reads比对到大豆基因组后，用匹配的坐标表示单个sRNA。由于在sRNA双链的3’端存在两个核苷酸的突出，因此与反义链匹配的sRNA添加了两个核苷酸的正偏移。使用9个循环的滑动窗口（189 bp）进行全基因组搜索，每次切换为3个循环（63 bp），当至少10个不同的reads落入9循环的窗口，至少50％匹配的特异reads长度为21个核苷酸，并且至少3个特异reads落入某个寄存器，此时报告窗口。接下来报告的具有重叠区域的窗口被组合成单个较长窗口。然后，使用Xia等人的算法，基于比对结果计算每个窗口的P值。对于相位P值<=0.001的基因座还需最终检查。绘制来自每个基因座的小RNA的P值和丰度并且肉眼检查以去除假阳性，例如具有许多低丰度峰的miRNA基因座可能错误地通过我们的过滤器。手动除去未注释的tRNA和类似rRNA的基因座。

miRNA的差异丰度分析

基于reads的丰度数据，使用Bioconductor的R软件包“baySeq”（ Hardcastle and Kelly, 2010 ），对水胁迫和病原体模拟处理的样品进行成对（即对照与胁迫处理）的差异表达分析。>=0.95估计后验似然概率的聚集至显着不同水平的miRNA被鉴定出来。

数据获取

将大豆小RNA和PARE测序数据提交给NCBI Gene Expression Omnibus，编号GSE58779。

参考

降解组测序：http://www.ebiotrade.com/custom/LC_BIO/100427/index.htm

你可能感兴趣的:(第3周：利用大豆小RNA图谱鉴定来自编码基因区的phasiRNA)

右移的错误使用造成超出时间限制解决方案 aPurpleBerry LeetCode做题总结算法力扣二分查找
题目链接：https://leetcode.cn/problems/guess-number-higher-or-lower/?envType=study-plan-v2&envId=leetcode-75最开始的代码varguessNumber=function(n){letl=1,r=n;while(l>1;if(guess(m)===-1){r=m-1;}elseif(guess(m)===
【问题解决】pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 aPurpleBerry 问题解决前端
今天配置完poetry环境变量之后pnpm不能用了具体报错pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。请检查名称的拼写，如果包括路径，请确保路径正确，然后再试一次。所在位置行:1字符:1+pnpmrundev+~~~~+CategoryInfo:ObjectNotFound:(pnpm:String)[],CommandNotFoundException+F
将字符串数组String[]转换成List的三种方法积极向上的Elbert java学习 java 开发语言
通过Arrays.asList(strArray)方式,将数组转换List后，不能对List增删，只能查改，否则抛异常。String[]strArray=newString[2];Listlist=Arrays.asList(strArray)；list.add("1");//此处会报错原因解析：Arrays.asList(strArray)返回值是java.util.Arrays类中一个私有静态
Prompt Engineering for Large Language Models 三月七꧁ ꧂ 论文合集llm+prompt prompt 语言模型人工智能自然语言处理 pdf javascript 前端
题目大型语言模型的快速工程简介随着OpenAI的ChatGPT和Google的Bard等软件的普及，大语言模型（LLM）已经渗透到生活和工作的许多方面。例如，ChatGPT可用于提供定制食谱，建议替换缺失的成分。它可用于起草研究提案、用多种编程语言编写工作代码、在语言之间翻译文本、协助政策制定等等（Gao2023）。用户通过“提示”或自然语言指令与大型语言模型进行交互。精心设计的提示可以带
[Python] 使用 dataclass 简化数据结构：定义、功能与实战踏雪无痕老爷子 Python python 开发语言
在经典面向对象编程中，为了保存和操作数据往往需要定义多个类，手写__init__()、__repr__()、__eq__()等方法。Python3.7引入了@dataclass装饰器，它能自动生成这些常见方法，大幅减少样板代码。本文将介绍dataclass的定义与参数、比较与普通类的差别、实战示例，以及常见注意事项。一、什么是dataclass@dataclass是一种类装饰器，它通过类成员的类型
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
RAG应用的评估（一） AI老炮 AIGC ai 机器学习人工智能语言模型
前言上篇文档主要是对Advanced-RAG的定义、策略和适用场景做了一个细致的分析，那么当我们准备将一个基于大模型的RAG应用投入生产时，如何去判断这个RAG是否合理呢？下面有一些问题是需要提前考并应付的：LLM输出的不确定性会带来一定的不可预知性。一个RAG应用在投入生产之前需要科学的测试以衡量这种不可预知性。在LLM应用上线后的持续维护中,需要科学、快速、可复用的手段来衡量其改进效果,比如回
Go语言--包(Package) yunfan188 #Go语言学习笔记 go go语言 golang package
1命名空间和作用域1.1命名空间命名空间（Namespace）在编程语言中常用来表示标识符（identifier）的可见范围。编程语言借助命名空间来解决标识符不能同名的问题，命名空间实际上相当于给标识符添加了标识前缀，使标识符变得全局唯一。另外，命名空间是程序组织更加模块化，降低了程序内部的耦合性。一个标识符可以在多个命名空间中定义，它在不同命名空间中的含义是不互相干的。新的命名空间中可定义任意的
【RAG面试题】LLMs已经具备了较强能力,存在哪些不足点? 一叶千舟 AI面试题【RAG】RAG
目录LLMs核心不足点1、知识过时与静态性（LackofReal-Time&DynamicKnowledge）：2、幻觉与事实性错误（Hallucinations&FactualInaccuracies）：3、领域专业知识深度不足（LimitedDomain-SpecificExpertise）：4、缺乏透明度和可追溯性（LackofTransparency&Traceability）：5、上下文
如何在FastAPI中打造坚不可摧的Web安全防线？
url:/posts/9d6200ae7ce0a1a1a523591e3d65a82e/title:如何在FastAPI中打造坚不可摧的Web安全防线？date:2025-06-28T08:37:03+08:00lastmod:2025-06-28T08:37:03+08:00author:cmdragonsummary:Web安全三要素包括机密性、完整性和可用性。机密性通过加密算法保护数据传输和
PCDN如何提升网络流量的传输效率数据库
PCDN如何提升网络流量的传输效率在当今数字化时代，网络流量的快速增长对传统的CDN（内容分发网络）提出了更高要求。PCDN（P2PCDN）作为一种创新的内容分发技术，通过利用边缘节点的带宽资源，显著提升了宽带流量的传输效率，为用户带来更流畅的网络体验。分布式节点优化宽带流量传输传统CDN依赖中心化服务器分发内容，当用户请求激增时，容易导致服务器负载过高，影响宽带流量的传输速度。PCDN则采用分布
算法竞赛备考冲刺必刷题（C++） | 洛谷 P8814 解密热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P8814[CSP-J2022]解密-洛
HarmonyOS从入门到精通：WebView开发逻极 harmonyos 华为鸿蒙 webview UI 前端实战
引言WebView是现代移动应用中不可或缺的组件，它使应用能够显示Web内容，实现混合开发。本文将详细介绍鸿蒙系统中WebView的开发技术，包括基本使用、性能优化和最佳实践。WebView基础知识1.WebView类型鸿蒙系统支持多种WebView实现：系统WebView自定义WebViewWeb组件2.WebView权限配置在开发WebView应用前，需要在配置文件中添加相关权限：{"modu
Java Fork/Join 框架详解 empti_ 数据结构与算法 java
JavaFork/Join框架详解Fork/Join框架是Java7引入的一个并行编程框架，专门设计用来高效地实现分治算法（Divide-and-Conquer）。它通过工作窃取（Work-Stealing）算法来最大化多核处理器的利用率。一、核心概念1.基本组成ForkJoinPool：特殊的线程池，管理工作线程ForkJoinTask：表示任务的抽象类，有两个重要子类：RecursiveAct
Java注解的实现原理 empti_ Java基础 java
Java注解的实现原理Java注解的实现涉及Java语言规范、编译器处理和JVM支持等多个层面。下面我将详细解释注解在Java中的实现机制。一、注解的本质注解本质上是一种特殊的接口，所有注解类型都隐式继承自java.lang.annotation.Annotation接口。当你定义一个注解时：public@interfaceMyAnnotation{Stringvalue();}编译器实际上会生成
程序化交易系统中如何精准获取MACD、KDJ、BOLL等基础指标的值？股票程序化交易接口量化交易股票API接口 Python股票量化交易程序化交易系统 macd指标 kdj指标 boll指标股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>基础指标在程序化交易系统中的重要性基础指标对交易决策的指导意义MACD、KDJ、BOLL等基础指标在程序化交易系统中扮演着重要角色。MACD可以帮助判断市场的趋势和买卖信号，通过分析其快线和慢线的交叉情况，能为投资者提供入场和出场的参
股票程序化交易软件如何选择？这些要点你知道吗股票程序化交易接口量化交易股票API接口 Python股票量化交易区块链股票程序化交易软件功能特性稳定性成本股票量化接口股票API接口
Python股票接口实现查询账户，提交订单，自动交易（1）Python股票程序交易接口查账，提交订单，自动交易（2）股票量化，Python炒股，CSDN交流社区>>>了解软件功能特性基础交易功能基础交易功能是股票程序化交易软件的核心。它应具备快速下单、撤单等基础操作能力。比如在行情快速变化时，能让投资者迅速抓住机会下单，或者及时撤单避免损失。软件的交易界面要简洁明了，方便投资者操作。还应支持多种交
【网络】Linux 内核优化实战 - net.core.rmem_max 锅锅来了 Linux性能优化原理和实战网络 linux 运维
目录参数作用与原理默认值与查看方法调整场景与方法适用场景调整方法与其他参数的协同性能影响与注意事项典型案例总结net.core.rmem_max是Linux内核中控制套接字接收缓冲区（ReceiveBuffer）最大允许值的参数。它与net.core.rmem_default（默认值）共同决定了网络数据接收的性能上限和内存使用策略。以下是详细解析：参数作用与原理核心功能：限制单个套接字接收缓冲区的
RK3566系统移植 | 基于rk-linux-sdk移植uboot（2017.09） Mculover666 linux
文章目录一、测试已有的配置二、移植到fireflyROC-RK3566开发板1.新建单板2.新建设备树3.编译4.测试一、测试已有的配置查看rksdk中提供的uboot中对于rk3566的配置：rk3566.config内容如下：CONFIG_BASE_DEFCONFIG="rk3568_defconfig"CONFIG_LOADER_INI="RK3566MINIALL.ini"因为rk3566
MCP-Proxy：开发多LLM & 多MCP 支持并安全访问MCP Server的秘密 IT古董技术杂谈安全 MCP MCP-Proxy
在构建多模型、多协议、可控可信的大模型接入平台时，MCP-Proxy扮演着关键中枢。它不仅要支持多个LLM接入，还要保障对后端MCPServer的安全访问、请求审计、能力切换与资源隔离。什么是MCP/MCP-Proxy？MCP（ModelCapabilityProtocol）是新一代模型能力调用协议，类似于OpenAI的API，但可支持：多厂商大模型（OpenAI、DeepSeek、Yi、Chat
Linux I/O 文件操作详解：从系统调用到实际工程应用平凡灵感码头 linux学习 linux 运维服务器
一、写在前面在Linux或任何类Unix操作系统中，文件是一切的核心——无论是硬盘上的文本文件，还是串口设备、GPIO寄存器、甚至网络接口，几乎都被抽象为“文件”。理解Linux下的I/O文件操作机制，不仅是嵌入式开发的基础，也是进行系统编程与底层控制的关键。二、I/O的本质：一切皆文件Linux将外设抽象成文件的方式，统一了对各种资源的操作模型。你可以用open打开串口设备/dev/ttyS0，
英国留学生顺利拿到offer！博士学历+微软MOS国际认证加buff！全球认证考试中心 microsoft
在全球化职场竞争日益激烈的当下，英国留学生若想提升自身竞争力，考取高含金量的国际证书是一条有效途径。MicrosoftOfficeSpecialist（MOS）国际认证作为微软官方推出的办公软件专业认证，在全球168个国家和地区得到认可，每年吸引近百万人次报考，已成为众多外企筛选人才的重要标准。正值暑假，不少同学计划利用这段时间备考MOS，本文将结合实际经验，为大家提供一套系统的备考方案。一、为何
构建医学文献智能助手：基于 LangChain 的专业领域 RAG 系统实践
前言在当今医疗科技快速发展的时代，每天都有数以千计的医学研究成果在全球范围内发表。从临床试验报告到基础研究论文，从流行病学调查到药物研发数据，这些专业文献承载着推动医学进步的重要知识。然而，面对如此海量且专业性极强的文献资料，医疗从业者往往感到力不从心。如何在有限的时间内，准确把握文献核心价值，并将其转化为临床实践的指导？这个问题一直困扰着整个医疗行业。1.项目背景与业务价值1.1医学文献阅读的困
JVM(9)——详解Serial垃圾回收器十六点五 jvm java 开发语言后端
Serial垃圾回收器是JVM最古老、最基础、最简单的垃圾回收器，也是理解其他更复杂回收器的基础。一、Serial回收器的定位与设计目标核心特点：单线程(Single-Threaded)这是Serial回收器最根本的特征。无论是进行垃圾标记(Marking)、清除(Sweeping)、复制(Copying)还是整理(Compacting)，它都只使用一个单独的线程来执行所有垃圾回收工作。工作模式：
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python实战：自动在知乎回答点赞并采集内容的高阶爬虫教程 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 okhttp 学习
✨写在前面：为什么做知乎自动化操作？知乎作为中国领先的知识问答平台，拥有大量结构化内容。对于研究舆情分析、情绪识别、用户画像，甚至产品舆情反馈采集的用户来说，如何自动获取知乎内容并进行交互行为（如点赞、回答），是一个非常实用的能力。本文将手把手带你用Python完成以下目标：✅自动登录知乎✅自动搜索某个关键词下的热门问题✅自动点赞高质量回答✅自动采集回答内容（文本、点赞数、评论数等）✅自动保存为本
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
【C++】atoi和std::stoi bluebonnet27 编程语言 #C++c++算法开发语言
两个将字符串转为int的方法atoi（C语言）atoi是C库中的一个函数，它定义在头文件里。其作用是把一个字符串转换为对应的整数。/*Convertastringtoaninteger.*/externintatoi(constchar*__nptr)__THROW__attribute_pure____nonnull((1))__wur;转换的原则如下：此函数接收一个以空字符'\0'结尾的字符串
并行归并排序的 Java 实现 empti_ 数据结构与算法 java 算法排序算法
并行归并排序Java实现importjava.util.concurrent.RecursiveAction;importjava.util.concurrent.ForkJoinPool;publicclassParallelMergeSort{//主方法，供外部调用publicstaticvoidparallelMergeSort(int[]array){ForkJoinPoolpool=ne
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他