ccszbd

【PaperReading】Linked open data-based framework for automatic biomedical ontology generation

《Linked open data-based framework for automatic biomedical ontology generation》

《链接开放的基于数据的框架，用于自动生成生物医学本体》

摘要

背景： 实现语义Web的愿景需要一个准确的数据模型来组织知识和分享对专业领域的通用理解。据此，本体是语义Web的基石，可以用于解决临床信息和生物医学工程的许多问题，例如词义消歧，，语义相似性，问答及本体对齐等等。本体的手工构建是劳动密集型的，并且需要领域专家以及本体工程师。为了缩小本体的劳动密集型性质，并且最大限度的减少对领域专家的需求，我们提出了一种新的自动本体生成框架，用于生物医学本体生成的链接开放数据方法(LOD-ABOG)，其中由开放链接数据授权(LOD)。LOD-ABOG使用知识库(主要是UMLS和LOD)以及自然语言处理(NLP)操作来执行概念提取，并且使用LOD，广度优先搜索(BSF)图方法，和Freepal存储库模式应用于关系的提取。
结果： 我们的评估显示，与现有的框架相比，本体生成的大部分任务都有了改进的结果。我们使用CDR和SemMedDB数据集评估了所提出框架的各个任务(模块)的性能。对于概念提取，评估显示CDR语料库的平均F值为58.12%，SemMedDB的平均F值为81.68%；使用CDR和SemMed数据集分别额提取生物医学分类关系的F值为65.26%和77.44%；分别使用CDR语料库和SemMedDB进行生物医学非分类关系提取的F值为52.78%和58.12%。此外，与手动构建的极限阿尔兹海默症本体比较表明，在概念检测方面，F值为72.48%，关系提取方面，F值为83.28%。此外我们将我们提出的框架与成为“OntoGain”的本体学习框架进行了比较，该框架表明LOD-ABOG在关系提取方面的表现要好14.76%。
结论： 本文提出了LOD-ABOG框架，该框架表明当前的LOD资源和技术是一种很有前景的解决方案，可以自动生成生物医学本体，并且在更大程度上提取关系。此外，与在本体开发过程中需要领域专家的现有框架不同，我们提出的方法仅仅在本体生命周期的最后，即改进时需要领域专家的参与。
关键词： 语义网，本体生成，开放链接数据，语义丰度

背景

在大数据时代，以及当今网络充斥大量的信息和数据的时代，迫切需要我们建模、组织和改进数据的方式。对数据建模的一种方法是设计本体，并使用他们来最大化从结构化和非结构化数据访问，以及提取有价值的隐式和显式知识的益处。本体论是将文档Web转化为数据Web的重要部分。本体的基本原理是使用一种主要本体语言，以标准的格式来表示数据或者事实，即资源描述框架(RDF)，资源描述框架模式(RDFs)，Web本体语言(OWL)，或简单的知识组织系统(SKOS)。

在过去的十年中，本体生成已经成为许多领域和生物信息学领域最具革命性的发展之一。有各种方法创建本体，这些方法包括：
基于规则的语法分析，基于句法模式的，基于字典的机器学习，以及基于知识的。 基于规则的方法涉及手动制定的一组规则，这些规则被形成以表示决定在各种场景中做什么或得出的结论知识。通常，它实现了非常高的精度，但召回率非常低，这种方法是劳动密集型的，适用于一个特定的领域，并且可扩展性非常低。另一方面，基于句法模式的方法在本体工程中得到了很好的研究，并且已经被证明在非结构化文本的本体生成中是有效的。与基于规则的方法不同，此方法包含大量精心设计的句法模式。因此它具有高召回率和低精度。这种设计好的模式很可能是可以广泛应用的，并且具有领域依赖。最著名的词汇-句法模式框架之一是Text2Onto。Text2Onto 是将机器学习方法与基本语言方法相结合，例如标记化和词性标记(POS)。这种方法存在不准确性和领域依赖性。Naresh等人提出了一个框架，用于从使用预定义字典的文本构建本体。他们的方法的缺点包括构建和维护综合字典的人工成本。最后，甚至手动创建了生成的本体。基于机器学习的方法使用各种监督和非监督方法来自动化本体生成任务。[18–22]中的研究提出了他们基于有监督学习方法的本体生成方法。Bundschus[18]等人的方法着眼于提取疾病、治疗方法以及基因之间的相互作用关系，而Fortuna [19]等人使用SVM主动监督学习方法来提取领域概念和实例。Cimiano [20]等人的研究基于形式概念分析方法结合自然语言处理的监督方法，从各种数据源中提取分类关系。Poesio[21]等人提出了一种基于核方法的监督学习方法，该方法仅利用了浅层的语言信息。Huang[22]等人提出了一种监督方法，它使用预定义的句法模式和机器学习来检测来自维基百科文本的两个实体之间的关系。这些有监督的机器学习方法的主要缺点是它们需要大量的训练数据和手动标记。这通常是耗时，昂贵且劳动密集的。因此，在[23, 24]中提出的无监督方法很少，[23]Legaz-García等人使用聚类构建概念的层次结构，并通过本体对齐来生成符合OWL格式的正式规范的输出。而Missikoff[24] 等人提出了一种无监督的方法，它结合了基于语言和统计的方法，从文本中执行自动本体生成的任务。

最近，已经提出了一些使用知识库来自动化本体构建的方法。例如Harris 等人利用自然语言处理和知识库，从原始文本构建本体知识结构。他们提出的方法使用预定义的概念词典来提取本体知识的“障碍类型概念”，例如可能在文本中出现的UMLS。另外，为了提取层次关系，他们使用句法模式来促进提取的过程。他们方法的缺点包括构建字典的人工成本，领域的特定性，以及模式的有限性。使用知识库方法的另一种尝试由Cahyani[25]等人提出，他们的方法使用受控词汇表来构建阿尔兹海默症的领域本体，并将阿尔兹海默症文本的语料作为输入。本研究使用Text2Onto工具识别概念和关系，并使用基于字典的方法过滤它们。此外，这项工作使用链接的数据模式映射来识别最终的概念和候选关系。这种方法产生了一些限制：疾病的特异性，需要与感兴趣的领域相关的预定义的字典，并且在概念和关系提取期间不考虑术语的语义。此外，Qawasmeh [27]提出的是一种半自动的引导方法，包括手动进行文本的预处理，概念提取以及LOD的使用，以抽取关系和类的实例。他们的方法的缺点在于都需要领域的专家以及在开发过程中涉及重要的手工劳动。表1显示了我们提出的方法和现有的基于知识的方法的比较。
表1

尽管在本体构建领域不断努力和进行了许多的研究，但本体生成和自动化的过程仍存在很多的挑战。这些挑战包括概念发现，分类关系的提取(定义一个概念层次)和非分类的关系。通常，本体是手动创建的，需要熟悉本体构建理论和实践的领域专家和本体工程师。一旦构建了本体，不断发展的知识和应用需求就需要不断的维护工作。此外，过去十年中，数据量的急剧增加使得几乎不可能在合理的时间限制下将所有现有数据手动转化为知识。在本文中，我们提出了一个名为“基于链接开放数据的自动生物医学本体生成框架”(LOD-ABOG)，它可以立即解决上述的每个挑战，克服领域特定本体手动构建的高成本，转换大量数据，实现领域的独立性，并且实现高度的领域覆盖。

我们所提出的框架使用知识库(UMLS)和LOD(Linked life Data [34, 35] BioPortal [36])，使用了混合的方法以准确识别生物医学概念；利用LOD，将语义丰度用简单、简洁的方式提取更多的概念；使用广度优先搜索算法(BFS)来导航LOD存储库，并且创建高精度分类，并生成一个定义良好的本体，以满足W3C语义的Web标准。此外，我们提出的框架是专门为生物医学领域设计和实施的，因为它是围绕生物医学知识库(UMLS和LOD)建立的。并且，概念检测模块也将使用生物医学专用的知识库UMLS进行概念检测。当然，也可以将其扩展到非生物医学领域。因此，我们会在未来的工作中增加对非医疗领域的支持。

本文回答了一下的研究问题：LOD是否足以提取概念，以及生物医学文献中的概念之间的关系（例如Medline/PubMed）？使用LOD以及基于UMLS和Stanford API等传统技术进行概念提取会产生什么影响？虽然，LOD可以帮助提取层次关系，我们如何能够为结果本体有效地建立非层次关系？与自动化OntoGain框架或者手动构建本体相比，我们提出的方法在精度，召回率以及F值等方面的表现是什么？

与现有的基于知识的方法相比，我们的主要贡献如下：

为了克服弱点，并且提高当前自动化和半自动化方法的质量，我们提出的框架整合了自然语言处理以及语义丰富技术来准确的检测概念；使用语义相关性进行概念消歧，将图搜索算法应用于三元组的挖掘，并且采用语义丰富技术来检测概念之间的应用。我们所提出的框架的另一个新颖的方面是Freepal的使用：用于关系提取的大量模式以及模式匹配算法，以提高非分类关系提取的准确性。此外，我们提出的框架通过使用提出的NLP方法以及基于知识的方法，具有从大量生物医学文献中进行大规模知识提取的能力。
与产生的概念、属性以及关系的集合的现有方法不同，我们提出的框架将生成定义明确的正式本体，其具有从现有的知识创建新知识的推理能力。

方法

我们从生物医学文献生成本体的方法如图1所示。表2给出了所有LOD-ABOG模块的简要描述。
图1

表2

NLP模块

NLP模块旨在分析，解释和操纵人类语言，已实现类似人类的语言处理。NLP模块的输入是来自MEDLINE/PubMed资源的非结构化生物医学文献。LOD-ABOG框架的NLP模块使用Stanford NLP API来计算句子的语法结构并执行标记化，分割，词干化，停用词删除和词性标注(POS)。算法1-文本处理显示了NLP模块的伪代码，分割是识别句子边界的任务(第3行)，词性标注是为每个单词分配明确的词汇类别的过程(第4行)。标记化是将变形形式转换或删除为公共单词的形式(第6行)。例如，‘jumped’和‘jumps’被改为root术语‘jump’。停用词的移除是删除最常用单词的过程，例如‘a’和‘the’(第6行)。
算法1

实体发现模块
实体发现模块是我们提出的框架的主要构件模块之一。实体发现模块的主要任务是识别自由文本中的生物医学概念，应用n-garm算法，并且实现概念消歧。识别生物医学概念是一项具有挑战性的任务，我们通过将每个实体或者符合实体映射到UMLS概念和LOD类来攻克这些任务。算法2是实体检测和显示实体发现模块的伪代码。为了实现实体和UMLS概念ID之间的映射，我们使用了MetaMap API，它提出了一种基于计算语言技术的知识密集型方法(第3-5行)。为了执行实体和LOD类之间的映射，算法2执行了3个步骤：a)从句子中排除停用词和动词(第6行)；b)它使用n-garm方法，识别了多词的实体(例如糖尿病，颅内动脉瘤)，窗口大小在unigram和8-gram范围内(第7行)；c)之后，它使用owl:类和skos:概念谓词(第9-13行)来查询LOD以识别概念。例如，算法2将Antiandrogenic 视为概念，如果LOD中有一个三元组，例如三元组“bio: Antiandrogenic rdf:type owl:Class”或者“bio: Antiandrogenic rdf:type skos:Concept”，其中bio是与本体相关的命名空间。我们的详细分析表明，使用UMLS和LOD(LLD或BioPortal)作为混合解决方案可以提高实体发现的准确性和召回率。但是，使用LOD发现概念有一个共同引用的问题，当单个URI标识多个资源时会发生该问题。例如，LOD中的许多URI用于标识单个坐着，实际上，有许多人具有相同的名称。在生物医学领域，“普通感冒”概念可能与天气或者疾病相关。因此，我们通过自适应Lesk算法来识别概念之间的语义相关性，将概念消歧应用于识别正确的资源(第15-17行)。基本上，我们使用概念的定义来测量与文本中其他发现的概念定义相重叠，然后我们将选择满足阈值并具有高重叠性的概念。
算法2

语义实体丰富技术模块
为了提高本体生成中的语义交互性，语义丰富模块旨在通过将概念与LOD中定义的相关概念相关联，能够自动地将标准的语义来丰富概念以及隐式的相关资源。语义实体丰富模块通过实体发现模块读取所有发现的概念，并且使用了可以被机器处理的其他明确定义的信息来丰富每个概念。图2中给出了语义实体丰富输出的示例，并且算法3给出了用于语义实体丰富模块的伪代码。
图2

算法3

我们提出的语义丰富过程总结如下：

算法3采用了由算法二提取出来的概念和λ (图中祖先的最大级别)作为输入(第1行)
对于LOD中具有谓词的三元组(label, altlabel, preflabel)(第6-19行)
2.1 应用精确匹配(输入概念，谓词的值)(第8-12行)
2.1.1将三元组提取为‘altlabel 或/和 preflabel’
2.2 通过查询skos从LOD中找出概念的定义:定义以及skos:关于优选资源的注释(第13-15行)
2.3 通过分析URIs来识别已定义概念的关系(第16行)
2.4 通过将概念映射到UMLS语义类型来获取概念的语义类型，由于一个概念可能映射到多个语义类型，因此我们会考虑所有的语义类型(第17行)
2.5 获取概念的层次结构，这是一项具有挑战性的任务。在我们提出的框架中，我们使用图算法，就因为我们将LOD视为大的有向图。广度优先搜索用于遍历具有skos:broader或owl:subclass或者skos:narrower edge的节点。它允许由输入λ 能够控制多级的层次结构(第18行)。

RDF三元组提取模块
RDF三元组提取模块的主要目标是识别LOD中明确定义了的三元组，它表示输入生物医学文本中两个概念之间的关系。我们提出的方法使用图表方法为三元组挖掘提供了一种独特的解决方案，测量LOD中现有的三元组相关性，以及生成了候选的三元组。

在我们提出的算法4三元组提取中，广度优先搜索的图形调用的深度是可以配置的，并且同时提供可伸缩性和效率。我们在第4行将深度设置为最佳值5，以获得最佳结果和性能。第5行使用BFS算法检索描述源输入概念的所有三元组。算法4仅考虑表示两个不同概念的三元组。第7-18行中的代码通过匹配标签、同义词、重叠定义和重叠层次结构来衡量相关性。为了尽可能的增强三元组的提取，我们将匹配阈值设置为70%(算法4第13,15,17行)以在我们的评估中消除三元组的噪声。有关深度和阈值的更多详细信息，请参阅后面的讨论部分。

此外，该模块还有一个子任务，通过使用我们的算法URI_Ranking对给定概念的URI进行语义排序。通过资源匹配的标签或altlabel从LOD检索URI。例如，资源http://linkedlifedata.com/resource/ diseaseontology/id/DOID:8440 中diseaseontology/id/DOID:8440 就是针对给定概念“ileus”的检索。检索URI的主要挑战之一是当一个概念可以由多个URIs表示时，例如，概念“ileus”可以由多个表示(表3)。

为了解决这个问题，我们提出了算法URI_Ranking，用于根据每个概念的相关性对URI进行排序。更确切的说，对于给定的概念，目标是生成URI的排名，因此会为每个URI分配一个正的实际值，如果需要，可以从中进行序数排序。在一个简单的形式中，我们的算法URI_Ranking首先为每个每个URI分配一个数字进行加权，一个包含UMLS语义类型和组类型的特征向量。然后它测量与算法5中写的相同概念相关的每两个URI的向量之间的平均余弦相关性。最后，它将根据它们的数字加权对它们进行排序。
表3

语法模式模块
在我们提出的方法中，语法模式模块执行模式识别找到自由文本中的两个概念之间的关系，如图3所示。模式库是通过使用Freepal的观察者关系提取所有生物医学的模式而构建的。之后，我们请专家将获得的模式与他们与健康生命自会的观察者关系进行了映射。在表4中，我们提供了模式样本及其相应的观察关系和映射谓词。在下一阶段，我们开发一种算法，该算法读取了句子，循环遍历所有的模式，应用解析，然后将匹配的模式转换为三元组。该算法利用语义丰富信息，例如如果模式和句子中任何发现的概念不匹配，则使用概念同义词，这将导致召回率的增加，重要的是该算法不区分大小写。
图3

表4

本体库
该模块在我们提出的框架中起着核心的作用，在我们的框架中，它使用诸如RDF，RDFS，OWL和SKOS之类的本体语言自动化编码语义丰富信息的过程，并使候选三元组变成本体。我们在Open Biomedical Ontologies(OBO)格式中选择了W3C规范本体，因为它们为语义Web提供了明确定义的标准，从而加速了本体的开发和维护。此外，它们支持基于规则来推断复杂的属性。我们提出的框架生成本体的一个例子如图4所示。

在本体库的背景下，有两个输入需要生成类，属性，is-a关系和关联关系。这两个输入是：1)来自语义丰富模块的概念语义丰富，2)来自RDF三元组提取以及句法模式模块的候选三元组。可以使用语义丰富技术来生成许多关系。最初，通过使用获得的概念简单地声明命名类来定义特定领域的根类。使用表示概念排名最高的URI为每个获得的类定义类标识符(URI引用)。在定义每个获得的概念的类之后，再定义其他的语义关系。例如，概念可以具有父概念和子概念，提供可以使用获得的层次关系定义的属性rdfs:subClassof。另外，如果概念具有同义词，则给出等价的定义，“preflabel”属性将用来获得优选概念， “inscheme”属性将用来获得关系。表5给出了LOD-ABOG生成关系的几个例子。
图4

表5

评估
我们提出的方法提供了一个由LOD驱动的新颖、简介、简单的框架。我们使用了三种不同的本体演化方法来评估我们的自动本体生成框架。首先，我们开发并使用我们的自动化生成生物医学本体算法，使用CDR语料库和SemMedDB基于任务评估我们的框架。其次我们使用了阿尔兹海默症本体作为baseline进行了基于本体评估。第三，我们将我们提出的框架与成为“OntoGain”的最先进的本体学习框架进行了比较，我们使用了Apache Jena框架，这是一个提供丰富的交互式工具的开发环境，我们使用了4核的Intel® Core™ i7-4810MQ CPU @ 2.80 GHz和64位的Java JVM进行了实验。此外，在我们的评估过程中，我们发现尸体可以包含单个概念词或者多词的概念。因此，我们只考虑长概念匹配而忽略了短概念以提高精度。此外，我们还发现了一个限制，因为实体和缩写的数量很大，所有实体都无法映射到UMLS中的概念ID。例如，实体“Antiandrogenic”在UMLS中没有概念ID，为了解决这个问题，我们考虑了基于LOD的技术。此外，我们引用了不同的窗口大小，范围从1-8作为了N-gram方法的输入。然而，我们发现窗口大小等于4的时候是最佳的，因为其他值降低了实体检测模块的性能，召回率很低，并且当窗口大小小于4时的平均精度。另一方面，召回率增加时窗口大小大于4但精度非常低。
数据集
对于任务基础评估，首先我们使用CDR Corpus标题作为实体发现和评估的输入和标准：带注释的CDR语料库包含1500个PubMed标题的化学品，疾病和化学诱导的疾病关系，其中2017年医学主题标题(Mesh Synonym) 已被用作同义词提取和评估的标准。此外，我们还使用了疾病本体(DO)和生物利益化学实体(ChEBI)为CDR中所有发现的概念手动建立更广泛层次关系的黄金标准。

另一方面，我们使用DISEASE/TREATMENT实体数据集之间的关系作为非等级关系发现评估的标准。接下来，对于任务库评估，我们下载了语义MEDLINE数据库(SemMedDB)版本31，2017年12月发布，这是一个生物医学语义预测的存储库，由NLP程序SemRep从MEDLINE摘要中提取。我们从SemMedDB构建了基准数据集。数据集由50000个句子组成，代表SemMedDB中存在的所有关系类型。此外，我们为每个语义预测提取了所有语义预测和实体，并且分别将它们用作关系提取和概念提取评估的基准。

对于本体的基准评估，我们从2017年1月至2018年4月期间发布的MEDLINE引文中选择了40000个与“阿尔兹海默症”领域相关的标题。此外，我们提取了阿尔兹海默症本体的子图。从阿尔兹海默症本体中提取子图的过程是通过以下步骤完成的：a)我们从Bioportal下载了完整的阿尔兹海默症本体作为OWL文件，b)使用Jena API将OWL文件上传为模型图，c)检索到与实体“阿尔兹海默症”匹配的概念，d)在步骤c中检索的属性(同义词)和提取的概念的关系。这个结果子图包含500个概念，1420个关系和500个属性(同义词)。

结果

为了评估我们提出的实体发现能力来分类上下文中提到的概念，我们注释了化学品和疾病的CDR语料库标题。在此评估中，我们使用精度，召回率和F测量值作为评估参数。精度是注释的正确的概念与注释概念总数的比值，等式1.然而召回率是注释的正确的概念与和标准中的正确概念的总数的比值，等式2。F值是精度和召回率的调和平均值，如公式3所示。

表6比较了MetaMap, LOD以及混合方法的精确度，召回率和F值。另外，非层次抽取的评估结果也将通过公式6的召回率来表示，精确度如公式7，F值如公式8表示。表8比较了非层次抽取的精度，召回率和F值。主要本体生成任务的结果在图5中以图形的形式进行了描述。然而，我们使用最先进的本体获取工具之一评估了我们提出的框架：即OntoGain。我们选择了OntoGain工具，因为它是最新的工具之一，已经使用医学领域进行了评估，输出的结果是OWL。图6和图7描述了我们提出的框架与使用召回率和准确率在OntoGain工具之间的比较，这些数字表明了LOD在本体生成中的有效性。
表6

表7

公式1-7

表8

图5

此外，我们将所提出的框架中生成的本体论与领域专家构建的阿尔兹海默症本体进行了比较。表9给出了比较的结果。结果表明，概念检测的F值为72.48%，关系抽取的F值为76.27%，属性抽取的F值为83.28%。这表明我们提出的框架的表现是让人满意的。但是，领域专家在验证阶段还可以进一步改进F值。表10比较了我们对SemMedDB的概念和关系的提取结果。
表9

表10

讨论

我们的深度分析显示了LOD在自动本体生成中的有效性。此外，重新使用静心设计的本体将提高本体生成的准确性和质量。所有这些措施都解决了现有本体生成的一些缺点。此外，表6中的评价结果表明我们的概念发现方法非常好，并且与文献中报道的结果相匹配。但是，图6和图7显示OntoGain优于我们的概念发现方法。鉴于OntoGain仅考虑计算多词概念的精确度和召回率。在分层提取任务中，我们的层次结构提取比OntoGain具有显著的改进结果。同样，与OntoGain相比，我们对非分类学提取的句法模式方法提供了更好的结果。在算法4中，我们使用阈值参数δ来提高提取非层次关系的准确性。我们发现将δ值设置为低值时会产生很多噪声关系，而增加它会产生更好的准确度。但是，将δ设置为高于70%的值时，会产生较低的召回率。此外，我们使用深度参数γ来控制LOD中提取知识的深度。当γ在[1,2]范围内时，我们观察到较小程度的域覆盖，但当γ在范围内时，覆盖率逐渐提高[3,5]。然而，当γ> 5时，噪声数据增加得如此之快。
图6

图7

虽然本体论中定义的关系是有限的，例如，疾病本体只定义了层次关系，很少有非层次关系被定义。这就像大多数现有的没有定义rdfs:domain等约束的本体一样，它有助于提高本体提取系统进行准确推理的能力。尽管Linked Open Data带来了好处，但由于其部分性能问题，它在工业互联网和医疗保健领域的应用未受到充分的欢迎。为了纠正它的缺陷，我们提出了一种使用广度优先搜索的图遍历方法，这种方法可以提高从一个节点移动到另一个节点的速度，而无需编写非常复杂的查询。如表10所示，与SemMedDB相比，概念提取和层次关系提取任务具有竞争力。然而，由于语法模式的限制，非层次结构提取显示了低的召回率，因此改进非层次结构的提取使我们未来工作的一部分。此外，领域专家在核查阶段可以进一步提高我们提出的框架的准确性和召回率。结果是令人兴奋的，表明我们可以缩小对劳动力的需求。此外，该框架将使专家能够以更有效的方式来执行本体工程。

结论

本体是语义网络愿景的基石。此外，它提供了对特定域中的概念，重用域知识和数据互操作性的共同和共享理解。然而，手动本体构建是一项复杂的任务，并且非常耗时。因此，我们提出了一个完全自动化的本体生成框架，该框架由生物医学链接开放数据授权，集成了自然语言处理，语法模式，图算法，语义排序算法，语义丰富和RDF三元组挖掘，使自动大规模机器处理成为可能，最小化和缩小需求和复杂性，并提高本体生成的准确性。本体不仅用于更好的搜索，数据互操作性和内容呈现，但更重要的是，它代表了管理休眠内容资产和将Web文档转换为Web of Data的未来创新方法的基础。
未来工作
我们未来的工作包括扩展框架以支持非生物医学领域本体生成。此外，我们计划将机器学习和语义预测库（SemMedDB）集成到框架中，以进一步改进概念的F-度量和非层次关系提取。

你可能感兴趣的:(论文阅读)

[论文阅读]Distilling Step-by-Step! Outperforming Larger Language Models with Less Training Data and Smal 0x211 论文阅读语言模型人工智能自然语言处理
中文译名：逐步蒸馏！以较少的训练数据和较小的模型规模超越较大的语言模型发布链接：http://arxiv.org/abs/2305.02301AcceptedtoFindingsofACL2023阅读原因：近期任务需要用到蒸馏操作，了解相关知识核心思想：改变视角。原来的视角：把LLMs视为噪声标签的来源。现在的视角：把LLMs视为能够推理的代理。方法好在哪？需要的数据量少，得到的结果好。文章的方法
【论文阅读】【IEEE TCYB 2023】Edge-Guided Recurrent Positioning Network forSalient Object Detection in Opt
引言任务：光学遥感图像中显著目标检测论文地址：Edge-GuidedRecurrentPositioningNetworkforSalientObjectDetectioninOpticalRemoteSensingImages|IEEEJournals&Magazine|IEEEXplore代码地址：前置知识一、摘要目前由于光学rsi中目标类型多样、目标尺度多样、目标方向众多以及背景杂乱，现有S
大模型服务的推理优化探索半吊子全栈工匠
【引】有的事情别人不问时我们明白，一旦要我们解释它我们就不明白了，而这正是我们必须留心思索的东西。于是，开启了一次又一次的论文阅读之旅。开发并部署大模型应用肯定要考虑它们的服务成本。然而，钱并不是唯一的考虑因素，如果不能解决模型性能方面的问题，即使有很大的预算，大模型服务仍会受到影响。本文尝试讨论将LLM推理服务更改为高吞吐量引擎的挑战与应对方法。1.大模型服务面临的挑战大模型的能力令人惊叹，但其
ER综述论文阅读-Emotion recognition in EEG signals using deep learning methods: A review 今天早睡了情绪识别Emotion Recognition 论文阅读深度学习人工智能
EmotionrecognitioninEEGsignalsusingdeeplearningmethods:AreviewQ1期刊，2023论文链接：https://d1wqtxts1xzle7.cloudfront.net/105887899/emotionreview-libre.pdf?1695460941=&response-content-disposition=inline%3B+f
【论文阅读】AdaCtrl: Towards Adaptive and Controllable Reasoning via Difficulty-Aware Budgeting quintus0505 LLM 论文阅读语言模型
AdaCtrl:TowardsAdaptiveandControllableReasoningviaDifficulty-AwareBudgeting3Method3.1长度触发标签作为控制接口（Length-TriggerTagsasControllingInterface）3.2冷启动微调（Cold-startfine-tuning）3.3难度感知的强化学习框架（Difficulty-awar
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
【论文阅读】Decoupled Knowledge Distillation Bosenya12 论文阅读
摘要：最先进的蒸馏方法主要基于从中间层蒸馏出深层特征，而logit蒸馏的重要性则被大大忽视了。为了提供研究logit蒸馏的新观点，我们将经典的KD损失重新表述为两部分，即目标类知识蒸馏（TCKD）和非目标类知识蒸馏（NCKD）。我们实证调查并证明了两部分的效果：TCKD传递了有关训练样本“困难”的知识，而NCKD是logit蒸馏起作用的突出原因。更重要的是，我们揭示了经典的KD损失是一个耦合公式，
【论文阅读】Transfer Learning for Automatic Modulation Recognition Using a Few Modulated Signal Samples
摘要：这封信提出了一种用于自动调制识别（AMR）的迁移学习模型，该模型仅具有少量调制信号样本。传输模型以音频信号UrbanSound8K作为源域进行训练，然后以一些调制信号样本为目标域进行微调。为了提高分类性能，信噪比（SNR）被用作一个功能来促进信号的分类。仿真结果表明，迁移模型在分类精度方面具有显著优势。这篇文章的核心内容是提出了一种基于迁移学习（TransferLearning）的自动调制识
【论文阅读】Meta-SE: A Meta-Learning Framework for Few-Shot Speech Enhancement Bosenya12 论文阅读
这篇文章介绍了一个名为Meta-SE的元学习框架，专门用于少样本（few-shot）语音增强问题。文章的核心目标是解决在实际应用中，由于训练样本有限而导致传统深度神经网络（DNN）模型性能受限的问题。Meta-SE通过元学习的方法，利用先验的元知识快速适应新的任务和噪声类型，即使只有少量训练样本也能表现出色。背景知识与研究动机语音增强技术旨在从带噪语音信号中恢复目标语音，提升语音质量和可懂度。深度
【论文阅读】SASLN：小样本条件下机械故障诊断的信号增强自学习网络
SASLN:SignalsAugmentedSelf-TaughtLearningNetworksforMechanicalFaultDiagnosisUnderSmallSampleCondition本文介绍了一种名为SASLN（SignalsAugmentedSelf-TaughtLearningNetworks）的方法，专门用于在小样本条件下对风力发电机（WT）的发电机轴承故障进行诊断。该方
【论文阅读】SSCL-AMC：一种基于动态增强和集成学习的自监督自动调制分类方法
SSCL-AMC:ASelf-supervisedAutomaticModulationClassificationMethodviaDynamicAugmentationandEnsembleLearning摘要：与传统的手工自动调制分类（AMC）方法相比，深度学习已经显示出有希望的结果，AMC作为信号检测和调制之间的中间步骤发挥着关键作用。然而，获取大规模标记数据仍然具有挑战性，因为数据质量和
[论文阅读] 人工智能 + 软件工程 | 当 LLM 写代码时，它的 “思考过程” 靠谱吗？—— 揭秘 CoT 质量的那些事儿张较瘦_ 前沿技术论文阅读人工智能软件工程
当LLM写代码时，它的“思考过程”靠谱吗？——揭秘CoT质量的那些事儿论文标题：AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenerationarXiv:2507.06980[pdf,html,other]AreTheyAllGood?EvaluatingtheQualityofCoTsinLLM-basedCodeGenera
[论文阅读] 人工智能 + 软件工程 | 需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破
需求获取访谈中LLM生成跟进问题研究：来龙去脉与创新突破论文标题：RequirementsElicitationFollow-UpQuestionGenerationarXiv:2507.02858RequirementsElicitationFollow-UpQuestionGenerationYuchenShen,AnmolSinghal,TravisBreauxComments:13page
Prompt相关论文阅读(02)--Auto-CoT(2024-11-25) zhilanguifang 论文 prompt engineering 论文阅读笔记
论文阅读笔记2024-11-24~2024-11-25Auto-CoT:AutomaticChainofThoughtPromptinginLargeLanguageModels(ICLR2023)碎碎念：复现代码和笔记保存到gitee仓库上海交通大学的学生在亚马逊实习的时候的成果ICLR2023摘要：LLM能够通过生成中间推理步骤执行复杂的推理。提供这些步骤用于提示演示叫做思维链提示CoT。Co
【论文阅读】Dynamic Few-Shot Visual Learning without Forgetting Bosenya12 论文阅读
系统概述如下：(a)一个基于卷积神经网络（ConvNet）的识别模型，该模型包含特征提取器和分类器；(b)一个少样本分类权重生成器。这两个组件都是在一组基础类别上训练的，我们为这些类别准备了大量训练数据。在测试阶段，权重生成器会接收少量新类别的训练数据以及基础类别的分类权重向量（分类器框内的绿色矩形），并为新类别生成相应的分类权重向量（分类器框内的蓝色矩形）。这样，卷积神经网络就能同时识别基础类别
【论文阅读】Few-Shot PPG Signal Generation via Guided Diffusion Models Bosenya12 论文阅读
从少量样本数据选择到后处理的整体框架。首先，扩散模型在N样本数据集和指导下的训练。接着，模型生成一个增强的数据集，并进一步优化以提高保真度。最后，这些合成数据与少量样本训练数据集结合，用于基准模型的训练和评估。数据分布从最初的红色变为保真度增强的蓝色，这表明模型与真实数据更加吻合，如简化后的数据分布示意图所示。这篇文章的核心内容是介绍了一种名为BG-Diff（Bi-GuidedDiffusion）
[论文阅读] 人工智能 | 读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法张较瘦_ 前沿技术论文阅读人工智能
读懂Meta-Fair：让LLM摆脱偏见的自动化测试新方法论文标题：Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsarXiv:2507.02533Meta-Fair:AI-AssistedFairnessTestingofLargeLanguageModelsMiguelRomero-Arjona,JoséA.Parejo,Jua
【LLM论文阅读】一只齐刘海的猫论文阅读
LLM论文阅读论文重点论文链接RopeRoFormer:EnhancedTransformerwithRotaryPositionEmbeddingRoPE论文阅读YarnUnderstandingYaRN:ExtendingContextWindowofLLMs论文YaRN笔记T5ExploringtheLimitsofTransferLearningwithaUnifiedText-to-Te
Segment Anything in High Quality之SAM-HQ论文阅读 qq_41627642 深度学习论文阅读论文阅读
摘要最近的SegmentAnythingModel（SAM）在扩展分割模型规模方面取得了重大突破，具备强大的零样本能力和灵活的提示机制。尽管SAM在训练时使用了11亿个掩码，其掩码预测质量在许多情况下仍不理想，尤其是对于结构复杂的目标。我们提出了HQ-SAM，使SAM能够精确地分割任意目标，同时保留其原有的可提示设计、高效性和零样本泛化能力。我们的设计充分复用并保留了SAM预训练的模型权重，仅引入
yolov算法详解_yolo 目标检测算法个人总结（yolov1） CHAO JIANG yolov算法详解
yolo目标检测算法个人总结目前yolo目标检测有两个版本，分别为v1和v2。因工作需要用yolo算法检测人物，所以这段时间重点看了这两篇论文，并实现了对应的tensorflow代码。这里记录下在论文阅读过程中的一些细节信息，留给自己，同时也希望各位能指出本人理解错误的地方，谢谢！一：yolov1关于yolov1算法的详解在网上已经非常多了，在这里我大概叙述下算法的流程，以及在开发过程中遇到的一些
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量 ICCL 2022 365JHWZGo 情感对话论文阅读 gpt-3 共情回复上下文学习提示学习大模型
《论文阅读》GPT-3是否会产生移情对话？一种新的情境示例选择方法和用于生成同理心对话的自动评估度量ICCL2022前言贡献PromptIn-contextlearningSITSMEMOSITSM新的自动指标实验前言亲身阅读感受分享，细节画图解释，再也不用担心看不懂论文啦~无抄袭，无复制，纯手工敲击键盘~今天为大家带来的是《DoesGPT-3GenerateEmpatheticDialogues
[论文阅读] 人工智能 + 软件工程 | 揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究张较瘦_ 前沿技术论文阅读人工智能软件工程
揭秘ChatGPT在软件开发问题解决中的有效性：一项实证研究论文：WhatMakesChatGPTEffectiveforSoftwareIssueResolution?AnEmpiricalStudyofDeveloper-ChatGPTConversationsinGitHubarXiv:2506.22390WhatMakesChatGPTEffectiveforSoftwareIssueRe
[论文阅读] 人工智能 + 软件工程 | 代码注释不一致问题研究：从数据革新到端到端解决方案张较瘦_ 前沿技术论文阅读人工智能软件工程
代码注释不一致问题研究：从数据革新到端到端解决方案原文：CCISOLVER:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyarXiv:2506.20558CCISolver:End-to-EndDetectionandRepairofMethod-LevelCode-CommentInconsistencyRe
Learning Fully Convolutional Networks for Iterative Non-blind Deconvolution论文阅读青铜锁00 #退化论文阅读深度学习论文阅读图像处理
LearningFullyConvolutionalNetworksforIterativeNon-blindDeconvolution1.研究目标与实际问题1.1研究目标1.2实际意义2.创新方法与模型设计2.1核心框架：迭代式梯度域处理2.1.1模型架构2.2关键技术实现2.2.1梯度域去噪网络2.2.2解卷积模块（核心公式实现）2.2.3损失函数设计2.2.4超参数端到端学习2.3与传统方法
KAIST数据集及使用草莓奶忻 SLAM基础 #SLAM数据集 ubuntu
文章目录KAIST复杂城市数据集KAIST数据集转换为rosbag1.将.gz.tar文件解压到其文件夹中2.克隆并构建此存储库3.使用路径和所需主题编辑配置文件4.为每种传感器类型创建一个rosbag文件5.将所有bag合并为一个参考KAIST复杂城市数据集KAIST-Urban-数据集-论文阅读数据集下载：ComplexUrbanDataset复杂城市数据集KAIST数据集转换为rosbag1
[论文阅读] 软件工程 | 需求工程中领域知识研究：系统映射与创新突破张较瘦_ 前沿技术论文阅读软件工程
需求工程中领域知识研究：系统映射与创新突破论文信息DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyarXiv:2506.20754DomainKnowledgeinRequirementsEngineering:ASystematicMappingStudyMarinaAraújo,JúliaAraújo,RomeuO
论文阅读：2025 arxiv Qwen3 Technical Report
https://arxiv.org/pdf/2505.09388https://www.doubao.com/chat/9918384373236738文章目录论文翻译Qwen3技术报告摘要1引言论文翻译Qwen3技术报告Qwen团队摘要在这项工作中，我们介绍了Qwen模型家族的最新版本Qwen3。Qwen3包含一系列大型语言模型（LLM），旨在提升性能、效率和多语言能力。Qwen3系列包括密集型
[论文阅读] 软件工程 | 探索软件生态系统中的开发者体验关键因素
探索软件生态系统中的开发者体验关键因素：从研究到实践引文格式@article{Zacarias2025,title={ExploringDeveloperExperienceFactorsinSoftwareEcosystems},author={Zacarias,RodrigoOliveiraandAntunes,L{\'e}oCarvalhoRamosandBarros,M{\'a}rciod
Fast Image Deconvolution using Hyper-Laplacian Priors论文阅读青铜锁00 #退化论文阅读论文阅读图像处理
FastImageDeconvolutionusingHyper-LaplacianPriors1.论文的研究目标与实际意义2.论文的创新方法2.1核心框架：交替最小化（AlternatingMinimization）2.2x子问题：频域FFT加速2.3w子问题：高效求解的核心创新2.3.1问题形式2.3.2查找表法（LUT）2.3.3解析解法（特定α\alphaα）2.3.4通用α\alphaα
[论文阅读] 人工智能 + 软件工程 | AI 与敏捷开发的破局之路：从挫败到成功的工作坊纪实张较瘦_ 前沿技术论文阅读人工智能软件工程
AI与敏捷开发的破局之路：从挫败到成功的工作坊纪实论文信息arXiv:2506.20159AIandAgileSoftwareDevelopment:FromFrustrationtoSuccess–XP2025WorkshopSummaryTomasHerda,VictoriaPichler,ZheyingZhang,PekkaAbrahamsson,GeirK.HanssenSubjects:
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s