刘永鑫Adam

Cell：20种宏基因组学物种分类工具大比拼

文章目录

宏基因组学物种分类工具评测

日报
摘要
主要结果

图1. 从宏基因组样本到物种组成
图2. 评估分类表现的重要指标
表1. 分类器评估指标汇总
图3. 评估AUPR得分
图4. 评估L2距离
图5. 种水平分类比例
图6. 在ATCC均匀样本数据集中检测到的物种数量与最小丰度阈值的关系
图7. 计算资源消耗评测

Reference
猜你喜欢
写在后面

宏基因组学物种分类工具评测

Benchmarking Metagenomics Tools for Taxonomic Classification

Cell, [36.216]

2019-08-08 Review

DOI: https://doi.org/10.1016/j.cell.2019.07.010

全文可开放获取 https://www.cell.com/cell/fulltext/S0092-8674(19)30775-5

第一作者：Simon H. Ye^1,2,*

通讯作者：Simon H. Ye^1,2,*

其它作者：Katherine J. Siddle, Daniel J. Park, Pardis C. Sabeti

作者单位：

¹ 麻省理工学院，哈佛-麻省理工健康科学与技术中心(Harvard-MIT Health Sciences and Technology, Massachusetts Institute of Technology, Cambridge, MA 02139, USA)

² 麻省理工学院和哈佛大学博德研究所(Broad Institute of MIT and Harvard, Cambridge, MA 02142, USA)

日报

有多种软件可用于宏基因组数据的物种分类，但缺少系统的评估；
本文介绍了当前主流宏基因组分析方法，并对20个分类软件进行了系统评估；
同时介绍了评估的关键指标，为更多分类软件的评测提供了框架；
对数据库建索引步骤的资源消耗评估，有助于用户选择自建索引或使用同行已建索引；
对软件运行中内存、线程数和时间使用的评估，有利于根据自身硬件条件选择合适的软件和分析方案，预估项目所需时间。

主编评语：宏基因组测序正在彻底改变微生物物种的检测和表征，但目前软件太多，令同行选择非常困难。近日Cell杂志发文对物种分类软件系统进行了系统的评估，此文结果对同行根据自己实际情况选择最符合自身硬件条件的分析方案提供指导，以便获得较优结果。同时也为开发相关软件的同行，提供了一套系统评估软件性能的框架。

摘要

宏基因组测序正在彻底改变微生物组中物种的检测和表征，并且有多种软件工具可用于对这些数据进行分类学分类。这些工具的快速发展和宏基因组数据的复杂性使得研究人员能够对其性能进行基准测试非常重要。在这里，我们回顾了当前的宏基因组分析方法，并使用模拟和实验数据集评估了20个宏基因组分类器的性能。我们描述了用于评估性能的关键指标，为其他分类器的比较提供了框架，并讨论了宏基因组数据分析的未来。

Metagenomic sequencing is revolutionizing the detection and characterization of microbial species, and a wide variety of software tools are available to perform taxonomic classification of these data. The fast pace of development of these tools and the complexity of metagenomic data make it important that researchers are able to benchmark their performance. Here, we review current approaches for metagenomic analysis and evaluate the performance of 20 metagenomic classifiers using simulated and experimental datasets. We describe the key metrics used to assess performance, offer a framework for the comparison of additional classifiers, and discuss the future of metagenomic data analysis.

主要结果

图1. 从宏基因组样本到物种组成

Figure 1 Processing Steps to Go from a Complex Metagenomic Sample to an Abundance Profile of Sample Content

图2. 评估分类表现的重要指标

Figure 2 Metrics Used for Evaluating Classifier Performance

AUPR(area under the precision-recall
curve, 准确-召回曲线下的面积)和L2(straight-line distance between the observed and true abundance vectors，实际与预测间的直线距离)距离是两个互补的指标，分别提供对分类器准度-召回和丰度估计准确性的评估。综合以上指标，它们提供了易于解释的分类器性能图，可用于比较分类器。

AUPR and L2 distance are two complementary metrics that provide insight into the accuracy of a classifier’s precision-recall and abundance estimates, respectively. Considered together, they provide a readily interpretable picture of classifier performance and can be used to compare classifiers.

表1. 分类器评估指标汇总

Table 1 A List of Benchmarked Classifiers and Their Various Characteristics

主要包括数据库是否可定制，能否产生丰度组成长，内存消耗，时间消耗等。

“自定义数据库”是指最终用户创建自定义数据库的能力。时间和内存要求是基于一个570万个序列的数据集，数据库和输入文件已经缓存在内存中。某些方法（标记为“变化”）能够灵活地降低其内存使用量（以运行时间的大量增加为代价）。
^a最新版本的PathSeq现在允许用户创建和指定自定义数据库，但在执行基准测试时，此选项不可用; 因此，它被排除在这些分析之外。

“Custom databases” refers to the ability for the end user to create a custom database. The time and memory requirements are for a 5.7 million-read dataset with the database and input already cached in memory. Some methods (marked as “varies”) have the ability to flexibly decrease their memory usage (at the cost of a massive increase in run time).

^aThe latest version of PathSeq now allows the user to create and specify a custom database, but this option was not available when benchmarking studies were performed; thus, it was excluded from those analyses.

图3. 评估AUPR得分

Figure 3 Benchmark AUPR Scores

（A）物种水平上每个分类器的准确-召回率曲线（AUPR）得分下的面积（更高的值更好）。每个绘图点代表（分类器，数据集组合）的得分。分类器按其目标类进行分组和着色（蓝色为DNA，橙色为蛋白，红色为DNA标记）。

（B）AUPR用于统一的RefSeq CG数据库而不是默认数据库。 RefSeq CG图上缺少条目是无法创建自定义数据库的分类器。可以看到，在相同数据库下，各软件表现结果差异并不大。有关其他信息，请参见图S1-S4。

(A) Area under the precision-recall curve (AUPR) scores for each classifier at the species level (a higher value is better). Each plot point represents the score for a (classifier, dataset combination). Classifiers are grouped and colored by their target class.
(B) AUPR for the uniform RefSeq CG database instead of default databases. Missing entries on the RefSeq CG plot are classifiers that cannot create custom databases.
For additional information, see Figures S1–S4.

图4. 评估L2距离

Figure 4 Benchmark L2 Distances

（A）每个分类器的物种丰度分布与真实组合物之间的距离（较低的值更好）。每个绘图点表示（分类器，数据集）组合的L2距离。分类器按其目标类进行分组和着色。

（B）使用统一的RefSeq CG数据库的丰度距离。缺少的条目是无法创建自定义数据库的分类器。

（C）跨模拟数据集的分类器之间的中位数成对L2标准丰度的层级聚类。非黑色簇对应颜色是0.09相似度阈值的组。彩色框对应于方法类型：DNA，蛋白质和标记分类器。 “k”注释表示基于k-mer方法。
有关其他信息，请参见图S6。

(A) Distance between the species abundance profile for each classifier compared with the true composition (a lower value is better). Each plot point represents the L2 distance for a (classifier, dataset) combination. Classifiers are grouped and colored by their target class.
(B) Abundance distance using the uniform RefSeq CG database. Missing entries are classifiers that cannot create custom databases.
© Median pairwise L2 abundance norms between classifiers across simulated datasets, hierarchically clustered. Non-black cluster link colors are groups at a 0.09 similarity threshold. Colored boxes correspond to the method type: DNA, protein, and marker classifiers. The “k” annotation indicates k-mer-based methods.
For additional information, see Figure S6.

图5. 种水平分类比例

Figure 5 Proportion of Abundance Classified at the Species Rank

（A）用默认数据库分类物种水平的样本丰度比例。

（B）使用统一的RefSeq CG数据库。仅显示允许自定义数据库的程序。有关其他信息，请参见图S5。

(A) Proportion of sample abundance classified at the species rank with default databases.
(B) Using uniform RefSeq CG databases. Only programs allowing custom databases are shown.
For additional information, see Figure S5.

图6. 在ATCC均匀样本数据集中检测到的物种数量与最小丰度阈值的关系

Figure 6 Number of Species Classified versus Minimum Abundance Threshold Detected in ATCC Even Sample Datasets

每种0.05丰度的20种物种的真实丰度被描绘为黑色虚线。
有关其他信息，请参见图S7-S9。

The truth abundance of 20 species at 0.05 abundance each is depicted as a black dotted line.

图7. 计算资源消耗评测

Figure 7 Benchmark of Computational Resources

[外链图片转存失败(img-ezxoPfX2-1565528683972)(http://210.75.224.110/Note/LiuYongXin/190810Cell/7b.png)]
[外链图片转存失败(img-bh9HwPFp-1565528683973)(http://210.75.224.110/Note/LiuYongXin/190810Cell/7c.png)]

（A）处理含有570万条序列样本所需的时间，而不是第一次运行后的第二次运行所需的时间。对于许多分类器，第二次运行更快，因为样本序列和数据库文件缓存在内存中。 Bracken没有绘制，因为它需要的时间和内存可以忽略不计。

（B）每个分类器在执行期间使用的最大内存，磁盘上数据库大小以及32个可用CPU的平均使用数。

（C）使用各种方法创建RefSeq CG数据库所花费的时间和内存。分类器按照增加的时间排序。 MMseqs2和DIAMOND在数据库构建期间不对基因组进行索引，而是在样本分类期间即时索引。

(A) Time required to process a sample containing 5.7 million reads versus a second run immediately after the first. This second run is faster for many classifiers because sample reads and database files are cached in memory. Bracken is not plotted because it requires negligible time and memory.
(B) The maximum memory utilized by each classifier during execution, the on-disk database size, and average number of CPUs utilized of 32 available.
© Time taken and memory used to create the RefSeq CG database using various methods. Classifiers are sorted by increasing time taken. MMseqs2 and DIAMOND do not index the genomes during database construction but, rather, index on the fly during sample classification.

Reference

https://www.cell.com/cell/fulltext/S0092-8674(19)30775-5

Ye, S.H., Siddle, K.J., Park, D.J., and Sabeti, P.C. (2019). Benchmarking Metagenomics Tools for Taxonomic Classification. Cell 178, 779-794.

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍末解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

IJCAI2024 无脑敲代码，bug漫天飞会议
CallforPapers–IJCAI2024重要日期(所有时间都是地球上的任何地方，UTC-12)摘要提交截止日期:2024年1月10日作者信息截止日期:2024年1月16日论文全文截止日期:2024年1月17日附录和重新提交信息截止日期:2024年1月24日简易拒绝通知:2024年2月22日作者回复时间:2024年3月18日至21日书面通知:2024年4月16日会议:2024年8月3日星期六至
第66期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.利用高级大语言模型
第65期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能网络安全语言模型
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.基于第一性原理的大
特征点提取与匹配原文论文下载长沙有肥鱼视觉SLAM十四讲计算机视觉
ORB原文下载链接：(PDF)ORB:anefficientalternativetoSIFTorSURFSIFT原文下载链接：https://www.cs.ubc.ca/~lowe/papers/ijcv04.pdfSURF原文下载链接:https://www.cs.jhu.edu/~misha/ReadingSeminar/Papers/Bay08.pdfORB和AKAZE对比论文下载链接：h
今日欧美圈：Sam Smith专辑改期，The Box狂揽B榜十周冠胡萝卜音乐
新一期Billboard单曲榜上，《TheBox》狂揽十周冠，DuaLipa热单《Don'tStartNow》升至亚军，LilUziVert有三首歌曲进入前十。SamSmith新专辑《ToDieFor》发行日期推迟到6月5日。新单要来啦！LaurenJauregui宣布新单《Lento》将在3月20日发行。HarryStyles登上BeautyPapers写真释出！在《冰雪奇缘2》中为Honeym
英语精读笔记.新概念第三册(5)The facts确切数字英文研习社
文章原文：Editorsofnewspapersandmagazinesoftengotoextremestoprovidetheirreaderswithunimportantfactsandstatistics.Lastyearajournalisthadbeeninstructedbyawell-knownmagazinetowriteanarticleonthepresident'spal
【AI视野·今日NLP 自然语言处理论文速览第八十二期】Tue, 5 Mar 2024 hitrjj LLM NLP Papers 人工智能自然语言处理 NLP 预训练模型文本摘要情绪识别推理训练
AI视野·今日CS.NLP自然语言处理论文速览Tue,5Mar2024(showingfirst100of175entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersKey-Point-DrivenDataSynthesiswithitsEnhancementonMathematicalReasoningAut
第34期 | GPTSecurity周报 llmaigc
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.Constitu
第39期 | GPTSecurity周报 aigcllm人工智能
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大型语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.BadChain
习题2.3 old bill 513k 王道机试指南数据结构
描述Amonggrandfather’spapersabillwasfound.72turkeys$679Thefirstandthelastdigitsofthenumberthatobviouslyrepresentedthetotalpriceofthoseturkeysarereplacedherebyblanks(denoted_),fortheyarefadedandareillegi
使用动态网格的流体动画 Fluid Animation with Dynamic Meshes 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
目录引言背景方法离散化离散化的导数算子速度插值广义的半拉格朗日步重新网格化双向流固耦合和质量守恒原文：Klingner,BryanM.,etal.“Fluidanimationwithdynamicmeshes.”ACMSIGGRAPH2006Papers.2006.820-825.引言使用[Alliezetal.,2005]的方法动态生成不规则的四面体网格根据边界的位置、边界的形状、基于流体和速
了解和学习OpenAI的方法和途径 ABEL in China 学习 OpenAI
学习和了解OpenAI的资料可以从多个渠道获取，这些渠道涵盖了各种形式的学习资源。以下是一些推荐的学习资料：OpenAI官方网站：OpenAI的官方网站是获取关于该组织最权威和最新信息的地方。你可以在那里找到他们的研究成果、项目介绍、博客文章和新闻公告等。ResearchPapers（研究论文）：OpenAI发表了许多高质量的研究论文，这些论文涵盖了人工智能领域的各个方面。你可以在学术搜索引擎上找
使用八叉树模拟水和烟雾 Simulating Water and Smoke with an Octree Data Structure 论文阅读笔记 hijackedbycsdn Fluid Simulation 笔记
原文：Losasso,Frank,FrédéricGibou,andRonFedkiw.“Simulatingwaterandsmokewithanoctreedatastructure.”Acmsiggraph2004papers.2004.457-462.引言这篇文章扩展了[Popinet2003]的工作，拓展到表面自由流，并且使得八叉树不受限制自适应网格划分的一个缺点是，它的模板不是均匀的，
【AI视野·今日NLP 自然语言处理论文速览第七十八期】Wed, 17 Jan 2024 hitrjj NLP LLM Papers NLP LLM 大语言模型文本处理生成模型
AI视野·今日CS.NLP自然语言处理论文速览Wed,17Jan2024(showingfirst100of163entries)Totally100papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDeductiveClosureTrainingofLanguageModelsforCoherence,Accuracy,andUpdatab
【AI视野·今日Robot 机器人论文速览第七十九期】Thu, 18 Jan 2024 hitrjj 人形机器人触觉 Papers 人工智能机器人声学软体机器人导航多机器人协同触觉感知控制
AI视野·今日CS.Robotics机器人学论文速览Thu,18Jan2024Totally43papers上期速览✈更多精彩请移步主页DailyRoboticsPapersCognitiveDog:LargeMultimodalModelBasedSystemtoTranslateVisionandLanguageintoActionofQuadrupedRobotAuthorsArtemLyk
【AI视野·今日NLP 自然语言处理论文速览第七十九期】Thu, 18 Jan 2024 hitrjj LLM NLP Papers 自然语言处理 LLM 大语言模型对话系统 NLP
AI视野·今日CS.NLP自然语言处理论文速览Thu,18Jan2024Totally35papers上期速览✈更多精彩请移步主页DailyComputationandLanguagePapersDecipheringTextualAuthenticity:AGeneralizedStrategythroughtheLensofLargeLanguageSemanticsforDetectingH
【AI视野·今日CV 计算机视觉论文速览第300期】Tue, 30 Jan 2024 hitrjj 视觉计算机视觉 Papers 计算机视觉视听重建 GaussianSplat 视觉行为分析
AI视野·今日CS.CV计算机视觉论文速览Tue,30Jan2024Totally146papers上期速览✈更多精彩请移步主页DailyComputerVisionPapersComputerVisionforPrimateBehaviorAnalysisintheWildAuthorsRichardVogg,TimoLddecke,JonathanHenrich,SharmitaDey,Mat
【AI视野·今日CV 计算机视觉论文速览第292期】Thu, 18 Jan 2024 hitrjj 视觉计算机视觉 Papers 计算机视觉 CV 生成模型 AIGC 3D 高效计算
AI视野·今日CS.CV计算机视觉论文速览Thu,18Jan2024Totally102papers上期速览✈更多精彩请移步主页DailyComputerVisionPapersGARField:GroupAnythingwithRadianceFieldsAuthorsChungMinKim,MingxuanWu,JustinKerr,KenGoldberg,MatthewTancik,Angj
【AI视野·今日CV 计算机视觉论文速览第293期】Fri, 19 Jan 2024 hitrjj 视觉计算机视觉 Papers 计算机视觉 SAM Segmetation Inpainting 图像感知图像重建
AI视野·今日CS.CV计算机视觉论文速览Fri,19Jan2024Totally103papers上期速览✈更多精彩请移步主页DailyComputerVisionPapersParaHome:ParameterizingEverydayHomeActivitiesTowards3DGenerativeModelingofHuman-ObjectInteractionsAuthorsJeongh
区块链互操作协议 mutourend 区块链区块链
1.引言AlexeiZamyatin等人2019年论文SoK:CommunicationAcrossDistributedLedgers。参考资料[1]2019年论文SoK:CommunicationAcrossDistributedLedgers[2]Alistofblockchain-relatedSoKpapers[3]2021年视频FC21:SoK:CommunicationAcrossD
Android 10.0 动态壁纸 LiveWallpaper 龙之叶技术 framework Android android
前言在Android中，壁纸分为动态与静态两种，但其实两者得本质都是一样。都以一个Service得形式在后台运行，在一个类型为TYPE_WALLPAPER的窗口上绘制内容。也可以这么去理解：静态壁纸是一种特殊的动态壁纸，它仅在窗口上渲染了一张图片，而不会对用户的操作做出反应。动态壁纸不能只应用于锁屏。壁纸实现时涉及的几个主要的类：WallpaperService及其内部类Engine：壁纸在Wal
矩阵与计算机论文,数字图像处理中矩阵变换的应用探索-数字图像处理论文-计算机论文.docx... weixin_39977642 矩阵与计算机论文
数字图像处理中矩阵变换的应用探索-数字图像处理论文-计算机论文——文章均为WORD文档，下载后可直接编辑使用亦可打印——摘要：从矩阵变换入手,将矩阵变换应用到图像处理中,且通过直方图匹配法及欧几里得距离法求取相似度来进行人脸识别和预测。所得实验结果直观高效,相似度均能达到90%以上。关键词：数字图像处理;矩阵变换;人脸识别和预测;相似度;Abstract：Thispaperstartswithma
122（背）阿飞fighting
今天的句子：（终极大杀器！）Nor,ifregularityandconformitytoastandardpatternareasdesirabletothescientistasthewritingofhispaperswouldappeartoreflect,ismanagementtobeblamedfordiscriminatingagainstthe“oddballs”amongres
TheBrain空间壁纸的来源_Papers.co(20190621周五) 菜五
(2019-06-21-周五06:26:39)http://papers.co/desktop/page/2/?s=bluehttps://zhuanlan.zhihu.com/p/70061301
实例分割论文阅读之：FCN：《Fully Convolutional Networks for Semantica Segmentation》交换喜悲 mdetection系列论文阅读目标检测人工智能实例分割计算机视觉卷积神经网络
论文地址:https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf代码链接：https://github.com/pytorch/vision摘要卷积网络是强大的视觉模型，可以产生特征层次结构。我们证明，经过端到端、像素到像素训练的卷积网络
论文笔记-Generative Adversarial Nets 升不上三段的大鱼
论文链接：https://papers.nips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf论文解读：https://www.bilibili.com/video/BV1rb4y187vD?share_source=copy_web一句话总结：提出了生成模型框架GAN，包括一个生成模型G和一个判别模型D，用有监督的损失
课程论文章剑坡
MZUMBEUNIVERSITYNAMEOFCOURSE:MBA-CMNAMEOFSUBJECT:MANAGERIALECONOMICSSTUDENTNAME:JIANPOZHANGREGISTRATIONNO:221050164/T.18LECTURER:Prof.Ngowi,H.P(PhDEconomics)NATUREOFWORK:TERMPAPERSUBMISSIONDATE:15/2/2
PairLIE论文阅读笔记 Alex·Fall 低光增强论文阅读笔记
PairLIE论文阅读笔记论文为2023CVPR的LearningaSimpleLow-lightImageEnhancerfromPairedLow-lightInstances.论文链接如下：openaccess.thecvf.com/content/CVPR2023/papers/Fu_Learning_a_Simple_Low-Light_Image_Enhancer_From_Paire
语义分割系列之FCN、DeeplabV1、V2、V3、V3Plus论文学习 Diros1g 学习深度学习计算机视觉
FCNFullyConvolutionalNetworks论文：FullyConvolutionalNetworksforSemanticSegmentation地址:https://openaccess.thecvf.com/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf特点：用全卷积替
2022-01-11（121）DREAM HORSE梦之马木金木水火土的木
DREAMHORSENeedlessly,watchingmylooking-glassimage,withitspassionforpapersandcinemas,daysoftheweek,Ipluckfrommyheartmyhell'scaptainandordertheclauses,equivocallysad.Idriftbetweenthispointandthat,absorb
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数