腾讯移动品质中心TMQ

【腾讯TMQ】机器学习之一：聚类实战

导读

可预见的未来数据分析和机器学习将成为工作中必备技能，也许已经在某个项目中讨论怎么调参优化，就像过去讨论如何优雅的写python、如何避免C++内存泄露一样常见。

一、简单介绍聚类算法

1、聚类的定义

聚类就是对大量未知标注的数据集，按数据的内在相似性将数据集划分为多个类别，使类别内的数据相似度较大而类别间的数据相似度较小。

2、聚类的基本思想

给定一个有N个对象的数据集，构造数据的k个簇，k≤n。满足下列条件：

每一个簇至少包含一个对象；
每一个对象属于且仅属于一个簇；
将满足上述条件的k个簇称作一个合理划分。

对于给定的类别数目k，首先给出初始划分，通过迭代改变样本和簇的隶属关系，使得每一次改进之后的划分方案都较前一次好。

3、相似度/距离计算方法总结

4、K-means算法

K-means算法也被称为k均值，k值的选择、距离度量及分类决策是三个基本要素。

假定输入样本为S=x1,x2,…,xm，则算法步骤为：

选择初始的k个类别中心μ1μ2…μk；
对于每个样本xi，将其标记为距离类别中心最近的类别；
将每个类别中心更新为隶属该类别的所有样本的均值；
重复最后两步，直到类别中心的变化小于某阈值。

中止条件：

迭代次数/簇中心变化率/最小平方误差MSE(MinimumSquared Error)

5、一个简单的例子

二、项目实战

某专项测试实际业务中，海量样本为同一病毒类型，如何落地为本地能力将是挑战，所有样本都处理工作量大且重复性高，只处理高热样本会落入长尾困境，如果能将N个样本通过特征聚类为K类，报毒覆盖K类则理论会达到覆盖整体的能力，无论效率和产品能力、自动化上都将有收益。

具体的思路如下：

数据清洗：提取相同病毒名的文件
特征提取：提取多维度文件静态特征
聚类：K-means，目标聚类覆盖该类型病毒特征
特征验证：k个特征对k个子编写特征验证通杀性
工具包：NumPy、SkiPy、 Pandas、Skikit-Learn

1、数据清洗

PE文件结构和样本特征的关系：常用的恶意文件一般都是基于格式分析，从PE文件格式分析来提取文件特征符合业务特征。

这里使用本人在filefuzz项目里封装的pe解析模块来处理，拉取某报毒类型样本5722个, 去除坏PE后解析出下列参数做为维度参数
NumberOfSections,SizeOfCode,BaseOfData,ImageBase,SizeOfImage,SizeOfHeaders
,IMAGE_DATA_DIRECTORY[16],IMAGE_DIRECTORY_ENTRY_IMPORT

2、特征提取

去重后导入函数为688，参数维度共711个。

处理前特征：

处理后特征：

3、聚类：K-means

使用pandas加载数据后填充缺失数据，通过特征分布可视化预处理参数观察数据分布。

数据加载

特征归一化

分割训练集和测试集:不同目标参数训练结果如下：
y=voice_data[‘NumberOfSections’].values+voice_data[‘SizeOfCode’].values

y=voice_data[‘NumberOfSections’].values+voice_data[‘SizeOfImage’].values

y = voice_data[‘NumberOfSections’].values, 此时目标参数区分度有效性最高，准确率也达到99%。

sklearn函数介绍：

train_test_split将给定数据集X和类别标签Y，按一定比例随机切分为训练集和测试集。

X_train,X_test,y_train,y_test =train_test_split(train_data,train_target,test_size=0.4, random_state=0)

train_data：所要划分的样本特征集

train_target：所要划分的样本结果

test_size：样本占比

random_state：是随机数的种子。

http://scikit-learn.org/0.16/modules/generated/sklearn.cross_validation.train_test_split.html

cross_val_score交叉验证函数

scores = cross_val_score(clf, raw_data,raw_target, cv=5, score_func=None)

clf：表示不同分类器,例支持向量clf=svm.SVC(kernel=’linear’, C=1)

raw_data：原始数据

raw_target：原始类别标号

cv：不同的cross validation的方法

cross_val_score：不同划分raw_data在test_data得到分类的准确率。

http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_val_score.html

代码简要：

4、特征验证

k个特征对k个子类编写特征验证通杀性，样本处理数量从4726下降到K类集合。

总结

通过对大量同质数据的聚类，对测试集合的覆盖度和效率都有显著收益，对长尾问题解决也提供了可行的思路方法。

参考：

http://scikit-learn.org/stable/
<<统计学习方法>>
<<计算机病毒防范艺术>>
<<机器学习>>

关注腾讯移动品质中心TMQ，获取更多测试干货！

版权所属，禁止转载！！！

你可能感兴趣的:(精准测试)

什么是精准测试？为什么要做精准测试？程序员与诗人什么是精准测试为什么要做精准测试？
在软件测试的世界里，精准测试这个概念正逐渐走向舞台中央。然而，精准测试究竟是什么？为什么在如今的开发环境中，越来越多的企业开始重视这种测试方法？如果你想在软件质量保证的赛道上占据优势，那么了解并掌握精准测试将是你必不可少的一环。你是否在项目中遇到过测试资源不足、测试覆盖面不够、测试效率低下等问题？这些问题是否导致了产品发布的延误甚至质量问题？为什么精准测试能成为解决这些问题的关键？它与传统的测试方
得物商家域精准测试实践测试
一、背景介绍由于多个域共建情况比较多，一方面应用随业务发展在不断扩展，各个应用代码复杂度会不断增加，如何准确、全面判定代码修改影响范围会越来越重要，另一方面共建过程中如果不能准确预估出各域共同改动所带来的影响面，就会存在测试遗漏；如果各域信息不对称可能会存在一方改动另外一方无感知，导致评估不到位带来一些影响。基于以上背景商家域引入精准测试平台实践，可以帮助QA扫描出每个版本开发改动的接口范围，并且
如何保障代码覆盖率？它和精准测试有什么关系？ Chowley QALog 代码覆盖率
前言大家好，我是chowley，今天来聊一聊代码覆盖率和精准测试两者之间的关系。在软件开发和测试中，代码覆盖率是一个重要的指标，它可以帮助我们评估测试用例对源代码的覆盖程度。精准测试则注重深入挖掘特定功能或模块的问题。1.了解代码覆盖率的类型在开始之前，让我们先了解几种常见的代码覆盖率类型：行覆盖率（LineCoverage）：衡量测试用例执行过的代码行数占总代码行数的比例。行覆盖率是最基本的覆盖
【转】被忽视的问题：测试环境稳定性治理祁小彬
原文：https://mp.weixin.qq.com/s/tSxlblV3KMbsMnJCQtlcIA前言前几天在某个微信群里看到有同学在问测试环境治理的问题，正好我在之前的公司负责过相关的技术项目，在这方面有一定的实践经验，就解答了她的一些疑惑。今天看书时候突然想到了这件事，发现这几年大家都在讲测试开发、测试效能、精准测试、敏捷测试、全链路压测等等很多高大上的技术实践和理念，但很少有人关注到测
【软件测试】学习笔记-精准测试码农丁丁软件工程软件测试精准测试
软件测试行业从最开始的手工测试到自动化测试，从黑盒测试到白盒测试，测试理念和技术都发生了日新月异的变化。现如今，几乎所有的软件公司都有一套强大且复杂的自动化测试用例，用来夜以继日地保证产品的正确性和稳定性。然而，你有没有想过，现在你所掌握的软件测试技术和用例，真的是最准确、最适合你的产品的吗？这其中，是不是存在很多冗余的测试数据、根本用不上的测试用例、永远成功不了的测试场景？更糟糕的是，当产品代码
优酷服务端精准测试体系知识的宝藏测试工具
一、"要不要测、要怎么测？"引发的思考随着优酷业务规模的增长，服务端的架构和功能趋近复杂化，代码变更上线也越来越快，面对需要快速上线的功能，测试资源无法参与每个变更的交付过程，变更要不要测、要怎么测？成为服务端交付质量和效率最关键问题：变更要不要测试？这次变更代码有多少是空行、多少是注释、多少是有效代码，是不是对原有代码逻辑产生了影响？这次变更方法是新增还是修改，变更方法的圈复杂度高不高、代码耦合
得物商家域精准测试实践得物技术得物技术测试
一、背景介绍由于多个域共建情况比较多，一方面应用随业务发展在不断扩展，各个应用代码复杂度会不断增加，如何准确、全面判定代码修改影响范围会越来越重要，另一方面共建过程中如果不能准确预估出各域共同改动所带来的影响面，就会存在测试遗漏；如果各域信息不对称可能会存在一方改动另外一方无感知，导致评估不到位带来一些影响。基于以上背景商家域引入精准测试平台实践，可以帮助QA扫描出每个版本开发改动的接口范围，并且
精准测试技术十年发展漫谈爱吃香菜自动化测试软件测试程序人生软件测试程序人生自动化测试 python 单元测试
一、背景精准测试技术，是这几年比较热的一个方向。从2012年这个体系开始诞生，到现在整整历经了10年的时间。中国从国外引进了很多技术，火与不火其实在国外已经决定了。本土成长起来的精准测试路线独树一帜，它不是从国外引入，是在中国的大环境下慢慢发展起来的。从寂寂无名，到软件质量技术从业者的热情被一点点的调动起来，再到被认可及至推广，中间翻越过万重山。本文作者星云测试平台设计师、创始合伙人赵明先生站在另
学习人工智能-基础篇 NeilNiu 机器学习学习人工智能
背景随着大模型的火爆，人工智能再次被推到高潮，其实它在众多行业领域已经落地很多应用，并给社会带来了巨大的经济价值。其中包括互联网、教育、金融、医疗、交通、物流等等。在测试领域也有一些落地的案例，作为测试人员，有必要去了解并学习人工智能，去挖掘人工智为测试领域解决痛点问题，例如自动化测试用例自动生成、视觉自动化测试、缺陷预测、智能的精准测试等等。大家经常会听说，人工智能(ArtificialInte
精准测试二三谈 ThoughtWorks
作者介绍：前ThoughtWwrks高级质量分析师，现任HSBC测试咨询专家，擅长敏捷测试，测试开发，devops等领域。我们都在使用敏捷开发，敏捷测试，维护着我们的项目，我们写着少量的testcase，甚至不写一条case，敏捷宣言其中一条原则是工作的软件“高于”详尽的文档，详解文档包括各种计划书，总结报告，详尽测试用例等，我们将大量时间用在自动化测试以及手工探索性测试上面，而我们的用例则以BD
精准测试白皮书－2019最新版 weixin_34273046 python 人工智能 java
2019独角兽企业重金招聘Python工程师标准>>>精准测试诞生的背景现代社会是建立在各种以计算机为基石的软件技术基础之上的。随着日新月异的需求变化，软件系统越来越复杂。很多人觉得软件开发才是重要环节，但实际上，无法对大型软件进行有效的质量把控，就无法真正构建与维护大型软件。——系统中任何一个错误都可能导致整个系统的崩溃，造成无法弥补的损失，系统的任何一个微小的修改都可能引入新的缺陷导致维护困难
普元云计算-精准测试的动因、概念、特性与价值 weixin_30572613 测试 devops
转载本文需注明出处：微信公众号EAWorld，违者必究。前言：在测试领域，精准测试已经成了测试数字化的代名词，渐渐得到测试开发人员的关注，也是测试行业一个具有挑战性的议题，本文试图回答以下几个问题：有必要做精准测试吗？什么是精准测试？精准测试适合的项目类型与关键特性是什么？设计和实现一个精准测试方案，要点与价值有哪些？目录：一、非精准测试的五宗罪二、精准测试：一种可追溯的软件测试技术三、精准测试的
精准测试系列分享之一：JaCoCo 企业级应用的优缺点分析星云精准测试精准测试 jacoco 星云精准测试覆盖率星云测试
一、JaCoCo简介JaCoCo是Eclipse平台下的开源产品，以小型，轻量化著称，常见集成在EclipseWorkbench中，除此之外的启动方式包括对接Ant和Maven，或是命令行的方式进行。Jacoco近两年在软件测试行业的被关注度比较高，其主要原因是：在新一代精准测试技术流的影响中，各大型单位对覆盖率的追求越来越迫切。作为一款开源产品，它主机面向Java语言，能够在字节码层面给出覆盖率
精准测试技术十年发展漫谈星云精准测试软件测试精准测试
精准测试技术十年发展漫谈目录一、背景二、精准测试的定义三、精准测试技术发展四、精准测试的专利技术五、精准测试的一分一合六、精准测试体系七、商用精准测试的无损技术八、商用精准和开源精准的区别九、精准测试成熟度五级划分十、精准测试的效能提升十一、商用精准测试的规划与发展一、背景精准测试技术，是这几年比较热的一个方向。从2012年这个体系开始诞生，到现在整整历经了10年的时间。中国从国外引进了很多技术，
精准测试白皮书2020版星云精准测试单元测试黑盒测试白箱测试软件测试
第一章精准测试诞生的背景（附精准测讲解视频和白皮书下载）20年前（2000年），上网是一件很酷的事，叫做“网上冲浪”，主要是几个门户网站占据绝大多数注意力；20年后（2020年），我们已经全方位“浸泡”在软件的海洋里，很多大型软件系统已经超过亿行，架构模型越来越复杂。未来的20年（2020-2040年），随着各种智能应用的层出不穷，软件系统内部逻辑会不可逆转的越来越复杂，而外部操作会越来越“傻瓜”
精准测试之过程与实践 | 京东云技术团队京东云技术团队测试京东云精准测试测试工具测试
作者：京东工业宛煜昕一、怎样的技术•百度百科：精准测试是一套计算机测试辅助分析系统。精准测试的核心组件包含的软件测试示波器、用例和代码的双向追溯、智能回归测试用例选取、覆盖率分析、缺陷定位、测试用例聚类分析、测试用例自动生成系统，这些功能完整的构成了精准测试技术体系。•其他定义精准测试是中国自己有知识产权的完全的理论体系，它同时关注功能点和代码相关逻辑这样一个方法论，是一种灰盒的测试模式。最开始在
一种可度量的测试体系-精准测试鲸品堂可用性测试精准测试
行业现状软件行业长期存在一个痛点，即测试效果无法度量。通常依赖于测试人员的能力和经验，测试结果往往不可控，极端情况下同一个业务功能，即使是同一个人员在不同的时间段，测试场景和过程也可能不一致，从而无法有效地保障软件产品质量。质量总监总是抱怨：每一次版本发布时，时间并不是很充分，我们不确定这些需求代码变动到底影响范围有多大，无法精准地评估出测试范围，要么执行完整的全回归测试，花费大量的时间，严重影响
精准测试不过是增量构建的副产品 apl359 python 开发语言
前文中，我们给了“精准测试”定义：它是一种能力，能只针对变更进行测试，而不是每次变更都进行全量测试。同时，介绍了当前行业里的主流实现方法。个人并不看好该实现方法。本文介绍的另一种实现精准测试的方法。在真正介绍前，我们就必须先说增量构建和Bazel。全量构建与增量构建在软件构建领域，存在两种构建类型：全量构建和增量构建。•全量构建指的是针对代码仓库中所有的代码进行构建；•增量构建是指只针对有变动的代
精准测试是个错误 apl359
如果你已经了解了精准测试在行业的主流做法，你可以跳过相关内容。行业里对于精准测试的定义在网上流传着一些精准测试的定义（如果你对这些定义不感冒，可直接跳到我个人的定义）：自网易陈逸青（2020）的定义：借助一定的技术手段、通过辅助算法对传统软件测试过程进行可视化、分析及优化的过程，使得测试过程更加可视化、智能、可信和精准。原文：https://www.infoq.cn/article/xuu91cr
人工智能与自动化测试结合实战-探索人工智能在测试领域中的应用测试界的飘柔职场经验软件测试程序员人工智能程序员 jmeter 软件测试经验分享自动化测试功能测试
人工智能与测试结合现状最近在各个行业技术会议上，出现了越来越多的人工智能与测试结合的topic。比如最近几个跟人工智能相关的内容。人工智能与测试的结合话题风头一度盖过了精准测试，无疑成为了2023年测试行业最亮的技术方向。为什么人工智能会突然爆火，又会给大家带来哪些价值呢？接下来给大家做个分析。为什么人工智能与测试的结合话题开始火爆第一个推动力是无疑是chatgpt，它从年初一直火爆到现在，大语言
精准测试：提高软件质量和用户满意度的利器豆子熊. 软件测试自动化测试 selenium
专注于分享软件测试干货内容，欢迎点赞收藏⭐留言如有错误敬请指正！交流讨论：欢迎加入我们一起学习！资源分享：耗时200+小时精选的「软件测试」资料包最困难的时候，也就是我们离成功不远的时候！目录什么是精准测试？以下是精准测试的主要特点：精准测试的不同层面以下是一些精准测试的方法和最佳实践：结论最后随着软件在各个行业的广泛应用，软件质量成为了一个至关重要的问题。精准测试是一种测试方法，它旨在确保软件功
如何用精准测试来搞垮团队？一个处女座的测试自动化测试软件测试软件测试测试工具自动化测试 bug 自动化测试工具
测试行业每年会冒出来一些新鲜词：混沌工程、精准测试、AI测试……这些新概念、新技术让我们感到很焦虑，逼着自己去学习和了解这些新玩意，担心哪一天被淘汰掉。以至于给我这样的错觉，当「回归测试」、「精准测试」这两个词摆在一起，「回归测试」立刻就显得有些低级。我们愿意花时间去学习更新鲜的东西，也不愿意花费更多时间去研究如何做好「回归测试」这类老生常谈的工作。所以，每隔一段时间我都会试着问问自己：「这项新技
【测试人生】游戏业务测试落地精准测试专项的一些思路 utmhikari 测试人生游戏测试精准测试功能测试业务测试专项测试
精准测试在互联网领域有广泛的应用。以变更为出发点，通过对变更内容进行分析，可以确定单次变更具体涉及到哪些模块和功能点，以及是否存在夹带风险，从而从QA的视角，可以知道哪些功能模块需要做测试，以及哪些变更内容不符合预期。相比于互联网QA，游戏QA接入业务项目研发过程并没有那么深入，比如项目代码权限基本上游戏QA不会拥有，但即便如此，要在游戏测试领域应用精准测试专项技术，还是有一定思路可循。因此，本篇
试图一文彻底讲清 “精准测试” 给点流量吧软件测试自动化测试 python 职场和发展开发语言测试工具
在软件测试中，我们常常碰到两个基本问题（困难）：很难保障无漏测：我们做了大量测试，但不清楚测得怎样，对软件上线后会不会出问题，没有信心；选择待执行的测试用例：面对大量的回归测试用例时，我们没有足够的时间完成测试，如何选择出有效的测试用例呢？虽然我们会有一些策略，如基于风险的测试策略、基于操作剖面的测试策略或组合测试策略，但主要还是靠测试人员的经验，比较主观。人们试图解决这样的基本问题，由此产生了“
星云精准测试有力提升金融复杂系统的测试能效星云测试
随着国内大数据、云计算、人工智能等新技术的发展，银行业的前中后台正面临着全面改造，金融科技是业务转型发展的一个核心发力点。金融行业信息系统集中度高、规模庞大、多系统之间关联性强、业务复杂、需求变化快，另外各种新旧系统错综交互，软件质量控制难度异常复杂。通过技术手段精准地追溯每一个数据路线，有效实现信息系统的高可靠性和易维护性，是金融业界共同的目标。一、传统测试的局限目前，在大部分金融机构中，主流的
试图一文彻底讲清 “精准测试” 测试界的飘柔软件测试程序员 IT 测试用例自动化测试职场和发展软件测试面试
在软件测试中，我们常常碰到两个基本问题（困难）：很难保障无漏测：我们做了大量测试，但不清楚测得怎样，对软件上线后会不会出问题，没有信心；选择待执行的测试用例：面对大量的回归测试用例时，我们没有足够的时间完成测试，如何选择出有效的测试用例呢？虽然我们会有一些策略，如基于风险的测试策略、基于操作剖面的测试策略或组合测试策略，但主要还是靠测试人员的经验，比较主观。人们试图解决这样的基本问题，由此产生了“
精准测试（针对人工执行的测试用例和自动化测试脚本）软件测试凡哥软件测试经验分享软件测试工程师软件测试程序人生自动化测试测试用例功能测试测试工具
在软件测试中，我们常常碰到两个基本问题（困难）：很难保障无漏测：我们做了大量测试，但不清楚测得怎样，对软件上线后会不会出问题，没有信心；选择待执行的测试用例：面对大量的回归测试用例时，我们没有足够的时间完成测试，如何选择出有效的测试用例呢？虽然我们会有一些策略，如基于风险的测试策略、基于操作剖面的测试策略或组合测试策略，但主要还是靠测试人员的经验，比较主观。人们试图解决这样的基本问题，由此产生了“
试图一文彻底讲清 “精准测试” 程序员油条技术分享服务器 jmeter
在软件测试中，我们常常碰到两个基本问题（困难）：很难保障无漏测：我们做了大量测试，但不清楚测得怎样，对软件上线后会不会出问题，没有信心；选择待执行的测试用例：面对大量的回归测试用例时，我们没有足够的时间完成测试，如何选择出有效的测试用例呢？虽然我们会有一些策略，如基于风险的测试策略、基于操作剖面的测试策略或组合测试策略，但主要还是靠测试人员的经验，比较主观。人们试图解决这样的基本问题，由此产生了“
试图一文彻底讲清 “精准测试” 程序员曦曦软件测试工程师自动化测试软件测试功能测试软件测试程序人生职场发展自动化测试
在软件测试中，我们常常碰到两个基本问题（困难）：很难保障无漏测：我们做了大量测试，但不清楚测得怎样，对软件上线后会不会出问题，没有信心；选择待执行的测试用例：面对大量的回归测试用例时，我们没有足够的时间完成测试，如何选择出有效的测试用例呢？虽然我们会有一些策略，如基于风险的测试策略、基于操作剖面的测试策略或组合测试策略，但主要还是靠测试人员的经验，比较主观。人们试图解决这样的基本问题，由此产生了“
精准测试——持续测试软件测试潇潇自动化测试软件测试工程师软件测试软件测试程序人生自动化测试功能测试职场发展 python
前面已经介绍了黑盒测试和白盒测试。从前面的介绍中可以知道，黑盒测试是一种面向业务流程的测试，针对需求设计测试用例，在运行的系统上执行测试用例，完成测试。整个测试过程中测试工程师对于测试代码是如何运行的一无所知，只能通过输入、输出评价系统的逻辑处理是否正确。而白盒测试恰恰相反，测试人员需要面向代码测试，根据代码逻辑、覆盖路径设计测试用例。对于白盒测试用例而言，被测系统的代码是可见的，测试需要检查程序
Linux的Initrd机制被触发 linux
Linux 的 initrd 技术是一个非常普遍使用的机制，linux2.6 内核的 initrd 的文件格式由原来的文件系统镜像文件转变成了 cpio 格式，变化不仅反映在文件格式上， linux 内核对这两种格式的 initrd 的处理有着截然的不同。本文首先介绍了什么是 initrd 技术，然后分别介绍了 Linux2.4 内核和 2.6 内核的 initrd 的处理流程。最后通过对 Lin
maven本地仓库路径修改 bitcarter maven
默认maven本地仓库路径：C:\Users\Administrator\.m2 修改maven本地仓库路径方法： 1.打开E:\maven\apache-maven-2.2.1\conf\settings.xml 2.找到
XSD和XML中的命名空间 darrenzhu xml xsd schema namespace 命名空间
http://www.360doc.com/content/12/0418/10/9437165_204585479.shtml http://blog.csdn.net/wanghuan203/article/details/9203621 http://blog.csdn.net/wanghuan203/article/details/9204337 http://www.cn
Java 求素数运算周凡杨 java 算法素数
网络上对求素数之解数不胜数，我在此总结归纳一下，同时对一些编码，加以改进，效率有成倍热提高。第一种：原理: 6N(+-)1法任何一个自然数，总可以表示成为如下的形式之一： 6N，6N+1，6N+2，6N+3，6N+4，6N+5 (N=0，1，2，…)
java 单例模式 g21121 java
想必单例模式大家都不会陌生，有如下两种方式来实现单例模式： class Singleton { private static Singleton instance=new Singleton(); private Singleton(){} static Singleton getInstance() { return instance; }
Linux下Mysql源码安装 510888780 mysql
1.假设已经有mysql-5.6.23-linux-glibc2.5-x86_64.tar.gz (1)创建mysql的安装目录及数据库存放目录解压缩下载的源码包，目录结构，特殊指定的目录除外：
32位和64位操作系统墙头上一根草 32位和64位操作系统
32位和64位操作系统是指：CPU一次处理数据的能力是32位还是64位。现在市场上的CPU一般都是64位的，但是这些CPU并不是真正意义上的64 位CPU，里面依然保留了大部分32位的技术，只是进行了部分64位的改进。32位和64位的区别还涉及了内存的寻址方面，32位系统的最大寻址空间是2 的32次方= 4294967296（bit）= 4（GB）左右，而64位系统的最大寻址空间的寻址空间则达到了
我的spring学习笔记10-轻量级_Spring框架 aijuans Spring 3
一、问题提问： → 请简单介绍一下什么是轻量级？轻量级（Leightweight）是相对于一些重量级的容器来说的，比如Spring的核心是一个轻量级的容器，Spring的核心包在文件容量上只有不到1M大小，使用Spring核心包所需要的资源也是很少的，您甚至可以在小型设备中使用Spring。
mongodb 环境搭建及简单CURD antlove Web Install curd NoSQL mongo
一搭建mongodb环境 1. 在mongo官网下载mongodb 2. 在本地创建目录 "D:\Program Files\mongodb-win32-i386-2.6.4\data\db" 3. 运行mongodb服务 [mongod.exe --dbpath "D:\Program Files\mongodb-win32-i386-2.6.4\data\
数据字典和动态视图百合不是茶 oracle 数据字典动态视图系统和对象权限
数据字典（data dictionary）是 Oracle 数据库的一个重要组成部分，这是一组用于记录数据库信息的只读（read-only）表。随着数据库的启动而启动,数据库关闭时数据字典也关闭数据字典中包含数据库中所有方案对象（schema object）的定义(包括表，视图，索引，簇，同义词，序列，过程，函数，包，触发器等等) 数据库为一
多线程编程一般规则 bijian1013 java thread 多线程 java多线程
如果两个工两个以上的线程都修改一个对象，那么把执行修改的方法定义为被同步的，如果对象更新影响到只读方法，那么只读方法也要定义成同步的。不要滥用同步。如果在一个对象内的不同的方法访问的不是同一个数据，就不要将方法设置为synchronized的。
将文件或目录拷贝到另一个Linux系统的命令scp bijian1013 linux unix scp
一.功能说明 scp就是security copy，用于将文件或者目录从一个Linux系统拷贝到另一个Linux系统下。scp传输数据用的是SSH协议，保证了数据传输的安全，其格式如下： scp 远程用户名@IP地址：文件的绝对路径
【持久化框架MyBatis3五】MyBatis3一对多关联查询 bit1129 Mybatis3
以教员和课程为例介绍一对多关联关系，在这里认为一个教员可以叫多门课程，而一门课程只有1个教员教，这种关系在实际中不太常见，通过教员和课程是多对多的关系。示例数据：地址表： CREATE TABLE ADDRESSES ( ADDR_ID INT(11) NOT NULL AUTO_INCREMENT, STREET VAR
cookie状态判断引发的查找问题 bitcarter form cgi
先说一下我们的业务背景： 1.前台将图片和文本通过form表单提交到后台，图片我们都做了base64的编码，并且前台图片进行了压缩 2.form中action是一个cgi服务 3.后台cgi服务同时供PC，H5，APP 4.后台cgi中调用公共的cookie状态判断方法（公共的，大家都用，几年了没有问题）问题：（折腾两天。。。。） 1.PC端cgi服务正常调用，cookie判断没
通过Nginx,Tomcat访问日志(access log)记录请求耗时 ronin47
一、Nginx通过$upstream_response_time $request_time统计请求和后台服务响应时间 nginx.conf使用配置方式： log_format main '$remote_addr - $remote_user [$time_local] "$request" ''$status $body_bytes_sent "$http_r
java-67- n个骰子的点数。把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 bylijinnan java
public class ProbabilityOfDice { /** * Q67 n个骰子的点数 * 把n个骰子扔在地上，所有骰子朝上一面的点数之和为S。输入n，打印出S的所有可能的值出现的概率。 * 在以下求解过程中，我们把骰子看作是有序的。 * 例如当n=2时，我们认为（1，2）和（2，1）是两种不同的情况 */ private stati
看别人的博客，觉得心情很好 Cb123456 博客心情
以为写博客，就是总结，就和日记一样吧，同时也在督促自己。今天看了好长时间博客: 职业规划: http://www.iteye.com/blogs/subjects/zhiyeguihua android学习: 1.http://byandby.i
[JWFD开源工作流]尝试用原生代码引擎实现循环反馈拓扑分析 comsci 工作流
我们已经不满足于仅仅跳跃一次，通过对引擎的升级，今天我测试了一下循环反馈模式，大概跑了200圈，引擎报一个溢出错误在一个流程图的结束节点中嵌入一段方程，每次引擎运行到这个节点的时候，通过实时编译器GM模块，计算这个方程，计算结果与预设值进行比较，符合条件则跳跃到开始节点，继续新一轮拓扑分析，直到遇到
JS常用的事件及方法 cwqcwqmax9 js
事件描述 onactivate 当对象设置为活动元素时触发。 onafterupdate 当成功更新数据源对象中的关联对象后在数据绑定对象上触发。 onbeforeactivate 对象要被设置为当前元素前立即触发。 onbeforecut 当选中区从文档中删除之前在源对象触发。 onbeforedeactivate 在 activeElement 从当前对象变为父文档其它对象之前立即
正则表达式验证日期格式 dashuaifu 正则表达式 IT其它 java其它
正则表达式验证日期格式 function isDate(d){ var v = d.match(/^(\d{4})-(\d{1,2})-(\d{1,2})$/i); if(!v) { this.focus(); return false; } } <input value="2000-8-8" onblu
Yii CModel.rules() 方法、validate预定义完整列表、以及说说验证 dcj3sjt126com yii
public array rules () {return} array 要调用 validate() 时应用的有效性规则。返回属性的有效性规则。声明验证规则，应重写此方法。每个规则是数组具有以下结构：array('attribute list', 'validator name', 'on'=>'scenario name', ...validation
UITextAttributeTextColor = deprecated in iOS 7.0 dcj3sjt126com ios
In this lesson we used the key "UITextAttributeTextColor" to change the color of the UINavigationBar appearance to white. This prompts a warning "first deprecated in iOS 7.0." Ins
判断一个数是质数的几种方法 EmmaZhao Math python
质数也叫素数，是只能被1和它本身整除的正整数，最小的质数是2，目前发现的最大的质数是p=2^57885161-1【注1】。判断一个数是质数的最简单的方法如下： def isPrime1(n): for i in range(2, n): if n % i == 0: return False return True 但是在上面的方法中有一些冗余的计算，所以
SpringSecurity工作原理小解读坏我一锅粥 SpringSecurity
SecurityContextPersistenceFilter ConcurrentSessionFilter WebAsyncManagerIntegrationFilter HeaderWriterFilter CsrfFilter LogoutFilter Use
JS实现自适应宽度的Tag切换 ini JavaScript html Web css html5
效果体验：http://hovertree.com/texiao/js/3.htm 该效果使用纯JavaScript代码，实现TAB页切换效果，TAB标签根据内容自适应宽度，点击TAB标签切换内容页。 HTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"
Hbase Rest API : 数据查询 kane_xie REST hbase
hbase（hadoop）是用java编写的，有些语言（例如python）能够对它提供良好的支持，但也有很多语言使用起来并不是那么方便，比如c#只能通过thrift访问。Rest就能很好的解决这个问题。Hbase的org.apache.hadoop.hbase.rest包提供了rest接口，它内嵌了jetty作为servlet容器。启动命令：./bin/hbase rest s
JQuery实现鼠标拖动元素移动位置（源码+注释）明子健 jquery js 源码拖动鼠标
欢迎讨论指正！ print.html代码： <!DOCTYPE html> <html> <head> <meta http-equiv=Content-Type content="text/html;charset=utf-8"> <title>发票打印</title> &l
Postgresql 连表更新字段语法 update qifeifei PostgreSQL
下面这段sql本来目的是想更新条件下的数据，可是这段sql却更新了整个表的数据。sql如下： UPDATE tops_visa.visa_order SET op_audit_abort_pass_date = now() FROM tops_visa.visa_order as t1 INNER JOIN tops_visa.visa_visitor as t2 ON t1.
将redis,memcache结合使用的方案? tcrct redis cache
公司架构上使用了阿里云的服务，由于阿里的kvstore收费相当高，打算自建，自建后就需要自己维护，所以就有了一个想法，针对kvstore(redis)及ocs(memcache)的特点，想自己开发一个cache层，将需要用到list，set，map等redis方法的继续使用redis来完成，将整条记录放在memcache下，即findbyid，save等时就memcache，其它就对应使用redi
开发中遇到的诡异的bug wudixiaotie bug
今天我们服务器组遇到个问题：我们的服务是从Kafka里面取出数据，然后把offset存储到ssdb中，每个topic和partition都对应ssdb中不同的key，服务启动之后，每次kafka数据更新我们这边收到消息，然后存储之后就发现ssdb的值偶尔是-2,这就奇怪了，最开始我们是在代码中打印存储的日志，发现没什么问题，后来去查看ssdb的日志，才发现里面每次set的时候都会对同一个key

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他