那些对软件质量严格要求的行业,比如银行、财务、通信,因它们知道单是靠最终的系统测试无法把潜在的缺陷找出来,所以都愿意花费大量精力,找很有经验的程序员去做代码评审来找缺陷,。
从2000年开始,学术界对缺陷的预测已经做了非常多的研究,一直收集产品发布的不同历史,包括缺陷历史、变更历史、代码本身。通过数据分析,可以找出在新版本里面容易出错的地方,经过多年研究,这种预测的成功率越来越高。如果公司可以系统收集产品开发的历史经验,完全可以预测新版本错误在哪里。
如果公司是对软件质量要求很高的相关行业,以下系列课程对公司或个人发展都很有帮助。
这一系列课程先从统计、度量开始,介绍如何利用常用工具,帮公司建立可以长期操作的度量系统,不断去搜集过去历史的产品开发经验,然后做出一些公司特殊的基线和预测模型,帮助产品质量跳跃地提高。
我们一系列总共有3个课程,每个课程为2天,从最基础的统计、度量与分析开始,到最后利用一些大数据,Data mining的技巧,对一些实例做分析研究。
课程特点:
课程以实战为主理论为辅。提供足够的参考资料给学员在课前后研究。学员通过学习后也可以掌握一些立马可以在公司里推行的开源工具、程序和技巧。
培训课程 |
培训日期 |
具体 时间 |
讲师 |
费用 /人 |
度量与分析实战 |
2016.1.16-2016.1.17(成都)2016.2.20-2016.2.21(杭州) |
9:00-17:00 |
Dr. Kim Man LUI, Edmond SUNG |
¥2000 |
利用R做data mining 和数据分析 (1/2) |
2016.3.19-2016.3.20(杭州)2016.3.26-2016.3.27(成都) |
9:00-17:00 |
Dr. Kim Man LUI, Edmond SUNG |
¥2000 |
利用R 做data mining和数据分析 (2/2) |
2016.4. 9-2016.4.10(杭州)2016.4.16-2016.4.17(成都) |
9:00-17:00 |
Dr. Kim Man LUI, Edmond SUNG |
¥2000 |
(注:也可以提供定制化的培训,想了解更多欢迎和我们联系:[email protected]。)
u 合适的参与者:
对度量与分析, data mining, 大数据分析有兴趣;关注软性质量
u 课程大纲:
u 课程一:度量与分析实战(2天)——基于大数据缺陷的分析统计
利用过去度量与分析的基础材料,加入一些新的元素,比如利用R的语言做分析和统计,收集现有公司的系统的度量,建立公司的度量库。注意: Data Mining 的分析前提是企业要有代码和缺陷的数据。
课程大纲:
第一天:
简单讲解整个大数据,缺陷分析的研究,度量与分析的基础理论;
进行互动练习:根本原因分析、鱼骨图、关联分析、度量目标的制定等,帮助学员确立与公司商业目标一致的完整度量目标。
第二天:
介绍统计的基础,包括不同假设检验、分析技巧;分享过程改进、PDCA的概念。
利用目前最流行的统计的工具(R和开发环境)对现有数据作基本分析、回归分析。
学习如何收集公司的度量数据或变更数据,我们会教授要如何才能收集有效数据,以帮助日后做统计。
两天课程后学员可以学到:如何利用R 工具做基本统计和度量报告和如何自动化分析代码。运行一些简单的R实例。
u 课程二:利用R做data mining和数据分析(2天)
课程是基于学生已经参加了度量与分析,大数据概述的基础上,集中介绍利用R的技巧,做大数据、数据分析。以案例为主,用实际的数据,让学员利用下载的工具,做分析和写报告。
第一天:
重温统计技巧,包括不同的度量分析技巧,不同的数据收集过程,如何积累公司的数据库,度量分析的基础。
介绍R的技术基础技巧:Classification and Recognition 。
第二天:
用R的工具,对公司现有数据作分析统计。
建立如何从数据找出可控因子的概念,做一些统计分析和建立基线、试用预测模型。
针对公司的缺陷数据,利用过去的数据来做一些例子——做分析,建立预测模型和针对缺陷的模型。
u 课程三:利用R做data mining(2天)
这两天的课程与前面课程二相似也是在R的基础,但是除了介绍多元回归方式,也会介绍其他常见data mining建模的方法,包括base 系统、神经网系统、deep net。通过一些实际的案例,教大家利用数据建立预测模型。
注:R语言是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。