k均值例子 数据挖掘_K-means聚类原理和例子

本课程讲解现在工业界和学术界流行的机器学习算法的相关知识,以及如何用python去实现这些算法。算法的讲解包括supervised learning(有监督式学习)和unsupervised learning(无监督式学习)两个部分。其中supervised learning包括classification(分类)和regression(回归)的若干流行的模型的讲解。 Unsupervised learning部分,我们会讲解clustering(聚类)和principle component analysis(主成分分析)等算法。

除此之外,课程还包括用python进行文本数据预处理过程的讲解,以及model evaluation(模型评估)和 cross-validation(交叉验证)等实际应用中经常运用的技术。

所有机器学习的算法讲解都会配合着python的程序进行说明。本课程的讲解和作业中的具体实例数据是2001年美国安然公司破产丑闻事件中的电子邮件数据。数据包含了几十万封电子邮件。我们将教会大家如何利用数据挖掘的算法来分析这些电子邮件,提取出来有效的信息。

你可能感兴趣的:(k均值例子,数据挖掘)