【python数据挖掘课程】二十九.数据预处理之字符型转换数值型、标准化、归一化处理

这是《Python数据挖掘课程》系列文章,前面很多文章都讲解了数据挖掘、机器学习,这篇文章主要讲解数据分析预处理中字符特征转换为数值特征、数据标准化、数据归一化,这都是非常基础的工作。最后通过KNN实现KDD CUP99数据集的分类。
文章比较基础,希望对你有所帮助,提供些思路,也是自己教学的内容。推荐大家购买作者新书《Python网络数据爬取及分析从入门到精通(分析篇)》,如果文章中存在错误或不足之处,还请海涵。

安全资源下载地址:https://github.com/eastmountyxz/NetworkSecuritySelf-study
恶意代码下载地址:https://github.com/eastmountyxz/AI-for-Malware-Analysis-
数据分析系列代码:https://github.com/eastmountyxz/Python-for-Data-Mining
希望读者能帮Github点个赞,一起加油。

文章目录

  • 一.KDD CUP背景知识
  • 二.数据特征描述
    • 1.TCP连接基本特征(共9种,序号1~9)

你可能感兴趣的:(知识图谱,web数据挖掘及NLP,数据挖掘,Python,数据预处理,归一化,标准化)