一,python数据分析概述
1,数据 信息的概念:数据是指对客观事件进行记录并可以鉴别的符号,是对客观事物的性质、状态以及相互关系等进行记载的物理符号或这些物理符号的组合。它是可识别的、抽象的符号。数据是信息的表现形式和载体,可以是符号、文字、数字、语音、图像、视频等。信息是数据的内涵,信息是加载于数据之上,对数据作具有含义的解释。数据和信息是不可分离的,信息依赖数据来表达,数据则生动具体表达出信息。
2,数据的分类:数据是对世界万物的记录。任何可以被测量或是分类的事物都能用数据来表示。
数据可以分为两个不同的类别:类别型和数值型。
类别型
• 定类
• 定序
数值型
• 离散
• 连续
3,数据分析的概念:数据分析是指用适当的分析方法对收集来的大量数据进行分析,提取有用信息和形成结论,对数据加以详细研究和概括总结的过程。
4,数据分析的分类:广义数据分析包括狭义数据分析+数据挖掘。
5,数据分析的流程:
6,熟悉 Python数据分析的工具:numpy,pandas,scipy,matplotlib,seaborn,pyecharts,sk-learn。