python数据分析-心得

d

一、数据分析是什么

数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用,使得数据的价值最大化

二、数据分析是做什么的

信息实际上是对数据集进行处理,从中提炼出可用于其他场合的结论,是对数据进行处理后的得到的结果。从原始数据中抽取信息的过程叫做数据分析。
常见的数据存储格式有:XML, JSON, XLS,CSV
数据分析常用到的统计技术有:贝叶斯方法、回归、聚类
数据分析领域最先进的工具之一是机器学习方法
————————————————

数据分析的目的
抽取不易推断的信息,而一旦了解这些信息,就能够对产生数据的系统的运行机制进行研究,从而对系统可能的响应和演变做出预测。数据分析最初用于数据保护,现在已经发展为数据建模的方法论。

数据分析过程
问题定义、数据抽取、数据清洗、数据转换、数据探索、预测模型、模型评估/测试、结果可视化和阐释、解决方案部署。
————————————————
1.numpy模块

Numpy是Python进行科学计算,尤其是数据分析时,所用到的一个基础库。Numpy库的基础:Ndarray。Numpy数组的维数和元素数量由数组的型(shape)来决定,数组的型由N个正整数组成的元组来指定,元组的每个

你可能感兴趣的:(数据分析,数据挖掘,大数据,python)