接触数据分析应该算是在三年前,那时候我们主要是从基地提取数据,数据已经做好处理,放在Excel里,而我只需要熟练使用Excel函数及数据透视等工具就可以分析提炼出领导需要了解的内容,然后写出PPT报告提交给领导即可。
Excel操作简单易上手,只是随着数据量的增多,随着Excel打开速度的变慢,随着领导和业务需求复杂急迫,只是掌握这一种工具不再可行。
如果没有现成数据,需要向技术提交需求,这时需要了解业务和技术数据流的关系。如果领导要求调研的数据是网络数据,那么需要自己动手写爬虫,获取数据并做分析。
大体需要学习的知识:Python、网页基础、数据库及SQL、Excel、数据可视化、PPT自动化报告、统计及spss等
以下主要是Python学习的计划
4月4日之前完成任务:
Python基础:搭建Python开发环境、基本的数据类型、条件判断和循环、函数、模块、Python特有的切片和列表生成式、异常处理与文件操作
4月16日前完成任务:
urllib与BeautifulSoup、存储数据、文档读取、写爬虫实战、numpy与pandas
HTML基础知识
4月23日前完成任务:
Excel与SQL、数据库知识、PPT自动化报告
目前还不了解利用Python写爬虫项目的具体操作,所以上述时间安排还会做及时调整。
5月份之前一定要掌握python数据分析的基本要领!!!!!!