数据分析2-pandas数据处理基本操作

一、基础知识:

1)数据格式csv,一般第一行都会写上备注说明数据归属和来源,excel打开数据如下。

2)不用程序查看数据的情况下,excel会对数据处理,看不到数据原貌,所以查看数据的时候最好用文本编辑器打开数据,windows下用notepad++即可。

二、pycharm导入数据:

1.我们打开pycharm读取数据,按照路径导入数据,报错,提示为:SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 0-1: truncated \UXXXXXXXX escape

代码
错误码

 原因分析:引起这个错误的原因就是转义的问题

在windows系统当中读取文件路径可以使用\,但是在python字符串中\有转义的含义,如\t可代表TAB,\n代表换行,所以我们需要采取一些方式使得\不被解读为转义字符。

解决方案为:1)在路径前面加r,即保持字符原始值的意思。

pd.read_csv(r'C:\Users\Kevin\Desktop\demo\data\class5\BITFINEX_BTCUSD_20180124_1T.csv',)

2) 替换为双反斜杠,第一个反斜杠换为双反斜杠即可

pd.read_csv('\\Users\Kevin\Desktop\demo\data\class5\BITFINEX_BTCUSD_20180124_1T.csv',)

3) 替换为正斜杠

df= pd.read_csv('c:/Users/Kevin/Desktop/demo/data/class5/BITFINEX_BTCUSD_20180124_1T.csv',)

————————————————

以上三种方法经测试都是可以导入数据的,解决问题的思路来源于CSDN博主「可乐饲养员」的原创文章,感谢可乐饲养员,感谢互联网。(原文链接:https://blog.csdn.net/xd060606/article/details/87164798)

2.数据导入成功:

dataframe格式说明:

dataframe格式说明

第二课筛选数据的基本操作练习完成

你可能感兴趣的:(数据分析2-pandas数据处理基本操作)