第一章 处理数据
处理数据的一些笔记。
注:本文使用的数据来源请参考“博雅读书社”微信公众号的“资源下载”,根据提示获取。
读取图片之前要知道图片的路径,数据处理也是这样,要先知道数据存放在哪里。
import os
#当前路径
os.getcwd()
print(os.getcwd())
import pandas as pd
import os
#读数据只需改file_path
file_path = os.path.join(os.getcwd(), "coupon_nm.xlsx")
file_path1 = os.path.join(os.getcwd(), "coupon_nm.csv")
coupon = pd.read_excel(file_path)
coupon1 = pd.read_csv(file_path1)
这部分使用open()函数,使用的逻辑:打开文件->读取内容->关闭内容
其中open()有很多打开模式,这部分有需求可以百度。
f=open("food.txt","w")
f.write("python真简单\n我超爱学习!!\n")
f.close()
在实际问题中,很多时候数据中的时间会以各种形式出现,那么如何处理呢?
这时候就可以用到time模块
代码如下(示例):
import time
print(time.time()) # 结果:1681116152.3870115
这部分怎么理解呢,时间本来就是一个相对的概念嘛,比如说2023年,其实也是以公元为纪年的,这168…是相对于计算机存储中给定的哪一个初始时间得到的。
那么我想得到日常更加习惯的那种时间表示方法应该怎么写?
#localtime
print(time.localtime(time.time()))
print(type(time.localtime(time.time())))
但是可以看到返回的值是一个类,还是不够具体,继续改
print(time.asctime(time.localtime(time.time()))) #Mon Apr 10 16:47:08 2023
可以看到,虽然很具体了,但是是按外国的书写方式
print(time.strftime("%Y-%m-%d %H:%M:%S",time.localtime())) #2023-04-10 16:48:48