7.爬虫——保存数据为csv

首先需要依赖库

import pandas as pd

先吧需要保存的数据转为数组,这里就不做相应爬取。只吧数组部分抬出来

#这里是python的语法,意思是吧循环后的i['bookName']拿出来作为一个数组
picPath  = [i['picPath'] for i in jsonData['data']]
bookName  = [i['bookName'] for i in jsonData['data']]
bookId  = [i['bookId'] for i in jsonData['data']]

吧list数据制作成相应表格数据

注意这里DataFrame传入的是一个字典,value值为上面抬出来的数组

#传入字典型数据转成一个表格
book_info = pd.DataFrame({'picPath':picPath,'bookName':bookName,'bookId':bookId})

保存到指定文件

# 保存文件,不适用index,编码方式为utf-8-sig(可以解决csv的乱码问题)
book_info.to_csv('tmp/book_info.csv',index=None,encoding='utf-8-sig')

你可能感兴趣的:(Python爬虫,python,数据挖掘,开发语言)