学习爬虫过程中遇到的问题总结

1.下载数据编码问题

"title":["\u5a92\u4f53\u63ed\u5730\u94c1\"\u5988\u5988\u4e10\u5e2e\":\u5e26\u5a03\u884c\u4e5e\u6708\u5165\u8fc7\u4e07(\u56fe)"]

存放在文本文件中是上面这种Unidcode形式编码的,存放到数据库中是自动转码的,转换化为文字形式。如果想打印出汉字,前面加“U”之后就可以了。

你可能感兴趣的:(学习爬虫过程中遇到的问题总结)