基于
Python
的豆瓣图书评论数据获取与可视化分析
周洪斌
【摘
要】
利用
Python
从豆瓣书评页面中获取图书相关数据,通过数据清洗、
提取,把图书名称、作者、出版社、评论分数、评价人数等关键信息保存到
MySQL
数据库存储,并对评论分数、评价人数等进行可视化分析。实验结果
表明,此方法可以快捷、有效地对豆瓣图书评论数据进行分析。
【期刊名称】
沙洲职业工学院学报
【年
(
卷
),
期】
2018(021)004
【总页数】
6
【关键词】
Python
;图书评论;数据分析
基金项目:
2016
年江苏省高等职业教育产教深度融合实训平台建设项目
(
201618
)
;
江
苏
省
教
育
科
学
“
十
三
五
”
规
划
青
年
专
项
重
点
课
题
(
C-
b/2016/03/17
)
。
引言
豆瓣读书已成为国内信息全、用户数量大且非常活跃的专业读书网站,专注于
为用户提供全面且精细化的读书服务。通过获取、分析豆瓣图书评论数据,可
以对读者购书提供借鉴意义。采用
Python
可以快速获取、分析大量的豆瓣书
评数据,得出可靠、准确的评论结果。
1
相关技术简介
1.1 Python
简介
Python
语言具备易用、高效、可移植、可扩展等特性,已成为云计算、大数
据、人工智能时代的首选程序设计语言。
[1]Python
语言已有
10
万多个第三方