首先感谢@苏莉安苏神的看知乎知乎用户数据,详情请看:1024 Days
苏神的辛勤劳动成果zhidata.sql 压缩文件云盘链接为: http://pan.baidu.com/s/1c22ycWo 压缩文件大小为1.48G。
以下是详细介绍如何在Ubuntu 14.0.4系统环境下将zhidata.sql 导入至本地的MySQL数据库:
一、下载并解压zhidata.sql.gz
zhidata.sql.gz文件链接: http://pan.baidu.com/s/1c22ycWo 解压后文件大小为4.7G。
二、安装与登录MySQL数据库
在终端中使用三条安装MySQL命令:
1. sudo apt-get install mysql-server
2. sudo apt-get install mysql-client
3. sudo apt-get install libmysqlclient-dev
注意:以上命令需要root用户权限
中途需要设置MySQL密码
验证Mysql安装成功:
使用命令: sudo netstat -tap | grep mysql验证
若处于LISTEN状态,则说明MySQL安装成功。
登录MySQL:
使用:mysql -uroot -p命令登录,需要使用刚刚设置的MySQL密码。
至此,MySQL 安装并成功登录。
三、使用SQL语句在终端创建数据库
登录MySQL后,使用 show databases;(有分号,下同)语句查看已存在的所有数据库。
上图的数据库是安装MySQL后默认存在的数据库,我们需要为知乎用户数据创建新的数据库,使用语句:create database zhihu;即新的数据库命名为:zhihu
再次使用: show databases; 语句查看已有数据库
新创建的zhihu数据库已存在,使用zhihu数据库,使用:use zhihu;语句
四、导入数据
这时zhihu数据库是空的,即里面是没表(table)的存在。需要把解压好的zhidata.sql导入到zhihu数据库中,使用:source /home/rescue/Desktop/zhidata.sql语句
注:source命令后的参数是zhidata.sql文件的具体位置,/home/rescue/Desktop/zhidata.sql只是我自己存放zhidata.sql的位置,根据个人zhidata.sql文件存放不同的位置而不同。
若以上操作无误,接下来就是等待(时间较长)数据插入(insert)到数据库中。
数据插入完成后,查看zhihu数据库中的表,使用:show tables;语句
可以看到zhihu数据库中已有三个表:snapshots:按日抓取的快照信息,1,048条
users:用户基本信息,127,366条
usersnapshots:每日快照中的用户数据,60,060,427条
说明知乎用户数据已成功导入到zhihu这个数据库中,再次验证使用:select * from users;语句
终端将显示users表中所有的记录
同理,可以使用select * from snapshots;查看所有快照记录,使用:select * from usersnapshots;查看所有快照中的用户数据。
五、使用Navicat for MySQL管理数据
但由于数据众多,在终端显示数据并不方便,建议使用Navicat for MySQL数据库管理工具,方便管理数据,Navicat for MySQL下载。
下载后,解压安装包
在终端中启动start_navicat脚本,使用:./start_navicat打开Navicat
将Navicat连接至本地MySQL数据库,点击connection按钮
填写connection Name,可任意,如test,填写Password,即填写安装MySQL数据库时设置的密码,点击OK确认后,Navicat与本地的MySQL数据库连接起来。
可以看到zhihu数据库下的三张表,点击任意表即可查询记录。
注:为了查看所有的记录,修改Navicat默认显示的行数,点击菜单栏中Tools的Options
取消Limit Records的限制,确定即可,这样所有的记录都显示出来。
至此,所有工作完成,展示出苏神1024 Days挖掘的数据,再次感谢苏神的付出,同样期待看知乎重出江湖,哪怕是以其他的方式。
而我,很惭愧,只做了一点微小的工作。