小白练手:把王兴的饭否消息搬运到微博

想法来源

我和室友@mikipku都喜欢个人风格强烈又充满智慧的人,比较典型的,国外有YC创始人Paul Graham、「从零到一」作者Peter Thiel,国内的有王兴、纯银、来总。

王兴给人的印象是非常谨慎地公开发表言论,但有一天我发现王兴在饭否上竟然是个话唠。于是我专门下了一个「御饭」来视奸王兴的饭否,后来我俩合计可以做一个机器人,把王兴的饭否搬运到微博上,这样就能在微博上直接看了,然后说不定还能做点营销、搞个几十万粉丝啥的。产品经理就是这么容易自嗨。。。

搬运过程

上周末大概花了半天时间,写了个python脚本,配置到阿里云上线。
在微博上搜索王兴或者直接点击@王兴在饭否就可以关注啦~

完成这个机器人一共用了四个模块的东西,自己做下记录和总结

  1. 读饭否消息
  2. 发微博
  3. 写Python脚本
  4. 部署到服务器

读饭否消息

别急着搞爬虫,先看看人家是不是开放了接口 —某著名程序员

先了解下饭否支持的接口和认证方式

  • 饭否接口文档目录:https://github.com/FanfouAPI/FanFouAPIDoc/wiki/Apicategory
  • oauth授权:https://github.com/FanfouAPI/FanFouAPIDoc/wiki/Oauth

注意:不需要去v2ex发帖申请,直接到 http://fanfou.com/apps 申请新应用,即可获得需要的key和secret。

文档中对认证和访问流程的说明很详细,按照文档调试就行了。
有几个需要注意的地方:

  1. 调试oauth1.0的时候,需要的时间戳、签名、随机数等自己操作起来可能比较麻烦,可以直接用postman的Authorization调试,非常方便,令人感动
  2. 接口文档中的入参说明缺少了secret,在获取access token和访问接口的时候,都需要传入对于的secret

绕过几个坑以后,调试接口很快就能完成了。
这个程序只用到了一个接口:浏览用户已发消息

微博接口

微博支持的接口和认证方式

  • 微博API:http://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI
  • 接口文档最下方说明了支持的oauth2.0认证

注意:微博的接口有一个坑,在发微博的时候,需要在headers里边加一个Content-Type,否则不成功。

headers={'Authorization':'OAuth2 2.00xxxxxxxxxxx',
'Content-Type':'application/x-www-form-urlencoded'}

Python脚本

Python脚本逻辑非常简单,从网上搜一下requests的相关文档就够用了。

  1. 循环读取王兴的最新一条饭否,拿到内容和id
  2. 如果id有更新,则把内容发一条微博;如果没有更新,等几分钟再请求一次

注意:饭否的接口年久失修,经常会超时,所以一定要处理异常。

try:
  statuses=requests.get('http://api.fanfou.com/statuses/user_timeline.json',params=params)
except requests.ConnectionError:    
   print time.strftime("%Y-%m-%d %A %X %Z", time.localtime())+':饭否接口请求失败'

部署到服务器

我买的是阿里云的Ubuntu服务器,按流量计费,每小时0.14元。

注意两点

  1. 买完服务器以后,要先在网页版上开ssh服务,否则在本机登录不上去,会一直报错connection refused,蛋疼!
$:service ssh start
  1. 需要让脚本在后台一直执行,可以用nohup
$:nohup python wx.py &

执行后会在当前目录自动生成nohup.out文件,查看输出日志。
确认后台进程

$:ps -ef | grep python

你可能感兴趣的:(小白练手:把王兴的饭否消息搬运到微博)