本文章主要是写一下这个项目开发的过程及之间遇到的问题,作为记录,也希望以此为契机认识志同道合的朋友,一起学习交流。
目录:
概述
环境准备及相关账号申请
部署Python Flask应用到Bluemix
通过Bluemix认证公众微信号
识图作诗相关功能开发
总结
概述
本文将从一个开发人员角度,介绍如何使用Bluemix平台开发和部署Python Flask应用,如何通过Bluemix进行微信公众号认证,最后结合相关Watson服务,实现用户向公众号发送图片,后台识别图片并返回诗文的功能。
Bluemix
BLuemix是IBM公司推出的一个云平台服务,通过它不仅可以部署本地应用到云端,还可以调用BLuemix本身自带的强大的一系列服务来实现很多功能。
Watson
Watson是IBM公司推出的一系列认知计算服务,包括自然语言分类,情感分析,图像识别等等,我在本系列的前几期已经完成了可用Python实现部分的文档翻译,详见
微信公众平台
作为一个程序员,使用微信公众号,关注点就不仅仅是发送推文消息了,通过自己开发,来实现一些有趣的功能,做不同于一般的公众号才是我想要的。
环境准备及相关账号申请
注册BLuemix账号
申请地址:http://www.bluemix.net 在页面右上角点击注册,填写相关信息提交申请,Bluemix 会发一封确认邮件到注册邮箱,需要手工进入注册邮箱点击确认,才能成功注册。第一次登陆 Bluemix 控制台的时候,会要求创建工作空间,建议创建在悉尼或英国(虽然访问都很慢)。
安装CloudFoundry工具
通过该工具,可以在命令行使用CF相关命令进行与BLuemix之间的交互,包括部署,更新,查询。详见:http://docs.cloudfoundry.org/...
注册微信公众号
这个很简单,而且网上一搜很多,我在这里就不说了。
部署Python Flask应用到Bluemix
Python Flask
Python Flask 是基于Python的一种轻量级网络框架,便捷易用。这个应用中Flask仅仅起到传递参数的作用,对于Flask本身的使用不是很多。这就是说,你同样可以仅仅使用Python,因为Python本身也可以提供网络服务。
创建应用
在Bluemix首页点击创建应用,新的页面中会显示很多可创建的应用案例,下拉菜单找到Flask,创建,根据提示填写域名等信息。创建后根据页面提示下载模板代码到本地。
要想在bluemix下成功运行应用,至少需要有manifest.yml,requirements.txt,runtime.txt和app.py这四个文件。
manifest.yml
这是应用程序的基本配置信息,包括域名和主机名。是下载源码后默认的,不需要更改。
requirements.txt
这个文件中包含应用所需要的第三方依赖,比如我的应用里是这样的:
Flask
watson_developer_cloud
lxml
flask是Python网络框架。watson_developer_cloud用于调用Watson服务。lxml包用来爬取网络信息。
runtime.txt
该文件用来指定需要的Python版本
app.py
Python应用的脚本或源代码文件,我会在“识图作诗相关功能开发”做详细说明
部署应用
在本地进行应用的开发,并且本地调试和运行成功后就可以部署代码了。在bluemix上点击应用程序,在应用程序菜单选择“入门”,根据提示在本地命令行使用cf命令就可以成功push到BLuemix上。如果过程中遇到问题,可以通过
cf logs 应用程序名 --recent
来查看错误
创建并绑定服务
在Bluemix应用程序界面找到创建新服务,同创建应用程序一样,新界面会有很多服务可供选择。这里,我选择的是Visual Recognition服务来进行图片识别。创建新服务后,点击连接到现有应用程序,就OK了。关于服务的创建,具体参见Watson使用指南(五)
通过Bluemix认证公众微信号
在微信公众号页面打开开发者页面,进行服务器配置。需要注意的是令牌自己随意填写就好。
新建auth.py,根据微信官方的文档,获取相关参数:
token = '微信页面填写的令牌'
signature = request.args.get('signature', '')
echostr = request.args.get('echostr', '')
timestamp = request.args.get('timestamp', '')
nonce = request.args.get('nonce', '')
tmp = [timestamp, nonce, token]
tmp.sort()
tmp = ''.join(tmp)
if ( hashlib.sha1(tmp).hexdigest() == signature ):
return make_response(echostr)
push代码到Bluemix,在微信页面点击提交,显示提交成功,就完了通过Bluemix认证微信号。
识图作诗相关功能开发
顾名思义,识图作诗,就包括识图和作诗两个部分。用到三个文件,visual.py,translate.py,poem.py
visual.py
调用Watson服务,返回的是嵌套字典信息,可以转换成JSON格式然后提取信息。这里直接操作字典提取:
def VisualContent(url):
visualRecognition = VisualRecognitionV3('2016-05-20', api_key='创建服务后系统返回的api_key')
content = visualRecognition.classify(images_url = url)
images = content.get("images")
classifiers = images[0].get("classifiers")
classes = classifiers[0].get("classes")
res = classes[0].get("class")
return res
translate.py
Watson服务中有翻译服务,但是不支持英汉互译。而获取到的图片信息都是英文,显然不能直接去用英文来搜索相关诗文。于是我写了这个模块,直接在有道翻译的网页中获取翻译。
def Translate(word):
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'
key = word
data = {}
data['type'] = 'AUTO'
data['i'] = key
data['doctype'] = 'json'
data['xmlVersion'] = '1.6'
data['keyfrom'] = 'fanyi.web'
data['ue'] = 'UTF-8'
data['typoResult'] = 'true'
data = urllib.parse.urlencode(data).encode("utf-8")
content = urllib.request.urlopen(url, data).read().decode("utf-8")
json_content = json.loads(content)
res = json_content["translateResult"][0][0]['tgt'][:2]
return res
poem.py
最后一个部分,就是根据图片内容获得诗文信息了,简单的爬虫,用xpath直接
获得网页内容。
def MakePoem(word):
url_base = "地址"
key = word
url = url_base+key
res = requests.get(url)
res.encoding = 'utf-8'
#print(res.text)
root = etree.HTML(res.content)
items = root.xpath('//div[@class="sons"][2]/p[@style="margin-bottom:0px;"]')[0]
item = items.xpath('string(.)')
content = item.replace('\n','').replace(' ','')
length = len(content)
answer = content[:length-1]
return answer
其他
值得一提的是,微信公众号中的消息处理都是以xml格式封装的,所以在获取用户消息中,需要解析格式获取消息内容;同样,返回消息时,也要对内容封装后再返回用户。
总结
通过这几天微信后台的反馈来看,服务器不稳定,识别内容类别较少,爬取信息不稳定这三个因素经常导致用户会收到“暂时停止服务”的消息。
后期添加异常处理模块希望能使错误信息得到人性化反馈。
这是我的公众号,欢迎关注