Watson使用指南(六)在微信公众号中实现识图作诗功能

本文章主要是写一下这个项目开发的过程及之间遇到的问题,作为记录,也希望以此为契机认识志同道合的朋友,一起学习交流。

目录:

  • 概述

  • 环境准备及相关账号申请

  • 部署Python Flask应用到Bluemix

  • 通过Bluemix认证公众微信号

  • 识图作诗相关功能开发

  • 总结

概述

本文将从一个开发人员角度,介绍如何使用Bluemix平台开发和部署Python Flask应用,如何通过Bluemix进行微信公众号认证,最后结合相关Watson服务,实现用户向公众号发送图片,后台识别图片并返回诗文的功能。

Bluemix

BLuemix是IBM公司推出的一个云平台服务,通过它不仅可以部署本地应用到云端,还可以调用BLuemix本身自带的强大的一系列服务来实现很多功能。

Watson

Watson是IBM公司推出的一系列认知计算服务,包括自然语言分类,情感分析,图像识别等等,我在本系列的前几期已经完成了可用Python实现部分的文档翻译,详见

微信公众平台

作为一个程序员,使用微信公众号,关注点就不仅仅是发送推文消息了,通过自己开发,来实现一些有趣的功能,做不同于一般的公众号才是我想要的。

环境准备及相关账号申请

注册BLuemix账号

申请地址:http://www.bluemix.net 在页面右上角点击注册,填写相关信息提交申请,Bluemix 会发一封确认邮件到注册邮箱,需要手工进入注册邮箱点击确认,才能成功注册。第一次登陆 Bluemix 控制台的时候,会要求创建工作空间,建议创建在悉尼或英国(虽然访问都很慢)。

安装CloudFoundry工具

通过该工具,可以在命令行使用CF相关命令进行与BLuemix之间的交互,包括部署,更新,查询。详见:http://docs.cloudfoundry.org/...

注册微信公众号

这个很简单,而且网上一搜很多,我在这里就不说了。

部署Python Flask应用到Bluemix

Python Flask

Python Flask 是基于Python的一种轻量级网络框架,便捷易用。这个应用中Flask仅仅起到传递参数的作用,对于Flask本身的使用不是很多。这就是说,你同样可以仅仅使用Python,因为Python本身也可以提供网络服务。

创建应用

在Bluemix首页点击创建应用,新的页面中会显示很多可创建的应用案例,下拉菜单找到Flask,创建,根据提示填写域名等信息。创建后根据页面提示下载模板代码到本地。

要想在bluemix下成功运行应用,至少需要有manifest.yml,requirements.txt,runtime.txt和app.py这四个文件。

manifest.yml

这是应用程序的基本配置信息,包括域名和主机名。是下载源码后默认的,不需要更改。

requirements.txt

这个文件中包含应用所需要的第三方依赖,比如我的应用里是这样的:

Flask
watson_developer_cloud
lxml

flask是Python网络框架。watson_developer_cloud用于调用Watson服务。lxml包用来爬取网络信息。

runtime.txt

该文件用来指定需要的Python版本

app.py

Python应用的脚本或源代码文件,我会在“识图作诗相关功能开发”做详细说明

部署应用

在本地进行应用的开发,并且本地调试和运行成功后就可以部署代码了。在bluemix上点击应用程序,在应用程序菜单选择“入门”,根据提示在本地命令行使用cf命令就可以成功push到BLuemix上。如果过程中遇到问题,可以通过

cf logs 应用程序名 --recent

来查看错误

创建并绑定服务

在Bluemix应用程序界面找到创建新服务,同创建应用程序一样,新界面会有很多服务可供选择。这里,我选择的是Visual Recognition服务来进行图片识别。创建新服务后,点击连接到现有应用程序,就OK了。关于服务的创建,具体参见Watson使用指南(五)

通过Bluemix认证公众微信号

在微信公众号页面打开开发者页面,进行服务器配置。需要注意的是令牌自己随意填写就好。
新建auth.py,根据微信官方的文档,获取相关参数:


        token = '微信页面填写的令牌'   
        signature = request.args.get('signature', '')  
        echostr = request.args.get('echostr', '')  
        timestamp = request.args.get('timestamp', '')  
        nonce = request.args.get('nonce', '')  
        tmp = [timestamp, nonce, token]  
        tmp.sort()  
        tmp = ''.join(tmp)  
        if ( hashlib.sha1(tmp).hexdigest() == signature ):    
            return make_response(echostr)

push代码到Bluemix,在微信页面点击提交,显示提交成功,就完了通过Bluemix认证微信号。

识图作诗相关功能开发

顾名思义,识图作诗,就包括识图和作诗两个部分。用到三个文件,visual.py,translate.py,poem.py

visual.py

调用Watson服务,返回的是嵌套字典信息,可以转换成JSON格式然后提取信息。这里直接操作字典提取:

def VisualContent(url):
  visualRecognition = VisualRecognitionV3('2016-05-20', api_key='创建服务后系统返回的api_key')

  content = visualRecognition.classify(images_url = url)

  images = content.get("images")
  classifiers = images[0].get("classifiers")
  classes = classifiers[0].get("classes")
  res = classes[0].get("class")
  

  return res

translate.py

Watson服务中有翻译服务,但是不支持英汉互译。而获取到的图片信息都是英文,显然不能直接去用英文来搜索相关诗文。于是我写了这个模块,直接在有道翻译的网页中获取翻译。

 def Translate(word):
  url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&smartresult=ugc&sessionFrom=http://www.youdao.com/'
  key = word

  data = {}
  data['type'] = 'AUTO'
  data['i'] = key
  data['doctype'] = 'json'
  data['xmlVersion'] = '1.6'
  data['keyfrom'] = 'fanyi.web'
  data['ue'] = 'UTF-8'
  data['typoResult'] = 'true'

  data = urllib.parse.urlencode(data).encode("utf-8")
  content = urllib.request.urlopen(url, data).read().decode("utf-8")
  json_content = json.loads(content)
  res = json_content["translateResult"][0][0]['tgt'][:2]

  return res

poem.py
最后一个部分,就是根据图片内容获得诗文信息了,简单的爬虫,用xpath直接
获得网页内容。

def MakePoem(word):
  url_base = "地址"
  key = word
  url = url_base+key
  res = requests.get(url)
  res.encoding = 'utf-8'
  #print(res.text)
  root = etree.HTML(res.content)
  items = root.xpath('//div[@class="sons"][2]/p[@style="margin-bottom:0px;"]')[0]
  item = items.xpath('string(.)')
  
  content = item.replace('\n','').replace(' ','')
  length = len(content)
  answer = content[:length-1]

  return answer

其他
值得一提的是,微信公众号中的消息处理都是以xml格式封装的,所以在获取用户消息中,需要解析格式获取消息内容;同样,返回消息时,也要对内容封装后再返回用户。

总结

通过这几天微信后台的反馈来看,服务器不稳定,识别内容类别较少,爬取信息不稳定这三个因素经常导致用户会收到“暂时停止服务”的消息。
后期添加异常处理模块希望能使错误信息得到人性化反馈。

这是我的公众号,欢迎关注

你可能感兴趣的:(python,微信公众平台,ibm)