注:本博客为博主在 百度 AI 社区 上分享的一篇文章,由于本博主也是作为一个学习者,所以如果文章中存在错误或者不适合的地方还请见谅。
先来一波推荐:
如果你也喜欢开发,欢迎加入百度 AI 开发平台的核心团队,分享自己的 idea,当然也是有福利的,具体信息访问以下链接:【招募令】核心团队在找最优秀的你! 。如果不介意的话可以说是我推荐的哟,本博主百度AI社区ID:busyboxs
我为什么要做这个小项目?
要说起我为什么要做这个小项目,其实要从我的学习生涯谈起。我本来是学深度学习图像处理的,所以经常关注深度学习相关的咨询。当然也喜欢将实际的理论知识用于实践中,在两年前,使用深度学习来对对联火了一段时间,我当时也关注了这个,印象比较深刻的是 王斌给您对对联 -_-!,这个是用 tensorflow 来实现的项目,但是由于我主要是做 CV 的,对于 NLP 很多东西不是很了解,所以没有深入去理解里面的网络结构。后来一次偶然的机会接触到了百度 AI 开放平台,看到里面有提供这个接口,所以打算尝试写一个我自己的对对联项目。所以这个小项目得以诞生,虽然可能还是由很多问题,并不完善,但是在写出这个小项目后还是蛮开心的。我从中也学会了一些新知识,比如 Flask 库的使用以及 request 相关的知识。我的小项目里也借用了 王斌给您对对联 -_-! 中的一些网页元素,在此对作者的分享表示感谢,同时感谢百度 AI 开放平台提供的接口,只是遗憾的是这个接口的免费调用次数有所限制。
百度 AI 目前提供了智能写作的接口,主要包括智能写诗接口与智能春联接口。具体的使用说明可以参考文档 https://ai.baidu.com/ai-doc/NLP/Nk3ippdkc.
智能写作接口说明
智能春联接口
智能春联是指根据用户输入的命题关键词自动生成一副春联,包括上联、下联和横批。
智能春联的请求参数如下表:
参数
是否必选
类型
描述
text
是
string
字符串(限5字符数以内)即春联的主题
index
否
int
整数 默认为数值为0,即第一幅春联。每换一次,数值加1即可,一定数量后会返回之前的春联结果。
上面两个字符段是接口的输入,text 字数小于 5,是春联的主题。 index 可以用来指定生成的对联,不同的 index 可能会生成不同的对联。
智能春联的返回参数如下表:
参数
类型
描述
couplets
object
object嵌套结构,对应返回的春联
+first
string
春联上联:成7-9个字的上联
+second
string
春联下联:生成7-9个字的春联下联
+center
string
春联横批:生成4个字的春联横批
其输出为 json 字符串。例如:“春节”对应的一个输出为
{
'couplets': {
'center': '迎春接福',
'first': '春节迎春新世纪',
'second': '福音报福小康年'
}
}
智能写诗接口
智能写诗是指根据用户输入的命题关键词自动生成一首7言绝句。
智能写诗的请求参数如下表:
参数
是否必选
类型
描述
text
是
string
字符串(限5字符数以内,)即作诗的主题
index
否
int
整数 默认为数值为0,即第一首诗。每换一次,数值加1即可,一定数量后会返回之前的作诗结果
这两个输入字段和智能春联的两个输入字段相同,只是,text 代表诗的主题
智能写诗的返回参数如下表:
参数
类型
描述
poem
array
数组结构,元素对应7言绝句诗
+title
string
诗名,即用户输入作诗主题
+content
string
作诗结果:为一首7言绝句
其输出也是 json 字符串,例如:“百度”对应的一个输出为
{
"poem": [
{
"title": "百度"
"content": "神州百度庆元功
华夏千秋唱大风
伟业宏图开盛世
红旗锦绣耀长空"
}
]
}
错误码说明
错误码
错误信息
描述
52000
成功
无
52001
请求超时
重试
52002
系统错误
重试
52003
未授权用户
检查您的appid是否正确
52004
输入解析失败
检查输入编码格式,有无特殊字符,是否是json格式
52005
输入字段有误
是否包含text字段
52006
输入文本长度有误
输入不能超过5个字符
52007
输入文本包含政治&黄色内容
换输入文本
52008
后台服务返回错误
重试
54003
访问频率受限
请降低您的调用频率
54100
查询接口参数为空
检查是否少传参数
54102
无写诗结果
重试
2
后端连接超时
重试
代码实现
本文使用 python3 来调用智能春联和智能写诗接口,接下来一步一步进行说明。
创建应用
首先进入到控制台,然后在“总览”下找到“产品服务” -> “人工智能” -> “自然语言处理”。
然后点击创建应用,填写好“应用名称”、“应用描述”,其他默认就行,然后点击“创建”。
创建好应用之后,进入“应用列表”,就能看到应用的相关信息,我们需要的是 API Key 和 Secret Key。
获取 access token
通过 API Key 和 Secret Key 获取的 access_token。更多关于 access_token 的获取方法参考 https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu。
下面代码是 python3 获取 access_token 的代码
# 获取 token
def get_token_key():
token_key = ''
# client_id 为官网获取的AK, client_secret 为官网获取的SK
client_id = '【百度云应用的AK】'
client_secret = '【百度云应用的SK】'
host = f'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials' \
f'&client_id={client_id}&client_secret={client_secret}'
request = Request(host)
request.add_header('Content-Type', 'application/json; charset=UTF-8')
response = urlopen(request)
token_content = response.read()
if token_content:
token_info = json.loads(token_content)
token_key = token_info['access_token']
return token_key
token_content 中包含很多信息,例如输出如下(为了我个人信息安全,部分内容用 * 代替):
{'access_token': '****************************************',
'expires_in': 2592000,
'refresh_token': '*******************************************',
'scope': 'brain_nlp_sentiment_classify_custom public nlp_simnet nlp_wordemb '
'nlp_comtag nlp_dnnlm_cn brain_nlp_lexer brain_all_scope '
'brain_nlp_comment_tag brain_nlp_dnnlm_cn brain_nlp_word_emb_vec '
'brain_nlp_word_emb_sim brain_nlp_sentiment_classify '
'brain_nlp_simnet brain_nlp_depparser brain_nlp_wordembedding '
'brain_nlp_dnnlm_cn_legacy brain_nlp_simnet_legacy '
'brain_nlp_comment_tag_legacy brain_nlp_lexer_custom '
'brain_nlp_keyword brain_nlp_topic brain_nlp_ecnet brain_nlp_emotion '
'brain_nlp_comment_tag_custom wise_adapt lebo_resource_base '
'lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian '
'ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope '
'ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar '
'oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey '
'smartapp_swanid_verify smartapp_opensource_openapi',
'session_key': '*****************************',
'session_secret': '*******************************'}
而我们需要的只是 access_token,因此只需获取该字段就行。
调用智能春联接口
调用智能春联接口的 python3 实现代码如下:
# 调用百度 AI 智能春联接口(用于测试)
def get_couplets(text, token_key, index=0):
"""
调用百度AI智能春联接口,并生成横批、上联和下联
:param text: 智能春联的主题(官方限制不超过5个字)
:param token_key: 通过调用 get_token_key() 获取的 token
:param index: 不同的 index 会生成不同的春联
:return: 调用智能春联生成的数据
"""
request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/couplets'
params_d = dict()
params_d['text'] = text
params_d['index'] = index
params = json.dumps(params_d).encode('utf-8')
access_token = token_key
request_url = request_url + "?access_token=" + access_token
request = Request(url=request_url, data=params)
request.add_header('Content-Type', 'application/json')
response = urlopen(request)
content = response.read()
if content:
data = json.loads(content)
return data
# 解析生成的春联
def parse_couplets(data):
"""
解析调用智能春联生成的数据
:param data: 调用智能春联生成的有效数据
:return: 横批(center)、上联(first)和下联(second)
"""
center = data['couplets']['center']
first = data['couplets']['first']
second = data['couplets']['second']
# print(f'上联:{first}')
# print(f'下联:{second}')
# print(f'横批:{center}')
return center, first, second
get_couplets 函数调用接口得到返回的值,parse_couplets 函数解析调用智能春联生成的有效数据。这里所说的有效数据是指调用接口没有发生错误的情况。在正确调用接口时,data 输出示例如下:
{
'couplets': {
'center': '迎春接福',
'first': '春节迎春新世纪',
'second': '福音报福小康年'
}
}
是一个字典型数据,直接进行解析就能得到横批、上联和下联。如果想要获取同一主题不同的对联,可以尝试不同的 index。
当调用接口失败时,就会得到无效的 data,通过解析 data,能够获得错误信息,下面是解析错误的代码,能够返回对应错误的中文描述。
# 错误代码
ERROR_DICT = {
'2': '后端连接超时请重试',
'52001': '请求超时请重试',
'52002': '系统错误请重试',
'52003': '未授权用户',
'52004': '输入解析失败',
'52005': '输入字段有误',
'52006': '输入文本长度不超过5',
'52007': '输入文本包含政治&黄色内容',
'52008': '后台服务返回错误请重试',
'54003': '访问频率受限',
'54100': '查询接口参数为空',
'54102': '无写诗结果请重试'
}
# 解析是否调用接口错误,如果有返回对应的提示,没有返回None
def parse_error(data):
"""
解析是否调用接口错误
:param data: 调用接口生成的数据
:return: 如果出错,返回对应的错误信息,否则返回None
"""
if 'error_code' in data:
code = data['error_code']
error = ERROR_DICT[str(code)]
return error
return None
调用智能写诗接口
调用智能写诗接口的 python3 实现代码如下:
# 调用百度 AI 智能写诗接口(用于测试)
def get_poem(text, token_key, index=0):
"""
调用百度AI智能写诗接口,并生成七言诗
:param text: 智能写诗的主题(官方限制不超过5个字)
:param token_key: 通过调用 get_token_key() 获取的 token
:param index: 不同的 index 会生成不同的七言诗
:return: 调用智能写诗生成的数据
"""
request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/poem'
params_d = dict()
params_d['text'] = text
params_d['index'] = index
params = json.dumps(params_d).encode('utf-8')
access_token = token_key
request_url = request_url + "?access_token=" + access_token
request = Request(url=request_url, data=params)
request.add_header('Content-Type', 'application/json')
response = urlopen(request)
content = response.read()
if content:
data = json.loads(content)
return data
# 解析生成的诗句
def parse_poem(data):
"""
解析调用智能写诗生成的数据
:param data: 调用智能写诗生成的有效数据
:return: 诗的题目(title)和诗的内容(content)
"""
title = data['poem'][0]['title']
poem = data['poem'][0]['content'].replace('\t', '\n')
# print(title)
# print(poem)
return title, poem
在正确调用接口时,data 输出如下:
{
"poem": [
{
"title": "百度"
"content": "神州百度庆元功
华夏千秋唱大风
伟业宏图开盛世
红旗锦绣耀长空"
}
]
}
是一个字典型数据,直接进行解析就能得到题目和内容。如果想要获取同一主题不同的诗,可以尝试不同的 index。
案例应用
本文进一步通过网页的形式将上述功能进行实现,使用Flask来部署。
首先创建一个文件夹 flaskr,该文件夹下有一个名为 static 的文件夹,用于存放 css 样式和背景图片,还有一个文件夹名为 templates 用于存放 html 网页,另外还有一个 python 文件,用于执行 flask。
以下是 Flask 相关代码
from flask import Flask, render_template, request, redirect, url_for, session
from flaskr.poem import nlp_result, parse_error, parse_couplets, parse_poem
import random
app = Flask(__name__)
token_key = '【你获取的token】'
@app.route("/", methods=('GET', 'POST'))
def index():
if request.method == 'POST':
couplets = request.form.get('couplets')
if couplets is not None:
return redirect(url_for('get_couplets'))
poem = request.form.get('poem')
if poem is not None:
return redirect(url_for('get_poem'))
return render_template('couplets/index.html')
@app.route("/couplets", methods=('GET', 'POST'))
def get_couplets():
if request.method == 'POST':
center = None
first = None
second = None
title = request.form.get('theme')
back = request.form.get('back')
if back == '返回':
return redirect(url_for('index'))
index = random.randint(0, 10)
data = nlp_result(title, token_key, index, way='couplets')
error = parse_error(data)
if not error:
center, first, second = parse_couplets(data)
return render_template('couplets/show.html',
center=center,
first=first,
second=second,
title=title,
error=error)
return render_template('couplets/base.html')
@app.route("/poem", methods=('GET', 'POST'))
def get_poem():
if request.method == 'POST':
title = None
poem = None
title = request.form.get('theme')
back = request.form.get('back')
if back == '返回':
return redirect(url_for('index'))
index = random.randint(0, 10)
data = nlp_result(title, token_key, index, way='poem')
error = parse_error(data)
if not error:
title, poem = parse_poem(data)
return render_template('couplets/poem_show.html',
title=title,
poem=poem,
error=error)
return render_template('couplets/poem_index.html')
if __name__ == '__main__':
app.run(debug=True)
该代码中有三个函数,分别对应三个界面,如果运行地址为 http://127.0.0.1:5000/,那么三个界面对应的网址分别为 http://127.0.0.1:5000/、http://127.0.0.1:5000/couplets 和 http://127.0.0.1:5000/poem。表示主页、对联页和写诗页。
其效果展示如下:
处理错误信息的效果展示如下: