python关键词对联_使用百度 AI 进行智能写诗 & 智能春联

注:本博客为博主在 百度 AI 社区 上分享的一篇文章,由于本博主也是作为一个学习者,所以如果文章中存在错误或者不适合的地方还请见谅。

先来一波推荐:

如果你也喜欢开发,欢迎加入百度 AI 开发平台的核心团队,分享自己的 idea,当然也是有福利的,具体信息访问以下链接:【招募令】核心团队在找最优秀的你! 。如果不介意的话可以说是我推荐的哟,本博主百度AI社区ID:busyboxs

我为什么要做这个小项目?

要说起我为什么要做这个小项目,其实要从我的学习生涯谈起。我本来是学深度学习图像处理的,所以经常关注深度学习相关的咨询。当然也喜欢将实际的理论知识用于实践中,在两年前,使用深度学习来对对联火了一段时间,我当时也关注了这个,印象比较深刻的是 王斌给您对对联 -_-!,这个是用 tensorflow 来实现的项目,但是由于我主要是做 CV 的,对于 NLP 很多东西不是很了解,所以没有深入去理解里面的网络结构。后来一次偶然的机会接触到了百度 AI 开放平台,看到里面有提供这个接口,所以打算尝试写一个我自己的对对联项目。所以这个小项目得以诞生,虽然可能还是由很多问题,并不完善,但是在写出这个小项目后还是蛮开心的。我从中也学会了一些新知识,比如 Flask 库的使用以及 request 相关的知识。我的小项目里也借用了 王斌给您对对联 -_-! 中的一些网页元素,在此对作者的分享表示感谢,同时感谢百度 AI 开放平台提供的接口,只是遗憾的是这个接口的免费调用次数有所限制。

百度 AI 目前提供了智能写作的接口,主要包括智能写诗接口与智能春联接口。具体的使用说明可以参考文档 https://ai.baidu.com/ai-doc/NLP/Nk3ippdkc.

智能写作接口说明

智能春联接口

智能春联是指根据用户输入的命题关键词自动生成一副春联,包括上联、下联和横批。

智能春联的请求参数如下表:

参数

是否必选

类型

描述

text

string

字符串(限5字符数以内)即春联的主题

index

int

整数 默认为数值为0,即第一幅春联。每换一次,数值加1即可,一定数量后会返回之前的春联结果。

上面两个字符段是接口的输入,text 字数小于 5,是春联的主题。 index 可以用来指定生成的对联,不同的 index 可能会生成不同的对联。

智能春联的返回参数如下表:

参数

类型

描述

couplets

object

object嵌套结构,对应返回的春联

+first

string

春联上联:成7-9个字的上联

+second

string

春联下联:生成7-9个字的春联下联

+center

string

春联横批:生成4个字的春联横批

其输出为 json 字符串。例如:“春节”对应的一个输出为

{

'couplets': {

'center': '迎春接福',

'first': '春节迎春新世纪',

'second': '福音报福小康年'

}

}

智能写诗接口

智能写诗是指根据用户输入的命题关键词自动生成一首7言绝句。

智能写诗的请求参数如下表:

参数

是否必选

类型

描述

text

string

字符串(限5字符数以内,)即作诗的主题

index

int

整数 默认为数值为0,即第一首诗。每换一次,数值加1即可,一定数量后会返回之前的作诗结果

这两个输入字段和智能春联的两个输入字段相同,只是,text 代表诗的主题

智能写诗的返回参数如下表:

参数

类型

描述

poem

array

数组结构,元素对应7言绝句诗

+title

string

诗名,即用户输入作诗主题

+content

string

作诗结果:为一首7言绝句

其输出也是 json 字符串,例如:“百度”对应的一个输出为

{

"poem": [

{

"title": "百度"

"content": "神州百度庆元功

华夏千秋唱大风

伟业宏图开盛世

红旗锦绣耀长空"

}

]

}

错误码说明

错误码

错误信息

描述

52000

成功

52001

请求超时

重试

52002

系统错误

重试

52003

未授权用户

检查您的appid是否正确

52004

输入解析失败

检查输入编码格式,有无特殊字符,是否是json格式

52005

输入字段有误

是否包含text字段

52006

输入文本长度有误

输入不能超过5个字符

52007

输入文本包含政治&黄色内容

换输入文本

52008

后台服务返回错误

重试

54003

访问频率受限

请降低您的调用频率

54100

查询接口参数为空

检查是否少传参数

54102

无写诗结果

重试

2

后端连接超时

重试

代码实现

本文使用 python3 来调用智能春联和智能写诗接口,接下来一步一步进行说明。

创建应用

首先进入到控制台,然后在“总览”下找到“产品服务” -> “人工智能” -> “自然语言处理”。

然后点击创建应用,填写好“应用名称”、“应用描述”,其他默认就行,然后点击“创建”。

创建好应用之后,进入“应用列表”,就能看到应用的相关信息,我们需要的是 API Key 和 Secret Key。

获取 access token

通过 API Key 和 Secret Key 获取的 access_token。更多关于 access_token 的获取方法参考 https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjhhu。

下面代码是 python3 获取 access_token 的代码

# 获取 token

def get_token_key():

token_key = ''

# client_id 为官网获取的AK, client_secret 为官网获取的SK

client_id = '【百度云应用的AK】'

client_secret = '【百度云应用的SK】'

host = f'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials' \

f'&client_id={client_id}&client_secret={client_secret}'

request = Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response = urlopen(request)

token_content = response.read()

if token_content:

token_info = json.loads(token_content)

token_key = token_info['access_token']

return token_key

token_content 中包含很多信息,例如输出如下(为了我个人信息安全,部分内容用 * 代替):

{'access_token': '****************************************',

'expires_in': 2592000,

'refresh_token': '*******************************************',

'scope': 'brain_nlp_sentiment_classify_custom public nlp_simnet nlp_wordemb '

'nlp_comtag nlp_dnnlm_cn brain_nlp_lexer brain_all_scope '

'brain_nlp_comment_tag brain_nlp_dnnlm_cn brain_nlp_word_emb_vec '

'brain_nlp_word_emb_sim brain_nlp_sentiment_classify '

'brain_nlp_simnet brain_nlp_depparser brain_nlp_wordembedding '

'brain_nlp_dnnlm_cn_legacy brain_nlp_simnet_legacy '

'brain_nlp_comment_tag_legacy brain_nlp_lexer_custom '

'brain_nlp_keyword brain_nlp_topic brain_nlp_ecnet brain_nlp_emotion '

'brain_nlp_comment_tag_custom wise_adapt lebo_resource_base '

'lightservice_public hetu_basic lightcms_map_poi kaidian_kaidian '

'ApsMisTest_Test权限 vis-classify_flower lpq_开放 cop_helloScope '

'ApsMis_fangdi_permission smartapp_snsapi_base iop_autocar '

'oauth_tp_app smartapp_smart_game_openapi oauth_sessionkey '

'smartapp_swanid_verify smartapp_opensource_openapi',

'session_key': '*****************************',

'session_secret': '*******************************'}

而我们需要的只是 access_token,因此只需获取该字段就行。

调用智能春联接口

调用智能春联接口的 python3 实现代码如下:

# 调用百度 AI 智能春联接口(用于测试)

def get_couplets(text, token_key, index=0):

"""

调用百度AI智能春联接口,并生成横批、上联和下联

:param text: 智能春联的主题(官方限制不超过5个字)

:param token_key: 通过调用 get_token_key() 获取的 token

:param index: 不同的 index 会生成不同的春联

:return: 调用智能春联生成的数据

"""

request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/couplets'

params_d = dict()

params_d['text'] = text

params_d['index'] = index

params = json.dumps(params_d).encode('utf-8')

access_token = token_key

request_url = request_url + "?access_token=" + access_token

request = Request(url=request_url, data=params)

request.add_header('Content-Type', 'application/json')

response = urlopen(request)

content = response.read()

if content:

data = json.loads(content)

return data

# 解析生成的春联

def parse_couplets(data):

"""

解析调用智能春联生成的数据

:param data: 调用智能春联生成的有效数据

:return: 横批(center)、上联(first)和下联(second)

"""

center = data['couplets']['center']

first = data['couplets']['first']

second = data['couplets']['second']

# print(f'上联:{first}')

# print(f'下联:{second}')

# print(f'横批:{center}')

return center, first, second

get_couplets 函数调用接口得到返回的值,parse_couplets 函数解析调用智能春联生成的有效数据。这里所说的有效数据是指调用接口没有发生错误的情况。在正确调用接口时,data 输出示例如下:

{

'couplets': {

'center': '迎春接福',

'first': '春节迎春新世纪',

'second': '福音报福小康年'

}

}

是一个字典型数据,直接进行解析就能得到横批、上联和下联。如果想要获取同一主题不同的对联,可以尝试不同的 index。

当调用接口失败时,就会得到无效的 data,通过解析 data,能够获得错误信息,下面是解析错误的代码,能够返回对应错误的中文描述。

# 错误代码

ERROR_DICT = {

'2': '后端连接超时请重试',

'52001': '请求超时请重试',

'52002': '系统错误请重试',

'52003': '未授权用户',

'52004': '输入解析失败',

'52005': '输入字段有误',

'52006': '输入文本长度不超过5',

'52007': '输入文本包含政治&黄色内容',

'52008': '后台服务返回错误请重试',

'54003': '访问频率受限',

'54100': '查询接口参数为空',

'54102': '无写诗结果请重试'

}

# 解析是否调用接口错误,如果有返回对应的提示,没有返回None

def parse_error(data):

"""

解析是否调用接口错误

:param data: 调用接口生成的数据

:return: 如果出错,返回对应的错误信息,否则返回None

"""

if 'error_code' in data:

code = data['error_code']

error = ERROR_DICT[str(code)]

return error

return None

调用智能写诗接口

调用智能写诗接口的 python3 实现代码如下:

# 调用百度 AI 智能写诗接口(用于测试)

def get_poem(text, token_key, index=0):

"""

调用百度AI智能写诗接口,并生成七言诗

:param text: 智能写诗的主题(官方限制不超过5个字)

:param token_key: 通过调用 get_token_key() 获取的 token

:param index: 不同的 index 会生成不同的七言诗

:return: 调用智能写诗生成的数据

"""

request_url = 'https://aip.baidubce.com/rpc/2.0/nlp/v1/poem'

params_d = dict()

params_d['text'] = text

params_d['index'] = index

params = json.dumps(params_d).encode('utf-8')

access_token = token_key

request_url = request_url + "?access_token=" + access_token

request = Request(url=request_url, data=params)

request.add_header('Content-Type', 'application/json')

response = urlopen(request)

content = response.read()

if content:

data = json.loads(content)

return data

# 解析生成的诗句

def parse_poem(data):

"""

解析调用智能写诗生成的数据

:param data: 调用智能写诗生成的有效数据

:return: 诗的题目(title)和诗的内容(content)

"""

title = data['poem'][0]['title']

poem = data['poem'][0]['content'].replace('\t', '\n')

# print(title)

# print(poem)

return title, poem

在正确调用接口时,data 输出如下:

{

"poem": [

{

"title": "百度"

"content": "神州百度庆元功

华夏千秋唱大风

伟业宏图开盛世

红旗锦绣耀长空"

}

]

}

是一个字典型数据,直接进行解析就能得到题目和内容。如果想要获取同一主题不同的诗,可以尝试不同的 index。

案例应用

本文进一步通过网页的形式将上述功能进行实现,使用Flask来部署。

首先创建一个文件夹 flaskr,该文件夹下有一个名为 static 的文件夹,用于存放 css 样式和背景图片,还有一个文件夹名为 templates 用于存放 html 网页,另外还有一个 python 文件,用于执行 flask。

以下是 Flask 相关代码

from flask import Flask, render_template, request, redirect, url_for, session

from flaskr.poem import nlp_result, parse_error, parse_couplets, parse_poem

import random

app = Flask(__name__)

token_key = '【你获取的token】'

@app.route("/", methods=('GET', 'POST'))

def index():

if request.method == 'POST':

couplets = request.form.get('couplets')

if couplets is not None:

return redirect(url_for('get_couplets'))

poem = request.form.get('poem')

if poem is not None:

return redirect(url_for('get_poem'))

return render_template('couplets/index.html')

@app.route("/couplets", methods=('GET', 'POST'))

def get_couplets():

if request.method == 'POST':

center = None

first = None

second = None

title = request.form.get('theme')

back = request.form.get('back')

if back == '返回':

return redirect(url_for('index'))

index = random.randint(0, 10)

data = nlp_result(title, token_key, index, way='couplets')

error = parse_error(data)

if not error:

center, first, second = parse_couplets(data)

return render_template('couplets/show.html',

center=center,

first=first,

second=second,

title=title,

error=error)

return render_template('couplets/base.html')

@app.route("/poem", methods=('GET', 'POST'))

def get_poem():

if request.method == 'POST':

title = None

poem = None

title = request.form.get('theme')

back = request.form.get('back')

if back == '返回':

return redirect(url_for('index'))

index = random.randint(0, 10)

data = nlp_result(title, token_key, index, way='poem')

error = parse_error(data)

if not error:

title, poem = parse_poem(data)

return render_template('couplets/poem_show.html',

title=title,

poem=poem,

error=error)

return render_template('couplets/poem_index.html')

if __name__ == '__main__':

app.run(debug=True)

该代码中有三个函数,分别对应三个界面,如果运行地址为 http://127.0.0.1:5000/,那么三个界面对应的网址分别为 http://127.0.0.1:5000/、http://127.0.0.1:5000/couplets 和 http://127.0.0.1:5000/poem。表示主页、对联页和写诗页。

其效果展示如下:

处理错误信息的效果展示如下:

你可能感兴趣的:(python关键词对联)