python实现文本审核_百度AI文本审核API使用说明

虽然,虽然,虽然,今天:

百度发布了2019年第一季度未经审计的财务报告。本季度百度营收241亿元人民币(约合35.9亿美元),同比增长15%,移除业务拆分收入影响,同比增长21%。低于市场预期242.7亿元。净亏损为人民币3.27亿元(约合4900万美元),去年同期净利润为人民币66.94亿元。这也是百度上市以来的首个季度亏损。

但我还是要肯定百度科技公司要做的工作,尤其是在AI的商业落地方面,做出了不少贡献,其开源的一系列资源供大多数科研工作者、企业工作者等摸索前进,心怀感恩,开放包容。

我做NLP这块,用到了百度AI平台的文本审核功能,也就是文本分类,判别文本的内容是否有违禁、暴恐、涉黄等内容。访问了它的API,一些工作记录如下:

单例样本体验地址:http://ai.baidu.com/tech/textcensoring?track=cp:ainsem|pf:pc|pp:chanpin-neirongshenhe|pu:neirongshenhe-wenben-1|ci:|kw:10002031

批量访问:

1)python工具

2)步骤1:申请access token,代码如下:

def get_access_key():

# client_id 为官网获取的AK, client_secret 为官网获取的SK

host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【百度云应用的AK】&client_secret=【百度云应用的SK】'

request = urllib.request.Request(host)

request.add_header('Content-Type', 'application/json; charset=UTF-8')

response = urllib.request.urlopen(request)

content = response.read()

if (content):

print(content)

从content中抽取,access token字段

3)文本审核,代码如下:

def check_content():

request_url = 'https://aip.baidubce.com/rest/2.0/antispam/v2/spam?access_token=【你自己的access token哦!!!】'

items = {'':'暴恐违禁', '':'文本色情', '':'政治敏感', '':'恶意推广', '':'低俗辱骂', '':'低质灌水'}

with open('./baidu_data/checked_data_1.txt', 'r', encoding='utf8') as fr:

with open('./baidu_data/data_1_check_result.txt', 'a', encoding='utf8') as fw:

for i, each in enumerate(fr.readlines()):

print('正在检测样本:{}'.format(i))

params = {'content': each.strip().split('\t')[-1]}

result = requests.post(request_url, headers={'Content-Type': 'application/x-www-form-urlencoded'}, data=params).text

predict_res = (json.loads(result).get('result')).get('reject')

print(predict_res)

if len(predict_res) == 0:

# 普通直接保存

fw.write('普通\t'+'0\t###\t'+each)

else:

# 获取拒绝得分最高的那个

score = []

content = []

for each_hit in predict_res:

score.append(each_hit.get('score'))

temp = each_hit.get('hit')

content.append(str(each_hit.get('label'))+'\t'+','.join(each_hit.get('hit'))+'\t')

# 找到得分最大的那个索引

max_score_index = score.index(max(score))

tag_label = content[max_score_index]

# 写入

fw.write('{}\t'.format(items.get(tag_label.split('\t')[0]))+tag_label+each)

我这里是根据任务,找到结果中我需要的信息,流程是没问题的,你可以根据你的需求改正哦

就这么简单,为什么api文档中不给出样例demo呢,花了一些时间。

百度AI开放平台- API实战调用

百度AI开放平台- API实战调用 一.      前言 首先说一下项目需求. 两个用户,分别上传了两段不同的文字,要计算两段文字相似度有多少,匹配数据库中的符合条件的数据,初步估计列出来会有60-1 ...

AI文本审核垃圾内容

今天无意获得一个AI的文本审核的API,基于深度学习及大规模样本训练的人工智能文本审核技术,一站式准确  检测识别文本中夹杂的色情.推广.辱骂.违禁违法等垃圾内容,净化 网络环境,为您的应用提供更可靠 ...

利用PHP和百度ai实现文本以及图片的审核

步骤: 首先打开百度ai 开发平台 注册一个账号: 注册账号,进入控制台 创建自己的应用,获取apikey 和秘钥 进入文档页 文本审核: 图像审核: 代码实例: class Sentive { pr ...

python 全栈开发,Day122(人工智能初识,百度AI)

一.人工智能初识 什么是智能? 我们通常把人成为智慧生物,那么”智慧生物的能力”就是所谓的”智能”我们有什么能力?听,说,看,理解,思考,情感等等 什么是人工智能? 顾名思义就是由人创造的”智慧能力” ...

了解人工智能?-百度AI

了解人工智能? 什么是人工智能? 由人创造的"智慧能力",同样具备智慧生物的能力 耳朵=倾听=麦克风=语音识别 ASR Automatic Speech Recognition 嘴 ...

百度AI开发平台简介

AIstudio https://aistudio.baidu.com/aistudio/index 关于AI Studio AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线 ...

基于百度AI开放平台的人脸识别及语音合成

基于百度AI的人脸识别及语音合成课题 课题需求 (1)人脸识别 在Web界面上传人的照片,后台使用Java技术接收图片,然后对图片进行解码,调用云平台接口识别人脸特征,接收平台返回的人员年龄.性别.颜 ...

人工智能-调百度AI接口+图灵机器人

1.登陆百度AI的官网 1.注册:没有账号注册 2.创建应用 3.创建应用 4.查看应用的ID 5.Python代码 from aip import AipSpeech APP_ID = " ...

[初识]使用百度AI接口,图灵机器人实现简单语音对话

一.准备 1.百度ai开放平台提供了优质的接口资源https://ai.baidu.com/  (基本免费) 2.在语音识别的接口中, 对中文来说, 讯飞的接口是很好的选择https://www.xf ...

随机推荐

Bootstrap3.0学习第七轮(按钮)

详情请查看http://aehyok.com/Blog/Detail/13.html 个人网站地址:aehyok.com QQ 技术群号:206058845,验证码为:aehyok 本文文章链接:ht ...

Bundle文件的创建和使用(一)

经常会出现某个需求:将自己的模块或者开放类,封装成静态库给其他人提供方便的调用. 但是当你的模块中需要大量使用xib,图片,音频或者其他资源文件时,无法添加至静态库.这个时候就需要将一些资源文件封装至 ...

Portal:十大免费建站程序推荐

TOP1 独立网店系统 ShopEx,是上海商派网络科技有限公司推出的一个网上商店系列程序.是目前网店软件行业内比较知名的公司.ShopEx旗下的网上商店系统.网上商城系统以及丰富的网商工具,以专业的 ...

JAVA – 虚函数、抽象函数、抽象类、接口

本文转载地址:http://blog.csdn.net/trojanpizza/article/details/6556604 1. Java虚函数 虚函数的存在是为了多态. C++中普通成员函数加 ...

centos7.2构建Python3.5开发环境

1.本次使用的是一台全新的腾讯云主机,首先获取linux系统版本信息. [root@VM_46_121_centos ~]# cat /etc/redhat-release

分享一篇vue项目规范

最近 Vue 用的比较多,而且因为公司里有实习生,当几个人写一个项目的时候,会出现很多问题,最麻烦的就是规范不统一,之前我有一篇文章是说, vue 是比较有规范的一种框架了,但是也会出现很多问题,所以 ...

C# 反射获取属性值、名称、类型以及集合的属性值、类型名称

实体类 class Product { public string Id { get; set; } public string Name { get; set; } public List

Linux 文件特殊权限 SUID SGID SBIT

文件除了常规的权限r, w, x 还有一些特殊的权限,s与t权限,具体的用处如下 1 SetUID 当s 这个标志出现在文件所有者的x权限上时, 例如/usr/bin/passwd, [root@or ...

生成表结构数据库文档sql语句

CREATE PROCEDURE [dbo].[生成表结构数据库文档]ASBEGIN -- SET NOCOUNT ON added to prevent extra result sets from ...

Android 使用 Camera2 完成预览和拍照

Android API 21新增了Camera2,这与之前的camera架构完全不同,使用起来也比较复杂,但是功能变得很强大. 在讲解开启预览之前,首先需要了解camera2的几个比较重要的类: Ca ...

你可能感兴趣的:(python实现文本审核)