【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号

Python初级人工智能精讲

文章目录

  • Python初级人工智能精讲
  • 一、写在前面
  • 二、七步精讲
  • 三、模型介绍
  • 四、进入实战
    • 1.源代码
    • 2.运行效果
      • (1) cmd方面
      • (2) txt文件运行前后对比
  • 五、休吃霸王餐
  • 六、每日一句

一、写在前面

今天给分享的程序是:给一段文字自动加上合适的标点符号,使用的是飞桨的AI算法模型:auto_punc,可以智能的分析文字中的情感并在每段文字中加上适合的标点符号。

二、七步精讲

代码我已调试过了,下面是操作步骤:

  1. 将代码复制到你的py文件中,存放在本地C盘根目录下,名为:auto_punc.py
  2. 安装所需要的Python 模块:
pip install paddlehub
  1. 准备好要加标点的文字,把文字放在一个 txt中,把txt路径放到代码中相应位置;
  2. 指定一个保存加好标点的文字的文件路径,路径放到代码中相应位置;
  3. Win+R运行cmd,在命令行中输入:python C:/auto_punc.py查看结果;
  4. 稍等一会后,所有没有加标点的文字,都自动加上了合适的标点;
  5. 至此,我们就完成了Python 给一段文字自动加上合适的标点符号的程序执行,大家喜欢的记得支持一下,有遇到问题的随时找我沟通。

三、模型介绍

Ernie百度提出的基于知识增强的持续学习语义理解模型,该模型将大数据预训练与多源丰富知识相结合,通过持续学习技术,不断吸收海量文本数据中词汇结构语义等方面的知识,实现模型效果不断进化。

四、进入实战

1.源代码

'''
Paddlehub给一段没有标点符号的文字加上合适的标点符号
'''
# 导入包
import paddlehub as hub

model = hub.Module(name='auto_punc', version='1.0.0')

# 定义方法
def addpunc(txtpath, savetxt):
    f = open(txtpath, encoding = "utf-8")
    # 输出读取到的数据
    txtstr = f.read().split("\n")
    punc_texts = model.add_puncs(txtstr)
    f.close()
    str1 = "\n"
    print('转换成功:', str1)
    with open(savetxt, "a", encoding='utf-8') as fc:
        fc.write(str1)  # 写入文件
        fc.write("\n\n")
        fc.close()

if __name__ == '__main__':
    # 存放要加标点符号的文字
    txtpath = r'D:\A\Project_1\source.txt'
    # 保存加号标点符号的文字
    savetxt = r'D:\A\Project_1\punc.txt'
    # 调用方法
    addpunc(txtpath, savetxt)

2.运行效果

(1) cmd方面

cmd的运行效果如下:

【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号_第1张图片

(2) txt文件运行前后对比

运行前:

【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号_第2张图片

运行后:

【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号_第3张图片

五、休吃霸王餐

这篇文章里有我创作的第一个人工智能项目,望各位赏脸,来了,就把您的三连留下呗~

六、每日一句

你努力样子像星辉、像野风,既美又酷~

【Python初级人工智能精讲】用Paddlehub给一段没有标点符号的文字加上合适的标点符号_第4张图片

你可能感兴趣的:(【一看就懂】的,python,python学习笔记)