python将中文标点符号转换成英文标点符号然后再替换成回车符实现换行

一段文字如下:

你发现没,杭州亚运会首个比赛日上午,中国体育代表团竟然狂揽11金!这一壮丽景象背后,是中国体育事业的坚实基础和精湛训练的见证。

标点符号都是中文状态下的。现在要替换成英文标点符号。参考了文章:

python基础之将中文标点符号转为英文标点符号_python 中文符号转英文符号_Xahoo!的博客-CSDN博客

全部替换成英文标点符号后,就可以更顺利的将标点符号全部替换成想要的字符,比如回车符。

整个代码如下(运行环境:win10 64位,python3.10.4):

import string

chs_str='你发现没,杭州亚运会首个比赛日上午,中国体育代表团竟然狂揽11金!这一壮丽景象背后,是中国体育事业的坚实基础和精湛训练的见证。'
print(chs_str)

#将中文标点符号转换成英文标点符号
# In Python3, use str.maketrans instead(皆可)
# table里对应写出你需要转换成的转台 比如:()==> ()
table = {ord(f):ord(t) for f,t in zip(
     ',。!?【】()%#@&1234567890',
     ',.!?[]()%#@&1234567890')}
eng_str = chs_str.translate(table)
print(eng_str)

#将所有的英文标点符号替换成\n
punctuation = string.punctuation
for char in punctuation:
    eng_str = eng_str.replace(char, '\n')
print(eng_str)

运行结果如下图:

python将中文标点符号转换成英文标点符号然后再替换成回车符实现换行_第1张图片 如果想换行的每句结束都有一个中文的逗号,可以这样写代码:

punctuation = string.punctuation
for char in punctuation:
    eng_str = eng_str.replace(char, ','+'\n')
print(eng_str)

运行结果:

python将中文标点符号转换成英文标点符号然后再替换成回车符实现换行_第2张图片

最后一句(结尾)也是中文逗号,有些瑕疵,要改成句号才完美。于是,删除最后的中文逗号(一个中文逗号占两个字符),添加上一个中文句号。

eng_str=eng_str[:-2]+'。'
print(eng_str)

 

你可能感兴趣的:(python,开发语言)