整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。


【点击此处跳转笔记正文】

Python 官网:https://www.python.org/


  • Free:大咖免费“圣经”教程《 python 完全自学教程》,不仅仅是基础那么简单……

  • My CSDN主页、My HOT博、My Python 学习个人备忘录
  • 好文力荐、 老齐教室

  自学并不是什么神秘的东西,一个人一辈子自学的时间总是比在学校学习的时间长,没有老师的时候总是比有老师的时候多。
            —— 华罗庚


等风来,不如追风去……


《长恨歌》文本
整理网站页面CV的字符串
(python字符串基础知识实战)


目 录

  • 1、“零散”工作
  • 2、算法优化

  这是一段由聊天引出的代码应用——
由聊天中齐老师的一段引文,让我搜索学习了缠绵凄美的《长恨歌》,动了CV其文本的心思。

整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。_第1张图片


回页首

  可从页面CV到文本,却成了下面截图的样子
整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。_第2张图片


  一字一行,期间还间杂一些注释索引的数字。手动整理?这文本可不短!还是让让代码出手吧——
  不就是一个字符串基础的应用嘛。“数据特征分析,利用特征选用适宜方法代码,整理数据,得想要的结果。”去除回车符和数字字符,按每句诗一行打印就好。
  上码——

代码


title = '长恨歌_网cv'
filename = f'/sdcard/Documents/{title}.txt'

with open(filename) as f:
    s = f.read().split('。') # 用“。”分割长恨歌文本。

s = map(lambda x: x.replace('\n', ''), s) # 去除回车符。
print(*s)
input() 

整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。_第3张图片


  诗句注释的索引数字还没去除哩!加代码——用个函数循环,遍历去除数字和回车符。

代码


def mydel(s):
    ''' 去除回车符和数字 '''
    temp = []
    for i in s:
        if i not in '01234567890\n':
            temp.append(i) # 收集非数字和回车符的字符。
    return ''.join(temp)        

with open(filename) as f:
    s = f.read().split('。') # 用“。”分割长恨歌文本。

s = map(mydel, s) # 去除回车符。
print(*s)

整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。_第4张图片


  成功得到了想要的诗文字符串列表,只要写入文本文件,就“大功告成”。

代码


# 写入文本
title = '《长恨歌》'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename, 'w') as f:
    f.write('。\n'.join(map(mydel, s))) # 将用。和换行符拼接的文本写入文本文件。

  成了!只需在文本首行敲几个回车就好。

整理网站页面CV的《长恨歌》文本,python字符串基础知识实战。_第5张图片


回页首

  到此,问题解决,看似完结。其实,前面的代码只是“信手拈来”不够严谨,更可以优化改写。遍历每句诗去除回车和数字,是不是太复杂?
  把整个文件读取的字符串中,要去除的仅是数字和回车符。数字仅是0~9的字符组成,所以仅需遍历10个数字,分别替换成’'空字符就好。


优化改写后的代码

#!/sur/bin/nve python
# coding: utf-8

title = '长恨歌_网cv'
filename = f'/sdcard/Documents/{title}.txt'

with open(filename) as f:
    s = f.read() # 读取CV诗文文本。

for i in '0123456789': # 遍历去除数字。
    s = s.replace(i, '')

# 写入文本
title = '《长恨歌》'
filename = f'/sdcard/Documents/{title}.txt'
with open(filename, 'w') as f:
    poems = s.replace('\n', '').split("。") # 去除回车符并分割诗句。
    f.write('。\n'.join(poems)) # 用。和回车符拼接诗句列表并写入文件。


回页首

__上一篇:__ 反斜杠让您的csv文档字符不撞车,让“借”(白嫖)您csv数据的人叫苦不迭

__下一篇:__ 

我的HOT博:

    • 给定字符串提取姓名(字符串、list、re“零宽断言”)(1051阅读)
    • 我的 Python.color() (Python 色彩打印控制)(1125阅读)
    • python清屏(1290阅读)
    • 回车符、换行符和回车换行符(1322阅读)
    • Linux 脚本文件第一行的特殊注释符(井号和感叹号组合)的含义(1171阅读)
    • pandas 数据类型之 Series(1224阅读)
    • 聊天消息敏感词屏蔽系统(字符串替换 str.replace(str1, *) )(1270阅读)
    • 练习:银行复利计算(用 for 循环解一道初中小题)(1188阅读)
    • pandas 数据类型之 DataFrame(2136阅读)
    • :班里有人和我同生日难吗?(蒙特卡洛随机模拟法)(2180阅读)
    • Python字符串居中显示(2359阅读)
    • 练习:求偶数和、阈值分割和求差( list 对象的两个基础小题)(1665阅读)
    • 用 pandas 解一道小题(2007阅读)
    • 可迭代对象和四个函数(1083阅读)
    • “快乐数”判断(1252阅读)
    • 罗马数字转换器(构造元素取模)(2159阅读)
    • Hot:罗马数字(转换器|罗生成器)(4750阅读)
    • Hot:让QQ群昵称色变的代码(36654阅读)
    • Hot:斐波那契数列(递归| for )(4071阅读)
    • 柱状图中最大矩形(1663阅读)
    • 排序数组元素的重复起止(1258阅读)
    • 电话拨号键盘字母组合(1402阅读)
    • 密码强度检测器(1986阅读)
    • 求列表平衡点(1837阅读)
    • Hot: 字符串统计(4308阅读)
    • Hot:尼姆游戏(聪明版首发)(3493阅读)尼姆游戏(优化版)(1175阅读)
    • 推荐条件 点阅破千

      回目录


      老齐漫画头像

      精品文章:

      • 好文力荐:《python 完全自学教程》齐伟书稿免费连载
      • OPP三大特性:封装中的property
      • 通过内置对象理解python'
      • 正则表达式
      • python中“*”的作用
      • Python 完全自学手册
      • 海象运算符
      • Python中的 `!=`与`is not`不同
      • 学习编程的正确方法

      来源:老齐教室


      回目录

      Python 入门指南【Python 3.6.3】


      好文力荐:

      • 全栈领域优质创作者——寒佬(还是国内某高校学生)好文:《非技术文—关于英语和如何正确的提问》,“英语”和“会提问”是学习的两大利器。

      • 【8大编程语言的适用领域】先别着急选语言学编程,先看它们能干嘛

      • 靠谱程序员的好习惯


      CSDN实用技巧博文:

      • 8个好用到爆的Python实用技巧
      • python忽略警告
      • Python代码编写规范
      • Python的docstring规范(说明文档的规范写法)

    你可能感兴趣的:(笔记,练习,python)