正则表达式去掉行前面的空格或后面的空格

在处理python爬到的关键词时候,经常会遇到有的url前、后缀残留的情况,像这样:horizontal stones mill denmark 2018-10-21;

或是这样:7591 stone vs metal wheat grinder 。这时候,就需要正则表达式来把这些关键词处理一下。

去掉行前面的空格:^\s*;

去掉行后面的空格:\s*$;

这里需要注意,虽然^和$用法差不多,但是它们出现在表达式中的位置是不一样的。其中,^和$分别表示以后面的规则开头和以前面的规则结尾,所以^出现在表达式的前面,$出现在表达式的后面。

通过这次使用正则表达式处理关键词,终于把以前多次学习过的正则表达式知识用上了,感觉满满的满足感,学到的知识派上用场还是让人高兴的。

其实,在处理关键词过程中还需要用到一些别的正则表达式,但是不像这两个这么通用、有代表性,在这里我就不列举了。给小伙伴们推荐一下正则表达式在线测试工具。通过这种即时输入即时显示的工具确实能够极大地帮助我们加深对正则表达式的理解,多用几次自然就熟悉它的用法了。

 

你可能感兴趣的:(分享,日常总结)