《Python CookBook2》 第一章 文本 - 过滤字符串中不属于指定集合的字符 && 检查一个字符串是文本还是二进制

过滤字符串中不属于指定集合的字符


任务:

  给定一个需要保留的字符串的集合,构建一个过滤函数,并可将其应用于任何字符串s,函数返回一个s的拷贝,该拷贝只包含指定字符集合中的元素。 

 

解决方案:  

import string

allchars = string.maketrans('','')  #all chars table

def makefilter(keep):

    delchars = allchars.translate(allchars,keep)

    def thefilter(s):

        return s.translate(allchars,delchars)#delchars是要删除的字符串list内容

    return thefilter

if __name__ == "__main__":

    just_vowels = makefilter('aeiouy')

    print just_vowels('i love python')

    print just_vowels('wwwwwwwwww')

 

  

检查一个字符串是文本还是二进制


任务:

  在 python中,普通字符串既可以容纳文本,也可以容纳任意的字节,现在需要探知一个字符串中的数据究竟是文本还是二进制。 

 

解决方案: 

  

from __future__ import division

import string

text_characters = ''.join(map(chr,range(32,127))) + '\n\t\r\b'

_null_trans = string.maketrans('','')

def istext(s,textcharacters = text_characters,threshold = 0.30):

    if '\0' in s:

        return False

    if not s:

        return True

    t = s.translate(_null_trans,text_characters)

    return len(t)/len(s) <= threshold

print istext('1101111111')

 

目前还是不是很懂这个方法,代码的结构还是在学习适应中

 

你可能感兴趣的:(python)