Python去掉字符串中的字符,仅保留数字(ValueError: invalid literal for int() with base 10: "b'960")

博主在运行程序的过程中遇到了如上问题,在此记录下解决方式和产生这个问题的原因。更新于2019.01.05。

解决方式

首先给出解决方式(即去掉字符串中的字符,仅保留数字)。找到报错的那一行中调用了int(string)语句的地方,将其改为int(re.sub("\D","",string)),即去掉所有非数字的字符。具体可以参考下面的例子:

原语句:

dim_list = [int(dimstr) for dimstr in str(subprocess.check_output([img_size_bin, filename])).split(',')]

修改为:

dim_list = [int(re.sub("\D","",dimstr)) for dimstr in str(subprocess.check_output([img_size_bin, filename])).split(',')]

产生原因

首先,Python中用int进行类型转换的要求是被转换的对象中不包括字符,比如:

int("1234")
>> 1234

但是如果用int("abc1234")就会报错(如题)。

这里博主遇到的情况是,Python在输出的时候将之前的类型也保留了。这里就需要明确Python的几种前缀。其中,b'这个前缀表示的是bytes类型的数据。然而,博主并不希望留下这个前缀,因此就用到了前面所说的去除非数字的命令:

re.sub("\D","",string)

其中,\D表示的是非数字(Digit),后面的string是需要处理的字符串。

注意,如果用这个命令,最开头要包含re工具包:

import re

更多内容,欢迎加入星球讨论。

你可能感兴趣的:(Python基础)