Python 是机器学习最广泛采用的编程语言,它最重要的优势在于编程的易用性。如果读者对基本的 Python 语法已经有一些了解,那么这篇文章可能会给你一些启发。作者简单概览了 30 段代码,它们都是平常非常实用的技巧,我们只要花几分钟就能从头到尾浏览一遍。
✖ 1. 重复元素判定✖以下方法可以检查给定列表是不是存在重复元素,它会使用 set() 函数来移除所有重复元素。
def all_unique(lst):return len(lst) == len(set(lst))x = [1,1,2,2,3,2,3,4,5,6]y = [1,2,3,4,5]all_unique(x) # Falseall_unique(y) # True
✖ 2. 字符元素组成判定 ✖
检查两个字符串的组成元素是不是一样的。
from collections import Counterdef anagram(first, second):return Counter(first) == Counter(second)anagram("abcd3", "3acdb") # True
✖ 3. 内存占用✖
下面的代码块可以检查变量 variable 所占用的内存。
import sys variable = 30 print(sys.getsizeof(variable)) # 24
✖ 4. 字节占用✖
下面的代码块可以检查字符串占用的字节数。
def byte_size(string):return(len(string.encode('utf-8')))byte_size('') # 4byte_size('Hello World') # 11
✖ 5. 打印 N 次字符串✖
该代码块不需要循环语句就能打印 N 次字符串。
n = 2; s ="Programming"; print(s * n);# ProgrammingProgramming
✖ 6. 大写第一个字母✖
以下代码块会使用 title() 方法,从而大写字符串中每一个单词的首字母。
s = "programming is awesome"print(s.title())# Programming Is Awesome
✖ 7. 分块✖
给定具体的大小,定义一个函数以按照这个大小切割列表。
from math import ceildef chunk(lst, size):return list(map(lambda x: lst[x * size:x * size + size],list(range(0, ceil(len(lst) / size)))))chunk([1,2,3,4,5],2)# [[1,2],[3,4],5]
✖ 8. 压缩✖
这个方法可以将布尔型的值去掉,例如(False,None,0,“”),它使用 filter() 函数。
def compact(lst):return list(filter(bool, lst))compact([0, 1, False, 2, '', 3, 'a', 's', 34])# [ 1, 2, 3, 'a', 's', 34 ]
✖ 9. 解包✖
如下代码段可以将打包好的成对列表解开成两组不同的元组。
array = [['a', 'b'], ['c', 'd'], ['e', 'f']]transposed = zip(*array)print(transposed)# [('a', 'c', 'e'), ('b', 'd', 'f')]
✖ 10. 链式对比✖
我们可以在一行代码中使用不同的运算符对比多个不同的元素。
a = 3print( 2 < a < 8) # Trueprint(1 == a < 2) # False
✖ 11. 逗号连接✖
下面的代码可以将列表连接成单个字符串,且每一个元素间的分隔方式设置为了逗号。
hobbies = ["basketball", "football", "swimming"]print("My hobbies are: " + ", ".join(hobbies))# My hobbies are: basketball, football, swimming
✖ 12. 元音统计✖
以下方法将统计字符串中的元音 (‘a’, ‘e’, ‘i’, ‘o’, ‘u’) 的个数,它是通过正则表达式做的。
import redef count_vowels(str):return len(len(re.findall(r'[aeiou]', str, re.IGNORECASE)))count_vowels('foobar') # 3count_vowels('gym') # 0
✖ 13. 首字母小写✖
如下方法将令给定字符串的第一个字符统一为小写。
def decapitalize(string):return str[:1].lower() + str[1:]decapitalize('FooBar') # 'fooBar'decapitalize('FooBar') # 'fooBar'
✖ 14. 展开列表✖
该方法将通过递归的方式将列表的嵌套展开为单个列表。
def spread(arg):ret = []for i in arg:if isinstance(i, list):ret.extend(i)else:ret.append(i)return retdef deep_flatten(lst):result = []result.extend(spread(list(map(lambda x: deep_flatten(x) if type(x) == list else x, lst))))return resultdeep_flatten([1, [2], [[3], 4], 5]) # [1,2,3,4,5]
✖ 15. 列表的差✖
该方法将返回第一个列表的元素,其不在第二个列表内。如果同时要反馈第二个列表独有的元素,还需要加一句 set_b.difference(set_a)。
def difference(a, b):set_a = set(a)set_b = set(b)comparison = set_a.difference(set_b)return list(comparison)difference([1,2,3], [1,2,4]) # [3]
End.
来源:简书
深圳线下·零基础Python爬虫入门
利用Python自带库以及第三方库获取网站数据并存储下来,同时可以大规模爬取数据。让你零基础入门Python爬虫。
适合人群:
1. Python零基础学员
2. 即将毕业的大学生
3. 频繁手工获取数据录入员
活动时间:12.28日 星期六
下午13:00-17:00
现报名即可享受39.9拼团价格