关于集合的使用

# 本节是关于集合的使用,例子全部来源与《Python数据科学指南》一书,作者Gopi, 翻译:方延风

# 集合

# 初始化两个句子

st_1= 'dogs chase cats'

st_2= 'dogs hate cats'

# 从字符串中创建词的集合

st_1_word= set(st_1.split())#set为创建结合

st_2_word= set(st_2.split())#按照某一字符串进行分割

# print(st_1_word)

# 找出集合中不重复的次的总数

no_words_st_1= len(st_1_word)

no_words_st_2= len(st_2_word)

# print(no_words_st_1)

# 其实是做两个集合的交集

cmn_words= st_1_word.intersection(st_2_word)

no_cmn_words= len(cmn_words)

# print(cmn_words)

# print(no_cmn_words)

# 找出两个集合不重复的词,其实是做并集

unq_words= st_1_word.union(st_2_word)

no_unq_words= len(unq_words)

# print(no_unq_words)

# print(unq_words)

similarity= no_cmn_words/ (1.0 * no_unq_words)

print(similarity)

# 例子

a= (1,2,1)#此处是一个元组

b= [1,2,1]#此处是一个列表

aa= set(a)

bb= set(b)

# 集合的涵义莫过于此

print(aa)

print(bb)

你可能感兴趣的:(关于集合的使用)