python123+第三季精品卷4综合应用题+网页处理


AC代码展示


fi= open("data.txt", "r",encoding="gbk")
f = open("univ.txt", "w",encoding="utf8")

ls=[]
daxue=""
for line in fi:
    daxue=""
    if line.find("alt=")!=-1:
        a=line.find("alt=")
        for i in line[a+5:a+40]:
            if i=="\"":
                break
            else:
                daxue+=i
        ls.append(daxue+"\n")
f.writelines(ls)

fi.close()
f.close()

num_univ=0
num_college=0
for item in ls:
    flag=item.find("大学")
    flag0=item.find("学院")
    flag1=item.find("大学生")
    if flag!=-1 and flag1==-1:
        print(item.strip("\n"))
        num_univ += 1
    if flag0!=-1 and flag1==-1:
        print(item.strip("\n"))
        num_college += 1
print("包含大学的名称数量是"+str(num_univ))
print("包含学院的名称数量是"+str(num_college))

需要注意的点


第一行代码用的是encoding="gbk",utf8会出现解码错误

你可能感兴趣的:(python二级)