目录
CSV 格式数据清洗
十二星座
习题
附件是一个 CSV 文件,其中每个数据前后存在空格,请对其进行清洗,要求如下:
1.去掉每个数据前后空格,即数据之间仅用逗号 (,) 分割;
2.清洗后打印输出
示例1:
输入:" 1, 2, 3, 4, 5 'a', 'b' , 'c' , 'd','e' "
输出:" 1,2,3,4,5 'a','b','c','d','e' "
注意:
with open('data.csv') as f:
for line in f:
print(line.replace(' ',''),end='')
replace()
str.replace(old, new[, max])
old:将被替换的子字符串。
new:新字符串,用于替换old子字符串。
max:可选字符串, 替换不超过 max 次
>>> str = "this is string example....wow!!! this is really string";
>>> print str.replace("is", "was");
thwas was string example....wow!!! thwas was really string
>>> print str.replace("is", "was", 3);
thwas was string example....wow!!! thwas is really string
ps:string的replace方法,需要注意replace不会改变原 string 的内容
古代航海人为了方便在航海时辨别方位和观测天象,将散布在天上的星星运用想象力将它们连接起来,有一半是在古时候已命名,另一半是近代开始命名的。两千多年前古希腊的天文学家希巴克斯命名十二星座,依次为白羊座、金牛座、双子座、巨蟹座、狮子座、处女座、天秤座、天蝎座、射手座、魔蝎座、水瓶座和双鱼座。给出二维数据存储 CSV 文件(SunSign.csv),内容如下:
星座,开始月日,结束月日,Unicode
水瓶座,120,218,9810
双鱼座,219,320,9811
白羊座,321,419,9800
金牛座,420,520,9801
双子座,521,621,9802
巨蟹座,622,722,9803
狮子座,723,822,9804
处女座,823,922,9805
天秤座,923,1023,9806
天蝎座,1024,1122,9807
射手座,1123,1221,9808
魔蝎座,1222,119,9809
请编写程序,读入 CSV 文件中数据,循环获得用户输入,直至用户输入 "exit
" 退出。根据用户输入的星座名称,输出此星座的出生日期范围及对应字符形式。如果输入的星座名称有误,请输出“输入星座名称有误!”。
示例1:
输入:"
白羊座
金牛座
双子座
exit
"
输出:"
♈座的生日位于321-419之间
♉座的生日位于420-520之间
♊座的生日位于521-621之间
"
注意:
dic={}
with open('SunSign.csv') as f:
for line in f:
dic[line.split(',')[0]]=line.split(',')[1:4]
_input=input()
data=[]
while _input!="exit":
data.append(_input)
_input=input()
for i in data:
if i not in dic.keys() :
print('输入星座名称有误!')
else :
print(chr(int(dic[i][2])) +"座的生日位于"+dic[i][0]+"-"+dic[i][1]+"之间")
chr()
返回整数i所对应的Unicode字符,功能与ord()函数相反
>>> chr(97)
a
>>> ord(a)
97
1.数据清洗
将data.json文件换成CSV格式,并以“花瓣长度/花瓣宽”降序度排序,保存到文件中。
import json
import csv
json_file=open('data.json','rb')
csv_file=open('data.csv','w',newline='')
item_list=json.loads(json_file.read().decode("gbk").encode("utf-8"))
key_data=item_list[0].keys()
value_data=[item.values() for item in item_list]
csv_writer=csv.writer(csv_file)
csv_writer.writerow(key_data)
csv_writer.writerows(value_data)
json_file.close()
csv_file.close()
csv库的使用
csv.writer():创建csv文件写入对象(一下假设为csv_object)
csv_object.writerow():将列表全部写入csv的同一行
csv_object.writerows():将二维列表中的每个列表写为一
ps:使用writerow()写入csv文件时,行间会出现空行,应在open()中添加参数newline=''
2.更新课本例13,尝试转化data.csv文件,设计能够自适应csv不同行列数(例13是固定的6行4列)
start='''
'''
end='''
'''
ls = []
with open('data.csv','r') as _f:
for line in _f :
ls.append(line.replace('\n','').split(','))
print(ls)
with open('data.html','w') as f:
f.write(start)
for i in ls[0]:
f.write('{} '.format(i))
f.write('\n')
for i in ls[1:]:
cnt=0
for j in i:
if cnt==0:
f.write('')
f.write('{} '.format(j))
cnt+=1
if cnt==len(i) :
if i==ls[-1]:
f.write(' ')
else:
f.write('\n')
f.write(end)
3.P211制作英文学习词典。
转自博客:https://blog.csdn.net/qq_52988674/article/details/120735006
words = {}
count = 0
with open('dict.txt', 'w+') as f:
for line in f.readlines():
s = str(line).split()
words[s[0]] = s[1]
count += 1
while True:
option = eval(input("********************"
"\n1 添加\n2 查询\n3 退出\n"
"********************\n"))
if option == 1:
english = input("请输入英文单词: ")
if english in words:
print("该单词已经添加到词典里!")
option_1 = eval(input("是否继续为{}添加多重释义,1为继续添加,2为输入其他选项,3为退出。".format(english)))
if option_1 == 1:
chinese = input("请输入中文释义:")
words[english] = words[english] + "," + chinese
elif option_1 == 2:
continue
elif option_1 == 3:
break
else:
print("输入有误!")
continue
else:
chinese = input("请输入中文释义: ")
words[english] = chinese
count += 1
elif option == 2:
english = input("请输入你要查询的英文单词:")
if english not in words:
print("字典库中未找到这个单词!")
continue
else:
print("{}的中文释义是:{}".format(english, words[english]))
elif option == 3:
break
else:
print("输入有误")
break
items = list(words.items())
fo = open("dict.txt", "w")
for i in range(count):
english, chinese = items[i]
s = english + " " + chinese + '\n'
fo.write(s)