2018-08-03 实验室工作记录

中科大给了API,数据有很多类,一类一类的进行处理
第一类数据类似于
[{"shixun":{"id":736,"identifier":"25np6ayv"}},{"shixun":{"id":517,"identifier":"26bmiwfu"}},...]
观察到去除符号后,剩下的数据规范为
shixun,id,xxx,identifier,yyyyyyyy
用replace进行符号去除,用filter进行内容筛选:

res = res.replace('{', '').replace('}', '').replace('\"', '').replace('[','').replace(']','')
split_data = re.split(',|:', res)
del_symb = ['shixun','id','identifier']
split_data = filter(lambda x:x not in del_symb, split_data)

又发现后期使用时id和identifier是分开使用的,决定分成两个数组使用。这时不需要再采用filter,可以切片处理:

ident_list = split_data[2::5] #从第3个元素开始,每5个元素一切
id_list = split_data[4::5]

该操作参考了博客《Python中的切片操作》

中科大方面给的API与我们的预期结果有一些不同,我们希望能准确定位到
某次提交->提交的用户->提交的题目->提交得分->题目总分
至少这五个元素可达,但是API中给的结果是
某次提交->提交的题目
用户->提交的所有题目ABC……
并不是一个简单的单一映射关系

将结果记录在了EXCEL中发送给了学姐,目前还没有后续反馈

你可能感兴趣的:(2018-08-03 实验室工作记录)