AMiner标注工具输入数据格式

AMiner标注工具输入数据格式

case_name

string类型,需要标注的作者名字。

pub_list

list类型,里面每个元素是一个pub对象,需要有以下属性:(要求都是英文)

  • id:string类型,kexie.aminer.cn数据库中的paper的id
  • affiliation:string类型(case_name对应作者的机构信息)
  • title:string类型,论文标题
  • venue: string类型,发表期刊名称
  • year: int类型,发表年份
  • authors: list类型,每个元素都是作者名的string,注意不要包括case_name对应的作者名

confirmed_person_list

list类型,里面每个元素都是一个跟case_name相关的作者对象,对象拥有以下属性:

  • id: string类型,kexie.aminer.cn数据库中的作者的id
  • name: string类型,作者名字
  • org: string类型,作者机构
  • tags: list类型,里面每个元素都是string类型,作者研究领域的关键词

confirmed_pub_id_list

dict类型,里面每个元素的key对应confirmed_person_list里面一个学者的id。

value是一个list,list里面每个元素是这个学者档案下论文的id。

ambiguous_pub_id_list

list类型,里面每个元素都是一个未分配论文的id

注意

ambiguous_pub_id_list和所有学者的论文list的并集应该是pub_list中所有的论文

ambiguous_pub_id_list和所有学者的论文list不应该存在任何的交集!

你可能感兴趣的:(AMiner标注工具输入数据格式)