专利-论文对齐数据格式

AMiner标注工具输入数据格式

case_name

string类型,需要标注的作者名字。

patent_list

list类型,里面每个元素是一个patent对象,需要有以下属性:(要求都是英文)

  • id:string类型,kexie.aminer.cn数据库中的patent的id
  • affiliation:list,里面每个元素都是一个string
  • title:string类型,论文标题
  • venue: string类型,发表期刊名称
  • year: int类型,发表年份
  • authors: list类型,每个元素都是作者名的string,注意不要包括case_name对应的作者名

pattern_person_list

dict类型,里面每个元素的key都是对应一个专利学者的id
value是一个对象,拥有以下属性:

  • patents: list类型,里面每个元素都是string类型,对应分配给该作者的patent id
  • candidates: list类型,里面每个元素都是string类型,对应该专利作者匹配到的论文作者id
    dict类型,里面每个元素的key对应confirmed_person_list里面一个学者的id。

注意

所有专利学者的论文list的并集应该是pub_list中所有的论文

所有专利学者的论文list不应该存在任何的交集!

你可能感兴趣的:(专利-论文对齐数据格式)