对命名实体识别进行基准测试:StanfordNLP,IBM,spaCy,Dialogflow和TextSpace
作者|FelixLaumann编译|VK来源|TowardsDataScienceNER是信息提取的一个子任务,它试图定位并将非结构化文本中提到的指定实体划分为预定义的类别,如人名、组织、位置、医疗代码、时间表达式、数量、货币。我们创建了我们自己的小型测试数据集,其中11个示例来自谷歌的Taskmaster2数据集,该数据集于2020年2月刚刚发布。我们将此数据集视为NER解决方案中未来研究和产品