医疗实体及关系识别挑战赛

赛题概要

请本赛题排行榜前10的队友通过作品提交源代码,模型以及说明文档,截止时间为09/27/23:59:59.若文件过大,可发送至官网邮箱:[email protected]。若截止时间内未提交,官方回通过电话联系相关选手,若未接通或接通后5日未提交,视为弃权。

赛题背景

电子病历是医疗机构对门诊、住院患者进行临床治疗和指导干预的数字化医疗服务工作记录。包含了大量的患者医学信息。医学报告单是电子病历十分重要的组成部分。其中包含了患者的详细检查信息、如超声、CT、磁共振等。但是医技报告单是一个半结构化数据,不同的医生描述风格不一致,文本的形式缺乏统一的规范,因此,其中将非结构化部分转换为结构化信息非常重要的。可以有效的提高医生工作效率。优化医疗机构流程。医技领域的命名实体和实体关系识别是目前研究的热点之一,同时也是电子病历信息抽取的重要研究内容。

赛题任务

任务定义及描述

对于给定的一组电子病历中的医技报告单文档,以及预先定义好的实体类别和关系类别。需要给出每个实体在文档中出现的起止位置,以及对应的实体类别。同时对于识别出来的实体,需要进一步判断是否存在预先定义好的关系

形式化定义

医疗实体及关系识别挑战赛_第1张图片
其中 m i = < b e g i n i , e n d i , t a g i , c o n t e n t i > m_i = mi=<begini,endi,tagi,contenti>是指医疗实体提及(mention),和 b e g i n i begin_i begini e n d i end_i endi分别表示 m i m_i mi在文档中的起止位置, t a g i ∈ T tag_i \in T tagiT表示所属的预定义实体类别, c o n t e n t i content_i contenti表示实体内容。实体之间的关系由3部分构成**,表示头实体,表示尾实体, 表示两个实体所属的预定义的实体关系**,实体之间可能会存在位置重叠嵌套的情况
在这里插入图片描述

预定义实体类别

本次任务共有18个标签,部分标签定义如下:
症状:
疾病过程中机体内一系列机能、代谢和形态结构异常变化引起病人主观上的异常感觉或某些客观病态改变称为症状。
部位
部位是指人体部位器官
性质
发生频率、次数、分布、形状、大小、量、颜色、气味、程度等表达修饰意义的词或短句
非异常发现
人体正常的表现或生理现象以及含否定时间的症状描述。
发病时间
不仅仅指疾病和症状发生的时间,包含检查检验、原发病史、诱因、症状、变化因素、转归等所有的时间
诱因
诱因指导致症状、原发病史发生的原因
否定诱因
否定诱因是为了排除某些可能导致疾病或症状的因素。

预定义关系类别

实体之间的关系类型有两种:“属性”关系和“无”关系。

数据集描述

原始句子和实体。
{“sent”: “全 身 骨 骼 显 影 清 晰 , 双 侧 髋 关 节 放 射 性 分 布 増 浓 , 余 骨 放 射 性 分 布 均 匀 , 未 见 明 显 异 常 放 射 性 分 布 区 。”, “ners”: [[0, 4, “器官组织”, “全身骨骼”],[6, 8, “阴性表现”, “清晰”], [9, 14, “器官组织”, “双侧髋关节”],[14, 19, “属性”, “放射性分布”], [19, 21, “阳性表现”, “増浓”], [22, 24, “器官组织”, “余骨”],[24, 29, “属性”,“放射性分布”]]}
原始句子和实体是字典的格式,每个实体由4部分构成,即,,其中begin表示该实体在文本中的开始位置,end表示实体在文本中的结束位置,tag表示该实体的类型。content表示实体的内容。
实体之间的关系:
医疗实体及关系识别挑战赛_第2张图片
在这里插入图片描述

数据集描述

本次评测的训练数据集有:

  • 训练集约4000条中文标注数据
  • 测试集A约1000条数据。
  • 测试集B约1000条数据。

评审规则

本任务的最终评价指标有实体评价指标和关系评价指标两部分构成:
医疗实体及关系识别挑战赛_第3张图片

关系评价指标计算方式

医疗实体及关系识别挑战赛_第4张图片

赛程规则

医疗实体及关系识别挑战赛_第5张图片

作品提交要求

医疗实体及关系识别挑战赛_第6张图片

六奖项设置

入围决赛

  • 科大讯飞1024开发者节全场通票

  • 决赛入围证书

  • 科大讯飞创孵基地绿色入驻通道

  • A.I.服务市场入驻特权

决赛胜出

医疗实体及关系识别挑战赛_第7张图片

经验

  • 先沿着这个比赛,开始构建自己的代码结构,以及网络框架,模型结构,回自己建模,并对模型进行修改,会自己建模,将模型概念进行修改,会自己构建自己的代码结构以及模型框架。

你可能感兴趣的:(科大讯飞赛场,人工智能)