中医证型关联规则挖掘

  • 背景与挖掘目标

在医学上,癌是指起源于上皮组织的恶性肿瘤,是恶性肿瘤中最常见的一类。相对应的,起源于间叶组织的恶性肿瘤统称为肉瘤。有少数恶性肿瘤不按上述原则命名,如肾母细胞瘤、恶性畸胎瘤等。一般人们所说的“癌症”习惯上泛指所有恶性肿瘤。应用中医药治疗癌症已成为公认的综合治疗的方法之一,并且中医药治疗乳腺癌有着广泛的适应性和独特的优势。大部分情况下,提升患者的免疫力,进一步减少患者在放疗、化疗过程当中的副反应,确定“先证而治”的方向,为后续治疗打下基础。同时减少手术并发症,有效地提高患者的生存治疗,延长患者生存期。

根据已有数据实现以下目标:

  1. 借助数据,挖掘患者的症状与中医证型之间的关联关系
  2. 对截断治疗提供依据,挖掘潜性证。
  • 分析方法与过程

本文采用问卷调查的方式收集数据,运用数据挖掘技术对搜集的数据进行数据探索与预处理,形成建模数据,采用关联规则算法,挖掘各中医证素与乳腺癌TNM之间的关系。

中医证型关联规则挖掘主要包括以下步骤:

  1. 以问卷调查的方式对数据进行收集,并将问卷信息整理成原始数据;
  2. 对原始数据集进行数据预处理,包括数据清洗、属性规约、数据变换;
  3. 利用数据采用关联规则算法,调整模型输入参数,获取各中医证素与乳腺癌TNM分期之间的关系。
  4. 对模型结果进行分析,最后输出关联规则结果。

中医证型关联规则挖掘_第1张图片

  1. 数据预处理

在收回的问卷中,存在无效的问卷,为了便于分析,需要对其进行处理。如图8-2所示。

中医证型关联规则挖掘_第2张图片

  1. 属性规约

你可能感兴趣的:(数据挖掘,数据分析,人工智能)