RBF径向基神经网络——乳腺癌医学诊断建模

案例描述
近年来疾病早期诊断越来越受到医学专家的重视,从而产生了各种疾病诊断的新方法。乳癌最早的表现是患乳出现单发的、无痛性并呈进行性生长的小肿块。肿块位于外上象限最多见,其次是乳头、乳晕区和内上象限。因多无自觉症状,肿块常是病人在无意中(如洗澡、更衣)发现的。少数病人可有不同程度的触痛或刺激和乳头溢液。肿块的生长速度较快,侵及周围组织可引起乳房外形的改变,出现一系列体征。如:肿瘤表面皮肤凹陷;邻近乳头的癌肿可将乳头牵向癌肿方向;乳头内陷等。癌肿较大者,可使整个乳房组织收缩,肿块明显凸出。癌肿继续增长,形成所谓“桔皮样”改变。这些都是乳腺癌的重要体征。
乳癌发展至晚期,表面皮肤受侵犯,可出现皮肤硬结,甚者皮肤破溃形成溃疡。癌肿向深层侵犯,可侵入胸筋膜、胸肌,致使肿块固定于胸壁而不易推动。
乳癌的淋巴转移多表现为同侧腋窝淋巴结肿大,初为散在、无痛、质硬,数目较少,可被推动;以后肿大的淋巴结数目增多,互相粘连成团,与皮肤或腋窝深部组织粘连而固定。少数病人可出现对侧腋窝淋巴结转移。
乳癌的远处转移,至肺时,可出现胸痛、气促、胸水等;椎骨转移时,出现患处剧痛甚至截瘫;肝转移时,可出现黄疸、肝肿大等。
案例分析
本案例通过采集乳腺癌的9个医学指标数据,通过建立RBF神经网络模型,为早期诊断乳腺癌是良性或是恶心提供有效依据。用于预测建模的9个医学指标为:细胞的均匀形状、细胞边缘粘附程度、胆上皮细胞大小、裸核大小、Bland染色体、正常核仁大小、丛厚度、均匀细胞大小、有丝分裂程度。
预测建模
操作步骤一:数据准备
1.  本用例提供临床采集的699例样本数据集作为样本数据,详见:《样本数据­.xls》。
2.   本例用于预测建模的9个医学指标为细胞的均匀形状、细胞边缘粘附程度、胆上皮细胞大小、裸核大小、Bland染色体、正常核仁大小、丛厚度、均匀细胞大小、有丝分裂程度,样本数据如下:

将“样本数据.xls”文件的699条数据中前650条数据作为训练数据集,后49条数据作为
操作步骤二:创建方案
登录TipDM平台后的默认页面即为“方案管理”,在此页面,选择“数据分类”创建一个新方案,方案名称:基于RBF神经网络乳腺癌医学诊断建模。方案描述:近年来疾病早期诊断越来越受到医学专家的重视,从而产生了各种疾病诊断的新方法。本案例经综合分析后,采集了乳腺癌的9个医学指标数据,通过建立RBF神经网络模型,为早期诊断乳腺癌是良性或是恶心提供有效依据。
操作步骤三:数据管理
方案创建完成后,点击“数据管理”,点击“浏览”找到“样本数据.xls”,点击“上传”将数据导入方案中,如果数据未及时显示,点击“刷新“则显示出导入的数据。
操作步骤四:预测建模
在系统菜单栏选择“分类与回归”其中子菜单“神经网络”下有本次应用的算法“RBF神经网络”算法,点击该菜单右边出现该算法页面。
1、导入训练样本数据:选择所有数据列及第1至第650行,导入专家样本数据。
2、参数设置:点击按钮“参数设置”,弹出参数设置框,共有六项参数可以设置:“聚类种子数”、“最大迭代次数”、 “最小标准差”、“聚类数”、“岭参数”、“预测输出”。
² 聚类种子数:K-均值聚类种子数
² 最大迭代次数:最大训练(迭代)次数
² 最小标准差:设定允许误差最小值
² 聚类数:样本最后聚类的个数
² 岭参数:对数似然值的岭参数
² 预测输出:选择“True”,当交叉验证和模型训练时,将会输出样本的预测结果。
3、模型训练、交叉验证、模型验证、模型预测的操作请根据数据文件登陆www.tipdm.cn操作。

你可能感兴趣的:(数据挖掘,RBF,乳腺癌,径向基神经网络)