糖尿病常常合并许多急性脑血管疾病,脑梗死是最常见的并发症之一。随着饮食结构的改变和社会压力的增大,2型糖尿病合并脑梗死的发病率逐年上升。了解2型糖尿病患者并发脑梗死的危险因素,有利于患者的自我保健对患者发生脑梗死的风险进行预测与评估,可以指导临床医生制定治疗方案,进行早期预防,以降低患者发生脑梗死的可能性。
决策树作为一种重要的数据挖掘算法,具有分类精度高、对噪声数据有很好的健壮性、所提取规则可以量化且易于理解等优点,在临床辅助诊断和预防医学及公共卫生等领域已经得到了应用,取得了良好的效果,但应用于评估和预测糖尿病患者发生脑梗死风险还未见报道。本研究采用决策树C5.0算法共筛选出5个对发生脑梗死有影响的因素,对模型进行评估结果表明,预测的准确性和一致性都比较高。C5.0算法突破了ID3算法只能处理离散变量的局限,对连续变量和离散变量以及缺失数据都能进行有效地处理,而且能清楚显示对分类或预测有重要意义的变量,最后生成的规则比较直观且易于理解。但由于没有编程界面,因此,要获得理想的预测模型,需要对相关窗口中的参数反复进行调整,此外训练样本和测试样本的大小对决策树模型的稳定性和预测效果也有较大影响。影响糖尿病患者发生脑梗死的因素很多,由于时间和人员等多方面因素的限制,本研究采集的患者相关指标还不尽完备,样本量较小,因此,筛选出来的危险因素及所建立的预测模型的代表性还有待于进一步的加以完善。
本文旨在为评估和预测糖尿病患者发生脑梗死的风险提供种新的辅助诊断工具,相信随着糖尿病患者数据库的不断增大、所采集指标的不断增多,应用决策树模型能够对糖尿病患者发生脑梗死的风险进行较为准确的预测,从而为糖尿病患者的健康带来福音。