糖尿病患者发生脑梗死的机理非常复杂,其合并危险因素多,且患者预后差,病死率高,目前主要采取对症治疗。对糖尿病患者发生脑梗死的风险进行评估和预测,可以指导患者做好平时的自我保健,对诱发脑梗死的危险因素进行规避,同时医务人员可以根据评估结果为患者制定有针对性的治疗方案,以有效降低患者发生脑梗死的危险。疾病危险因素的研究大多采用多元线性回归和多元logistic回归,虽然可以从众多因素中筛选出有统计学意义的危险因素,但无法对各危险因素不同水平下发生危险的可能性做出定性的判断。
决策树作为一种重要的数据挖掘算法,具有分类精度高、对噪声数据有很好的健壮性、所提取规则可以量化且易于理解等优点,在临床辅助诊断和预防医学及公共卫生等领域已经得到了应用,取得了良好的效果,但应用于评估和预测糖尿病患者发生脑梗死风险还未见报道。本研究采用决策树C5.0算法共筛选出5个对发生脑梗死有影响的因素,对模型进行评估结果表明,预测的准确性和一致性都比较高。C5.0算法突破了ID3算法只能处理离散变量的局限,对连续变量和离散变量以及缺失数据都能进行有效地处理,而且能清楚显示对分类或预测有重要意义的变量,最后生成的规则比较直观且易于理解。但由于没有编程界面,因此,要获得理想的预测模型,需要对相关窗口中的参数反复进行调整,此外训练样本和测试样本的大小对决策树模型的稳定性和预测效果也有较大影响。影响糖尿病患者发生脑梗死的因素很多,由于时间和人员等多方面因素的限制,本研究采集的患者相关指标还不尽完备,样本量较小,因此,筛选出来的危险因素及所建立的预测模型的代表性还有待于进一步的加以完善。
本文旨在为评估和预测糖尿病患者发生脑梗死的风险提供种新的辅助诊断工具,相信随着糖尿病患者数据库的不断增大、所采集指标的不断增多,应用决策树模型能够对糖尿病患者发生脑梗死的风险进行较为准确的预测,从而为糖尿病患者的健康带来福音。