【综述】基于聚类分析的糖尿病分型研究进展

来源:内分泌空间作者:内分泌空间时间:2023-05-18 阅读:7393评论:0赞:0 有0人参与

点击标题下「蓝色微信名」可快速关注


文章来源:中华糖尿病杂志, 2022,14(12) : 1475-1479

作者:李昕蓉 陈慧 张锦 孙文杰

单位:兰州大学第二医院内分泌代谢科

摘要

糖尿病是一种影响全身多系统的慢性疾病,发病机制复杂,病情进展及并发症的发生存在异质性。目前的分型方法尚不能准确解释这种差异。聚类分析作为一种有效的多元统计分类技术,现已广泛应用于各个领域。2018年Ahlqvist团队首先将此方法应用于糖尿病的分型,该分型的目的是为糖尿病的个体化精准治疗及在糖尿病诊断时即能确定并发症风险提供更精细的分型方法,以期实现糖尿病的精准治疗及并发症的早期防治。随后,多名学者纷纷对此研究进行了验证与补充。该文将糖尿病聚类分型方法的研究进展进行综述。


糖尿病是世界上患病人数增长速度最快的疾病。国际糖尿病联盟最新数据显示,2021年全球约5.37亿成年人患有糖尿病,预计到2030年将上升至6.43亿,2045年为7.84亿1]。在此期间,世界人口估计增长20%,而糖尿病患者人数估计增加46%。此外,2021年约有670万成年人死于糖尿病及其并发症,占全球全因死亡人数的十分之一以上,给社会、经济带来了沉重的负担。传统的糖尿病分型方法尚不能实现个体化治疗及并发症的早期防治,聚类分型的出现为这一目标的实现提供了新方法。聚类分型是一种根据数据间的潜在联系和差异性,将相似的样本聚在同一类簇中,将不相似的样本分为不同类簇,从而揭示不同类簇的特点及相互之间关系的方法,现已广泛应用于疾病诊断分型、疾病预后分析、基因靶向治疗、流行病学及医学图像分析等领域。2018年Ahlqvist等2]首先将此方法应用于糖尿病分型中,聚类分型为糖尿病的个体化精准治疗及在糖尿病诊断时即能确定并发症风险提供了更精细的分型方法。随后,多名学者对其进行了验证与补充。本文总结糖尿病聚类分型的相关研究,旨在为探索更有临床价值的糖尿病分型方法提供思路。


一、糖尿病的异质性

糖尿病是一组以高血糖为共同特征的异质性疾病,是胰岛素分泌缺陷、胰岛素作用障碍或两者兼具的结果。不同个体血糖控制相当时,临床前状态、疾病进展和并发症的发生均有所差异。糖尿病的发生不仅与暴露因素有关,还与遗传变异因素密切相关。全基因组关联研究发现130多个与2型糖尿病相关的变异基因3]。不同因素的总和最终导致了糖尿病的异质性。


二、糖尿病分型方法的演变

1965年世界卫生组织(World Health Organization,WHO)最先将糖尿病分为2型:幼年发病型和成年发病型。1980年WHO建议修改分型为胰岛素依赖型或非依赖型。考虑到此种分型的易混淆性,1985年又在此基础上增加了营养不良相关型,并将非胰岛素依赖型分为肥胖型和非肥胖型。现被WHO、国际糖尿病联盟、美国糖尿病学会、中华医学会糖尿病学分会共同认可的分类方法是1997年美国糖尿病学会提出的病因学分类:1型糖尿病、2型糖尿病、妊娠期糖尿病和特殊类型糖尿病4]。由于糖尿病的复杂性及异质性,现有分型在指导治疗及评估预后方面仍存在缺陷。


三、糖尿病聚类分型的发展

1.糖尿病聚类分型方法的提出:聚类分析是一种根据不同数据源间的相似性,将其分类到不同簇中的有效分类方法。2018年Ahlqvist等2]使用年龄、体重指数(body mass index,BMI)、糖化血红蛋白、稳态模型2评估胰岛素抵抗指数(homeostasis model assessment-2 insulin resistance,HOMA2-IR)、稳态模型2评估β细胞功能指数(homeostasis model assessment-2 beta-cell function,HOMA2-β)、谷氨酸脱羧酶抗体(glutamic acid decarboxylase antibody,GADA)对新诊断糖尿病患者进行聚类,将其分为5组(表12)。其中严重自身免疫型(severe autoimmune diabetes,SAID)以GADA阳性为主要特征,且发病年龄较小,胰岛功能较差;严重胰岛素缺乏型(severe insulin-deficientdiabetes,SIDD)GADA阴性,其他特征与SAID组类似,并发视网膜病变的风险最高;严重胰岛素抵抗型(severe insulin-resistant diabetes,SIRD)HOMA2-IR最高,BMI较高,并发非酒精性脂肪性肝病、慢性肾病的风险最高;轻度肥胖相关型(mild obesity-related diabetes,MOD)BMI最高;轻度年龄相关型(mild age-related diabetes,MARD)诊断年龄最大。MOD组、MARD组代谢控制较好。SAID、SIDD组代谢控制最差。



2.糖尿病聚类分型方法的验证与补充:多名学者纷纷对此研究进行了验证与补充5, 6, 7, 8, 9, 10, 11, 12, 13]表12)。中国大型研究发现,SIDD、SIRD、MARD组10年内发生心血管疾病的风险较高6]。日本人群中SIRD组发生肾病的风险较高,SAID组视网膜病变的风险较高7]。印度队列研究发现,SIDD组最易并发肾病和视网膜病变,而神经病变在MOD组更常见11]。德国研究发现,SIRD组非酒精性脂肪性肝病患病率最高,SIDD组最易并发神经病变9]


此外,Fedotkina等8]还对乌克兰人群中病程较长的患者进行了聚类,发现SAID组的例数是新诊断患者的2倍。以胰岛素抵抗合并肥胖为特征的人群很难与短病程中的SIRD或MOD组相匹配,故将其分为2类:1类HOMA2-IR较高、HOMA2-β较低;2类BMI及HOMA2-IR均较高,且HOMA2-β显著升高。1类患者易并发肾脏病变,2类患者微血管并发症最少见,尤其是慢性肾脏病和神经病变。5年随访研究发现,SIDD组在基线时空腹血糖水平较高,5年后下降,与其他组的变化相反9]。以上结果提示随着病程的延长,聚类分组及特征可能会发生改变。


除病程外,加入其他不同的聚类变量也会产生不同的结果。基于中国人群的特点,将甘油三酯和尿酸加入聚类变量后,得到了尿酸相关性糖尿病和遗传相关性糖尿病14]。前组HOMA2-IR较低、β细胞功能较好,年龄较大,患冠心病及终末期肾病的风险较高。后组多有糖尿病家族史、BMI较低、代谢控制相对较好。Anjana等15]使用多个变量聚类后得到了4组:SIDD、MARD、胰岛素抵抗合并肥胖组和胰岛素抵抗伴缺乏组。胰岛素抵抗伴缺乏组发病年龄较低且代谢控制差,较易并发肾病。SIDD组视网膜病变的风险最高。将高密度脂蛋白胆固醇纳入聚类变量后也可得到两个独特的分组:没有极端特征的轻型糖尿病组和病情进展较慢的伴高密度脂蛋白胆固醇升高的轻型糖尿病组16]。伴有高密度脂蛋白胆固醇升高的轻型糖尿病组血糖恶化的风险很低。


3.糖尿病聚类分型下各亚组并发症风险的差异:糖尿病常引起眼、肾、神经、心血管等组织的慢性进行性病变,给社会和家庭带来了巨大的经济压力,同时也是患者死亡的重要原因。针对各亚组并发症风险进行早期预防,可以延长患者的生存时间,减轻社会压力。


糖尿病视网膜病变是最常见的微血管并发症,是糖尿病人群视力障碍和失明的主要原因。SIDD组视网膜病变的发生率最高,表明胰岛素缺乏引起的高血糖在微血管并发症中具有关键作用。此外,胰岛素抵抗合并缺乏型15]、SAID7, 8]、MOD组13]也显示了较高的风险。


糖尿病周围神经病变是致残的重要原因。不同队列中SIDD组和SIRD组患病率均较高。部分研究表明MOD组的患病率最低8,13],这与Prasad等11]的研究结果相反,可能与后者纳入的研究对象为印度年轻人群有关,此类人群较易出现胰岛素缺乏。


糖尿病肾脏病是导致肾衰竭及终末期肾病的常见原因。多项研究2,7,13, 14]发现SIRD组风险最高,提示胰岛素抵抗在糖尿病肾病的发生和早期进展中具有重要的作用。印度年轻人群中SIDD组患病风险最高11]。中国人群中尿酸相关性糖尿病组患终末期肾病的风险也较高14]


糖尿病患者发生心脑血管疾病风险增加2~4倍21]。心脑血管疾病在糖尿病各亚组中的发生风险仍存在争议性。有学者发现SIDD组心血管死亡的风险最高,MOD组心力衰竭的风险最高7, 8,22]。中国人群中SIDD、SIRD、MARD组10年内发生心血管疾病的风险较高12],尿酸相关性糖尿病组的风险也较高14]。德国队列中,SIRD组风险较高,SAID组较低23]。而瑞典原始研究中冠状动脉疾病、卒中的风险在组间无差异2]。Safai等18]认为是否合并脑血管疾病是由年龄和糖尿病持续时间等因素来决定的,而不是分组所决定的。


SIRD组显著的脂肪肝发生风险也被纷纷证实。SIRD组脂质水平控制较差,更易导致脂肪肝13, 14, 15]。随访研究发现,SIRD组基线时肝细胞脂质含量最高,5年后肝纤维化更为普遍;SAID组在基线时有更稳定的血脂水平,5年后肝细胞脂质含量最低9]。Herder等24]发现SIRD组的炎症生物标志物水平最高,炎症生物标志物外溢进入循环已被认为是可能启动异常肝糖代谢和2型糖尿病的重要机制25]


四、糖尿病聚类分型研究的不足与补充

1.胰岛细胞抗体筛查的必要性:不全面的筛查可能会导致SAID组病例数量的丢失。大部分研究仅用了GADA一种抗体2,6, 7, 8,14],当使用多种抗体聚类后发现另外7%的患者被归为SAID,且2% GADA阴性的患者在5年随访后检测呈阳性9]

2.性别特异性:性别对聚类分型结果是否有影响尚存在争议。部分研究显示无明显差异性2,6,15]。其余研究中具有差异性的结果为:男性患者并发心血管疾病11]、肾病11,13,26]的风险更高。SIRD组男性并发视网膜及肾病的风险较高14]。女性患者并发神经11]、视网膜病变27]的风险更高,SIDD组女性并发视网膜、肾病、神经病变的风险较高14]。性别对于聚类分型的影响未来需要在更大规模的研究中进行进一步验证,可能成为糖尿病个体化治疗的又一突破。

3.病程的差异:以3年为界值将乌克兰北部队列中的患者分开聚类后发现,病程较长的患者中SAID和SIDD组的人数是病程较短患者的2倍,且病程较短患者的SIRD组以HOMA2-IR和HOMA2-β增高为特征,长病程组中并未观察到此特征8]。Safai等18]在聚类变量中加入了病程,得到了与Ahlqvist不同的亚组。将病程加入聚类变量可能更有利于区分患者的并发症风险。

4.种族及地区差异性:由于不同种族遗传及地区环境差异性,聚类分型的结果可能不同。亚洲人群SIDD组的比例较高28, 29],发病年龄较小30]、BMI较低31]、疾病进展更快、发生冠状动脉事件的风险更高、发生肾病的风险低10]。相比于以肥胖和胰岛素抵抗为主要驱动因素的欧洲人群,亚洲人群即使BMI较低,胰岛素抵抗也会增加,这与腹部脂肪含量较高有关32]。腹部肥胖比皮下脂肪堆积更不健康,并与胰岛素抵抗、炎症、动脉粥样硬化和血管并发症有关33]。此外,胰岛素抵抗在西方与年龄呈正相关,而在中国与年龄呈负相关34],中国人群SIRD组年龄较小12]

5.集群分配的时间依赖性:德国5年随访研究中,23%的患者在5年随访时切换了集群。随着病程的延长,SIDD组的人群比例增加,而MOD组下降。MOD及MARD向SIDD的迁移与血糖和甘油三酯的变化有关;MARD向SIDD的迁移与脂肪肝指数值的增加有关9]。集群的分配可能会受到甘油三酯、肝脂肪变性及葡萄糖稳态改变的影响。Fedotkina等8]的研究也证明了这一点。

6.简单的临床特征作为参数可能更有实用性:聚类分型是精准医学迈出的一大步,但聚类假定了各亚组中所有个体都是同质的,个体信息易丢失。使用不同的较简单的临床指标可能会更好地预测疾病的进展并指导治疗17, 18,20]。利用持续葡萄糖监测传感器的数据进行分析,也可得到不同血糖水平及波动状况的亚组17]。该传感器可以在家使用,对患者也更加便捷。

7.其他危险因素的影响:糖尿病的影响因素是多方面的。根据人群特征加入腰围、血脂指标、血压、尿酸等作为聚类变量时,可得到不同的亚组14, 15, 16,20]。此外,血糖变异性、内脏脂肪面积、心率、体重、炎症因子等也在聚类中发挥重要作用。且不同风险因素同时存在时,可能会对聚类分型结果产生加性效应。

综上,聚类分析提供了疾病进展风险和潜在治疗策略的大量信息,推进了糖尿病精准治疗的进程,为个体化风险评估提供了更强大的工具,但仍存在一些缺陷与不足。除Ahlqvist等2]研究中的6个参数外,其他危险因素如饮酒或吸烟史、血压、血脂、尿酸、炎症生物标志物和遗传因素也很重要。且GADA、HOMA评估模型在发展中国家数据的缺失限制了这一方法的使用。此外,简单的临床数据模型可能更有实用价值。聚类分型是数据驱动分类方法的一种,随着数据挖掘及机器深度学习技术的不断发展,未来可能会出现更加复杂的诊断算法来定义糖尿病亚型,以指导治疗。


利益冲突 所有作者声明无利益冲突

参考文献略

来源:中华糖尿病杂志微信公众号


小提示:87%用户已下载掌上医讯App,更方便阅读和交流,请扫描二维码直接下载App

(本网站所有内容,凡注明来源为“掌上医讯”,版权均归掌上医讯所有,欢迎转载,转载请注明出处,否则将追究法律责任。凡是本网站注明来源为其他媒体的内容为转载,版权归原作者所有,转载仅作分享,文章观点不作为掌上医讯观点,如有侵权,请及时联系我们,联系电话:0532-67773733)

共有0人参与讨论