色播五月综合_国产精品视频中文字幕91_欧美日韩一区二区在线免费观看_久久久久久成人

基于健康體檢數據的結直腸息肉風險預測模型的構建與評估

來源:職稱論文發表指導網 作者:tt7129 發布時間:
掃碼咨詢
   摘要:目的:探討結直腸息肉的影響因素并構建早期風險預測模型。方法:收集2016年11月至2021年10月于鄭州大學第一附屬醫院健康管理中心同時進行結腸鏡檢查和血常規、生化指標檢查的4997名受檢者

  目的:探討結直腸息肉的影響因素并構建早期風險預測模型。方法:收集2016年11月至2021年10月于鄭州大學第一附屬醫院健康管理中心同時進行結腸鏡檢查和血常規、生化指標檢查的4997名受檢者資料,包括22項指標,使用最小絕對收縮選擇算子(LASSO)進行特征變量篩選。按7:3隨機分組,在訓練集中采用得到的最優變量構建梯度提升(Catboost)、支持向量機(SVM)、Logistic回歸(LR)預測模型,在測試集中進行驗證。采用(x^{2})檢驗比較3種模型的準確率,進一步通過凈重新分類指數(NRI)、綜合判別改善指數(IDI)、ROC曲線下面積(AUC)評估模型的預測性能,并對納入因素進行重要性評估。結果:LASSO回歸得到性別、年齡、腰圍(WC)、尿素(BU)、總蛋白(TP)、腎小球濾過率(GFR)、甘油三酯葡萄糖指數(TyG)等7項特征變量,基于該7項特征變量構建的SVM、Catboost模型的準確率優于LR模型((P<0.05))。SVM、Catboost、LR模型測試集的AUC(95%CI)分別為0.760(0.736~0.784)、0.766(0.742~0.790)和0.676(0.649~0.703)。進一步評估顯示SVM模型預測效果最優,Catboost次之,LR最差(SVM vs Catboost/LR:(NRI >0),(IDI >0),(P<0.05);Catboost vs LR:(NRI >0),(IDI>0),(P<0.001))。特征重要性評估顯示年齡的重要性最大,其次是WC。結論:基于性別、年齡、WC、BU、TP、GFR、TyG構建的SVM模型具備較好的預測價值。該預測模型的建立可對健康體檢人群進行危險分層,有助于盡早發現結直腸癌早期病變。

  論文《基于健康體檢數據的結直腸息肉風險預測模型的構建與評估》發表在《鄭州大學學報(醫學版)》,版權歸《鄭州大學學報(醫學版)》所有。本文來自網絡平臺,僅供參考。

變量數

  有研究[1]報道,2020年全球結直腸癌(colorectal cancer, CRC)新發病例超過190萬,占全球腫瘤病例的10%;死亡病例93.5萬,占全球腫瘤相關死亡總數的9.4%。有數據[2]顯示我國CRC發病率已居所有惡性腫瘤的第2位,死亡率居第4位。河南省城市男性CRC中標發病率于2010~2018年呈上升趨勢,總體發病率隨年齡增加而升高[3],因此有必要積極推動CRC的預防控制工作。CRC主要有腺瘤-癌癥途徑、鋸齒狀病變途徑、炎癥途徑3個致癌途徑[4],其中60%~70%散發的CRC通過腺瘤-癌癥途徑,15%~30%由鋸齒狀病變致癌途徑[5],有不到2%的CRC通過炎癥相關致癌途徑發展而來。

  結直腸息肉是CRC的必經階段,但是發展成CRC需要5~10a的時間,這為早期診斷和臨床干預提供了很大的空間,且早期篩查、早診、早治可以有效降低CRC的死亡率,改善預后[5]。結腸鏡檢查是早期診斷CRC或結直腸息肉最有效的手段之一[6],但結腸鏡是一種侵入性檢查,需要嚴格的腸道準備,而且有穿孔、出血等風險,導致人群的依從性和參與率較低;因此,識別結直腸息肉的影響因素,建立結直腸息肉的預測模型尤為必要。近年來一些研究[7-9]表明,結直腸息肉的發生與性別、年齡、種族、飲食、生活行為習慣、腸道微生物、代謝綜合征、家族史等因素相關,但仍然存在爭議,且對常規體檢項目的研究相對較少。本研究基于健康體檢數據構建結直腸息肉預測模型,以期為篩查CRC高危人群提供支持。

  1 對象與方法

  1.1 研究對象

  數據來源于2016年11月至2021年10月在鄭州大學第一附屬醫院健康管理中心進行健康體檢的人群,選取其中同時進行結腸鏡檢查和血常規、生化指標檢測者。參照結直腸息肉診斷標準《胃腸道腺瘤和良性上皮性息肉的病理診斷共識》[10],分為息肉組和無息肉組。排除標準:① 研究對象基本資料不全或腸道準備不充分者;② 既往有炎癥性腸病、結腸黑變病、CRC等消化道疾病者;③ 嚴重心腦血管疾病、肝腎疾病、惡性腫瘤者等。本研究經鄭州大學第一附屬醫院醫學倫理委員會批準(2018-KY-56)。

  1.2 數據收集

  收集研究對象的體檢數據,包括一般人口學特征和實驗室生化檢查指標共22個:性別、年齡、腰圍(waist circumference, WC)、收縮壓(systolic pressure, SBP)、舒張壓(diastolic pressure, DBP)、BMI、中性粒細胞絕對值(neutrophil, NEU)、淋巴細胞絕對值(lymphocyte, LYM)、總蛋白(total protein, TP)、白蛋白(albumin, ALB)、球蛋白(globulin, GLOB)、尿素(blood urea, BU)、腎小球濾過率(glomerular filtration rate, GFR)、總膽固醇(total cholesterol, TC)、甘油三酯(triglyceride, TG)、高密度脂蛋白(high density lipoprotein cholesterol, HDL-C)、低密度脂蛋白(low density lipoprotein cholesterol, LDL-C)、空腹葡萄糖(fasting blood-glucose, FBG)、白球比(albumin/globulin ratio, AGR)、中性粒細胞淋巴細胞絕對值比值(neutrophil to lymphocyte ratio, NLR)、TC/HDL、甘油三酯葡萄糖指數(TyG),(TyG = ln [TG(mg/dL) × FBG(mg/dL) / 2])。

  1.3 統計學處理

  采用SPSS 25.0與R 4.2.1進行數據分析。連續變量根據是否符合正態分布分別應用t檢驗或秩和檢驗,分類變量應用(x^{2})檢驗進行組間比較。通過最小絕對收縮選擇算子(LASSO)回歸進行特征變量的篩選和復雜度調整,應用十折交叉驗證獲得最優的懲罰系數((lambda)),得到該模型最優的變量和變量系數。變量篩選后,將數據集按7:3的隨機分組方式分為訓練集與測試集,在訓練集中分別構建梯度提升(categorical boosting, Catboost)、支持向量機(support vector machine, SVM)、Logistic回歸(LR)預測模型,應用(x^{2})檢驗比較3種模型的準確率,并進一步通過凈重新分類指數(net reclassification index, NRI)、綜合判別改善指數(integrated discrimination improvement, IDI)、ROC曲線下面積(area under curve, AUC)評估模型的預測性能,并對納入變量的重要性進行評估。檢驗水準(alpha=0.05)。

  2 結果

  2.1 結直腸息肉組和無息肉組的人口學特征和實驗室生化檢查項目比較

  本研究共納入4997人,其中息肉組2462人,無息肉組2535人。息肉組的年齡、SBP、DBP、BMI、WC、NEU、LYM、BU、AGR、TC、TG、TG/HDL、FBG、TyG高于無息肉組,GFR、TP、ALB、GLOB、HDL-C低于無息肉組,差異均有統計學意義((P<0.05))。詳見表1。

  表1 結直腸息肉組和無息肉組的人口學特征和實驗室生化檢查項目比較

  | 生化檢查項目 | 息肉組(n=2462) | 無息肉組(n=2535) | (x^{2})/t/Z | P |

  | 男/例(%) | 1465(57.79) | 1174(46.31) | 169.233 | <0.001 |

  | 年齡/歲 | 50.07±9.53 | 45.45±10.02 | 16.707 | <0.001 |

  | WC/cm | 89.20±9.40 | 85.67±10.16 | 12.747 | <0.001 |

  | SBP/mmHg | 127.89±17.38 | 123.77±16.83 | 8.525 | <0.001 |

  | DBP/mmHg | 79.20±11.96 | 76.31±12.05 | 8.506 | <0.001 |

  | BMI/(kg/m²) | 25.94±3.18 | 25.11±3.42 | 8.823 | <0.001 |

  | NEU/(×10?個/L) | 3.39(2.75,4.07) | 3.30(2.64,4.00) | 3.208 | 0.001 |

  | LYM/(×10?個/L) | 1.95±0.57 | 1.90±0.53 | 3.070 | 0.002 |

  | NLR | 1.93±0.81 | 1.91±0.82 | 0.770 | 0.442 |

  | TP/(g/L) | 72.63±4.16 | 73.43±4.14 | -4.196 | <0.001 |

  | ALB/(g/L) | 47.82±2.83 | 48.51±2.85 | -5.043 | <0.001 |

  | GLOB/(g/L) | 25.14±3.51 | 25.61±3.51 | -2.988 | 0.003 |

  | AGR | 1.93±0.32 | 1.90±0.30 | 2.817 | 0.005 |

  | BU/(mmol/L) | 5.18±1.23 | 4.91±1.14 | 8.049 | <0.001 |

  | GFR/(mL/min) | 99.52±11.96 | 103.03±11.28 | -10.677 | <0.001 |

  | TC/(mmol/L) | 4.83±0.92 | 4.77±0.89 | 2.368 | 0.018 |

  | TG/(mmol/L) | 1.54(1.05,2.26) | 1.34(0.92,1.97) | 8.129 | <0.001 |

  | HDL-C/(mmol/L) | 1.27±0.33 | 1.34±0.34 | -7.542 | <0.001 |

  | LDL-C/(mmol/L) | 2.96±0.80 | 2.92±0.77 | 1.776 | 0.076 |

  | TG/HDL | 1.27(0.77,2.04) | 1.04(0.63,1.71) | 8.952 | <0.001 |

  | FBG/(mmol/L) | 5.57±1.32 | 5.33±1.05 | 7.309 | <0.001 |

  | TyG | 8.85±0.67 | 8.68±0.65 | 9.054 | <0.001 |

  注:1 mmHg=0.133 kPa

  2.2 特征變量的篩選結果

  對除性別外的數據進行處理后,使用LASSO回歸篩選變量,建模和交叉驗證結果見圖1。選擇最小誤差一個方差以內的最大(lambda)(0.0312)為最佳(lambda),得到由性別、年齡、WC、BU、TP、GFR、TyG等7項特征變量組成的最簡單模型(特征變量之間不存在共線性),系數分別為0.526、0.036、0.008、0.021、-0.004、-0.009和0.121。

  圖1 LASSO回歸建模和交叉驗證結果

  A:預測變量的LASSO系數路徑圖;B:LASSO正則化路徑圖(交叉驗證曲線);圖B中的兩條虛線從左至右分別表示兩個特殊的(lambda)值,(lambda_{min}=0.0009)和(lambda_{1se}=0.0312)。前者為所有的(lambda)值中誤差最低的值;后者為最小誤差一個方差范圍內得到最簡單模型的值(即(lambda_{1se})給出的是一個具備優良性能且自變量個數最少的模型)。

  2.3 風險預測模型的構建及評價結果

  按7:3隨機分成兩組(訓練集3499人,測試集1498人,兩集間結直腸息肉構成比差異無統計學意義,(x^{2}<0.001),(P=0.997)),分別構建預測結直腸息肉發生的Catboost、SVM、LR模型。對3種預測模型的準確率進行(x^{2})檢驗,結果顯示差異有統計學意義((x^{2}=22.613),(P<0.001)),成對比較后Catboost、SVM模型的準確率顯著高于LR模型((P<0.05))。進一步采用NRI、IDI、ROC曲線評估3種模型的預測性能,結果分別見圖2、表2。

  圖2 3種預測模型訓練集和測試集的ROC曲線

  上:訓練集;下:測試集。

  由圖2可知,在訓練集和測試集中SVM和Catboost模型的AUC均優于LR(訓練集中SVM vs LR:(Z=15.609),(P<0.001);Catboost vs LR:(Z=15.136),(P<0.001);測試集中SVM vs LR:(Z=8.434),(P<0.001);Catboost vs LR:(Z=10.503),(P<0.001)),而SVM和Catboost模型訓練集差異有統計學意義((Z=3.703),(P<0.001)),測試集無統計學意義((Z=0.994),(P=0.320))。表2結果表明SVM模型與LR、Catboost模型相比,對結直腸息肉發生的預測能力均更優((P<0.05))。

  表2 3種模型的NRI與IDI比較

  | 組別 | 對比模型 | NRI(95%CI) | P | IDI(95%CI) | P |

  | 訓練集 | Catboost vs LR | 0.052(0.029~0.076) | <0.001 | 0.035(0.028~0.042) | <0.001 |

  | | SVM vs LR | 0.121(0.095~0.147) | <0.001 | 0.127(0.117~0.137) | <0.001 |

  | | SVM vs Catboost | 0.069(0.045~0.092) | <0.001 | 0.092(0.085~0.099) | <0.001 |

  | 測試集 | Catboost vs LR | 0.092(0.054~0.130) | <0.001 | 0.040(0.029~0.051) | <0.001 |

  | | SVM vs LR | 0.156(0.113~0.199) | <0.001 | 0.104(0.089~0.120) | <0.001 |

  | | SVM vs Catboost | 0.059(0.020~0.098) | 0.003 | 0.064(0.053~0.075) | <0.001 |

  2.4 影響因素重要性排序

  結果見圖3。SVM模型中納入因素對結直腸息肉發生的重要性評估,從大到小依次為年齡、WC、GFR、TyG、性別、BU、TP;年齡的重要性最大,其次是WC。

  ![圖3 SVM模型中預測變量的重要性排序](https://example.com/fig3)

  圖3 SVM模型中預測變量的重要性排序

  3 討論

  CRC是威脅生命健康的主要癌癥之一,國家癌癥中心最新數據顯示,2016年我國CRC新增病例約40.8萬,占全部惡性腫瘤發病的10.04%,高于2015年的38.76萬例(9.87%);死亡病例19.56萬例,占全部惡性腫瘤死亡的8.10%,高于2015年的18.71萬例(8.01%)[2,11]。CRC篩查和早診早治是降低死亡率、減輕社會負擔的有效措施[6]。作為CRC的癌前病變,發現結直腸息肉發病的影響因素對預防CRC的發生有重要意義。

  周海萍等[8]對8660例正常受檢者進行橫斷面調查,發現男性、高齡、肥胖是結直腸腺瘤發生的危險因素;40~50歲人群有較高的結直腸腺瘤檢出率。魏鑼沛等[12]采用身高、體重、BMI、WC及腰圍身高比等多種身體測量指標探討肥胖與CRC的發病關系,發現WC和腰圍身高比與CRC表現出了較強的關聯。在本研究中WC被納入結直腸息肉預測模型的構建而不是BMI,且重要性居第2,得出了類似的結果。楊翡翠[13]研究結果表明2型糖尿病患者發生結直腸息肉及息肉惡變的風險升高。血脂水平異常也可影響結直腸息肉的發生[14]??赡艿臋C制為高糖及血脂異常等代謝異常使得胰島素抵抗和胰島素樣生長因子(insulin like growth factor, IGF)水平增加,促進結直腸上皮細胞的增殖,同時抑制凋亡,促進腺瘤的發生;高TG水平可引發炎癥反應,上調轉化生長因子和IGF的表達,誘發氧化應激反應,導致DNA損傷;另外還可改變膽汁酸的分泌、循環激素、腫瘤細胞能量供應等[15-16]。目前對GFR、BU、TP與腸道腫瘤的研究較少,一些研究[17]表明胃腸道腫瘤與腎損害有一定的相關性,可能的機制為慢性腎臟疾病會增加促炎細胞因子的產生,從而通過炎癥介質誘導基因突變、適應性反應、抗凋亡和環境變化促進腫瘤的發生[18]。

  選擇合理的指標是構建預測模型的關鍵。目前有一些關于結直腸息肉的風險預測模型研究[19-20],但預測性能各不一致。馮心怡[19]通過健康體檢數據建立預測模型,將年齡、性別、WC、嗜酸性粒細胞計數和LHR(LDL-C/HDL-C)納入模型,訓練集AUC(95%CI)為0.678(0.649~0.708),驗證集AUC(95%CI)為0.679(0.639~0.729)。本研究基于常規體檢數據構建Catboost、SVM、LR預測模型,在測試集中SVM與Catboost模型的AUC大于LR模型,NRI和IDI分析結果顯示SVM模型相較于Catboost和LR模型預測效能更優(NRI和IDI均>0)。

  本研究的局限性:① 這是一項單中心研究,可能會導致選擇偏倚,使得模型的擴展性存在局限;② 缺乏一些流行病學及生活方式的資料,如家族史、吸煙史、飲酒史、飲食情況等,可能會影響研究的結果;③ 該研究為橫斷面研究,僅能提供病因線索,無法進行更深層次的研究,主要是由于腸鏡檢查的大眾接受度仍然較低,很難獲得研究對象的連續資料。

  綜上,基于常規的體檢項目中性別、年齡、WC、BU、TP、GFR、TyG等7項指標構建的SVM預測結直腸息肉風險模型具備良好的預測價值,可能會幫助特定人群更早地發現CRC,以改善預后。

  參考文獻

  [1] SUNG H, FERLAY J, SIEGEL RL, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3):209-249.

  [2] ZHENG RS, ZHANG SW, ZENG HM, et al. Cancer incidence and mortality in China, 2016[J]. J Natl Cancer Cent, 2022, 2(1):1-9.

  [3] 張建功, 劉茵, 陳瓊, 等. 2018年河南省結直腸癌流行現狀及2010-2018年流行趨勢分析[J]. 鄭州大學學報(醫學版), 2022, 57(4):482-487.

  [4] KEUM N, GIOVANNUCCI E. Global burden of colorectal cancer: emerging trends, risk factors and prevention strategies[J]. Nat Rev Gastroenterol Hepatol, 2019, 16(12):713-732.

  [5] KANTH P, INADOMI JM. Screening and prevention of colorectal cancer[J]. BMJ, 2021, 374:n1855.

  [6] 國家癌癥中心中國結直腸癌篩查與早診早治指南制定專家組. 中國結直腸癌篩查與早診早治指南(2020)[J]. 中華腫瘤雜志, 2021, 43(1):16-38.

  [7] 顧芳慧, 楊雷, 張希, 等. 北京市結直腸癌高危人群內鏡篩查依從性分析及對策探討[J]. 中國預防醫學雜志, 2021, 22(6):428-433.

  [8] 周海萍, 沈忠磊, 趙堅培, 等. 結直腸腺瘤分布特征及危險因素分析[J]. 中華胃腸外科雜志, 2018, 21(6):678-683.

  [9] 劉道江, 何國輝, 劉鵬, 等. 結直腸息肉發生危險因素的研究進展[J]. 國際消化病雜志, 2019, 39(6):389-392.

  [10] 中華醫學會病理學分會消化疾病學組. 胃腸道腺瘤和良性上皮性息肉的病理診斷共識[J]. 中華病理學雜志, 2020, 49(1):3-9.

  [11] 鄭榮壽, 孫可欣, 張思維, 等. 2015年中國惡性腫瘤流行情況分析[J]. 中華腫瘤雜志, 2019, 41(1):19-28.

  [12] 魏鑼沛, 李霓, 王剛, 等. 身體測量指標與男性結直腸癌發病關系的前瞻性隊列研究[J]. 中華預防醫學雜志, 2018, 52(7):685-690.

  [13] 楊翡翠. 2型糖尿病與結直腸息肉的相關性分析[D]. 大連: 大連醫科大學, 2022.

  [14] 袁萍, 張若塵, 崔艷欣, 等. 結直腸息肉與尿酸、血脂水平的相關性分析[J]. 胃腸病學, 2018, 23(2):98-101.

  [15] 李佳, 楊落落, 周長麗, 等. 結直腸息肉患者發病相關危險因素分析[J]. 吉林大學學報(醫學版), 2018, 44(3):646-650.

  [16] 李杰, 謝海玲, 李昭輝, 等. 氧化應激在炎癥性腸病和結腸炎相關結直腸癌疾病中的研究進展[J]. 胃腸病學和肝病學雜志, 2022, 31(7):836-840.

  [17] 肖潤沙, 唐文彬, 陳子華, 等. 胃腸道腫瘤合并腎損害30例報告并文獻復習[J]. 中國普通外科雜志, 2020, 29(4):504-510.

  [18] KOMAKI Y, KOMAKI F, MICIC D, et al. Risk of colorectal cancer in chronic kidney disease: a systematic review and meta-analysis[J]. J Clin Gastroenterol, 2018, 52(9):796-804.

  [19] 馮心怡. 基于健康體檢數據的結直腸息肉風險預測模型構建[D]. 揚州: 揚州大學, 2022.

  [20] 郭甜甜, 賈禎, 蔚磊, 等. 結直腸息肉發生的危險因素分析及臨床預測模型構建[J]. 中華消化雜志, 2023, 43(9):626-631.

聲明:

①文獻來自知網、維普、萬方等檢索數據庫,說明本文獻已經發表見刊,恭喜作者.

②如果您是作者且不想本平臺展示文獻信息,可聯系學術顧問予以刪除.

《道路交通事故責任鑒定標準相關要點分析》
上一篇:血清鐵蛋白可識別腸衰竭相關性肝病
下一篇:沒有了
主站蜘蛛池模板: 精品久久久三级| 99精品在线直播| 亚洲高清不卡一区| 日韩精品成人一区二区在线观看| 美女亚洲精品| 国产精品久久久久久亚洲调教| 成人国产精品久久久久久亚洲| 久久国产视频网站| 欧美亚洲另类在线| 日韩在线观看精品| 国产精品亚洲二区在线观看| 欧美精品久久久久a| 伊人久久大香线蕉综合75| av在线亚洲男人的天堂| 久久精品视频在线| 精品国产中文字幕| 久久久精品美女| 久久免费视频在线| 久久久在线视频| 久久久国产在线视频| 秋霞久久久久久一区二区| 亚洲最新免费视频| 粉嫩av免费一区二区三区| 日本精品一区二区三区四区| 日韩在线视频观看正片免费网站| 亚洲中文字幕无码专区| 91久久国产精品| 国产超级av在线| 国产毛片久久久久久国产毛片| 亚洲视频在线观看日本a| 99视频在线免费观看| 97精品国产97久久久久久| 91精品国产亚洲| 亚洲人成网站在线观看播放| 日韩精品无码一区二区三区免费| 日本中文字幕不卡免费| 韩国福利视频一区| 国产成人精品免费久久久久| 91极品视频在线| 亚洲综合日韩中文字幕v在线| 在线观看亚洲视频啊啊啊啊|