banner
뉴스 센터
일관되고 높은 기준, 적시 배포 및 헌신적인 고객 중심

경도 인지 장애가 있는 개인의 치매 위험 예측: Cox 회귀 모델과 기계 학습 모델의 비교

Dec 31, 2023

BMC 의학 연구 방법론 22권, 기사 번호: 284(2022) 이 기사 인용

1911 액세스

2 인용

7 알트메트릭

측정항목 세부정보

Cox 비례 위험 회귀 모델과 기계 학습 모델은 치매 위험을 예측하는 데 널리 사용됩니다. 이러한 모델의 기존 비교는 대부분 경험적 데이터 세트를 기반으로 했으며 혼합된 결과를 산출했습니다. 이 연구에서는 경도 인지 장애(MCI)가 있는 사람들의 Monte Carlo 시뮬레이션을 사용하여 이벤트 발생 시간 결과를 예측하기 위한 다양한 기계 학습 및 Cox 회귀 모델의 정확성을 조사합니다.

9가지 이벤트 발생 시간 회귀 및 기계 학습 모델의 예측 정확도가 조사되었습니다. 이러한 모델에는 Cox 회귀, 페널티화된 Cox 회귀(Ridge, LASSO 및 탄력적 순 페널티 사용), 생존 트리, 무작위 생존 숲, 생존 지원 벡터 머신, 인공 신경망 및 극단적인 경사 부스팅이 포함됩니다. 시뮬레이션 데이터는 MCI 환자의 임상 레지스트리 및 대규모 커뮤니티 기반 레지스트리의 연구 설계 및 데이터 특성을 사용하여 생성되었습니다. 이러한 모델의 예측 성능은 Harrell의 일치 지수(c-index), 통합 보정 지수(ICI) 및 통합 브라이어 점수(IBS)를 통한 3중 교차 검증을 기반으로 평가되었습니다.

Cox 회귀 및 기계 학습 모델은 세 가지 다른 성능 지표 및 데이터 분석 조건에서 비슷한 예측 정확도를 보였습니다. Cox 회귀 분석, 무작위 생존 숲 및 극한 경사 부스팅에 대한 추정 c-index 값은 큰 표본 크기 조건에서 Cox 회귀 모델에서 데이터를 생성했을 때 각각 0.70, 0.69 및 0.70이었습니다. 대조적으로, 이 모델에 대한 추정된 c-index 값은 큰 표본 크기 조건의 무작위 생존 숲에서 데이터가 생성되었을 때 0.64, 0.64 및 0.65였습니다. Cox 회귀 분석과 무작위 생존 숲 모두 표본 크기 및 데이터 생성 모델에 관계없이 조사된 모든 모델 중에서 ICI 값이 가장 낮았습니다(큰 표본 크기의 경우 0.12, 작은 표본 크기의 경우 0.18).

Cox 회귀 모델은 더 복잡한 기계 학습 모델과 비교할 수 있고 때로는 더 나은 예측 성능을 제공합니다. 연구 가설, 모델 해석 가능성 및 데이터 유형에 대한 중요한 고려 사항을 바탕으로 이러한 모델을 선택할 것을 권장합니다.

동료 검토 보고서

치매는 기억력, 사고력, 행동, 삶의 질에 영향을 미치는 복잡한 건강 상태입니다. 2015년 전 세계 치매 비용은 8,180억 달러로 추산되었으며, 그 중 86%가 고소득 국가에서 발생했습니다[1]. 치매는 일반적으로 경도 인지 장애(MCI)가 선행되며, 이는 일상 생활 활동이 유지됨에도 불구하고 인지 테스트 점수가 좋지 않은 인지 문제로 정의됩니다. MCI 환자는 정상적인 인지능력을 가진 사람에 비해 치매 발병 위험이 훨씬 더 높습니다. 평균적으로 MCI 환자의 5~10%는 매년 치매로 진행됩니다[2]. 그러나 MCI가 있는 모든 개인이 치매로 진행되는 것은 아닙니다[3]. 치매에 대한 질병 수정 치료법이 없는 상황에서, 치매 발병 위험이 높고 수정 가능한 위험 요인에 대한 표적 개입의 혜택을 받을 수 있는 개인의 조기 식별을 지원하기 위한 임상 의사결정 지원에 대한 수요가 증가하고 있습니다. 이러한 도구는 감시 목적으로도 사용될 수 있습니다. MCI 환자가 치매로 진행되면 지역 사회에서 안전하게 생활할 수 있도록 지지 치료를 받을 수 있습니다[4]. 또한 이러한 도구는 MCI 환자와 그 가족이 치매 발병 위험과 미래 생활 계획에 관해 묻는 질문에 의료 서비스 제공자가 답변할 수 있도록 지원할 수 있습니다[5].

환자의 위험 요인 세트를 기반으로 치매 발병 확률을 추정하는 예후 위험 예측 모델[6]은 이러한 결정 도구를 개발할 수 있는 모델 클래스를 구성합니다. 치매의 예후 위험 점수는 회귀 분석 및 기계 학습 모델을 기반으로 개발되었으며, 최근에는 기계 학습 모델이 자주 사용됩니다. 예를 들어, 최근 발표된 치매 위험 점수에 대한 체계적인 검토에서는 발표된 모델의 약 40%가 기계 학습 알고리즘을 채택한 것으로 나타났습니다[7]. 그러나 검토에서는 식별된 위험 점수의 대부분이 모델의 내부 및 외부 검증 부족, 위험 점수 개발을 위한 통계적 방법 선택, 개인 평가 사이의 긴 간격을 포함하는 고유한 방법론적 한계를 가지고 있다고 결론지었습니다. 위험 [7]. 현재까지 일상적인 임상 실습에 사용하기 위한 임상 결정 보조 수단으로 적합한 치매 위험 점수가 채택되지 않았습니다[7, 8].