검색 상세

랜덤 포레스트를 활용한 복합 만성질환자의 건강 관련 삶의 질 예측모형 구축 : 국민건강영양조사 원시자료활용

Prediction of Health-Related Quality of Life in Complex Chronic Patients Using Random Forest

초록/요약 도움말

본 연구는 머신러닝 기반 빅데이터 2차 분석연구로 국민 건강 영양 조사 데이터를 활용하여 랜덤 포레스트 알고리즘을 이용하여 복합만성질환의 영향 요인을 예측하고, 예측 모형을 구축하기 위해 수행되었다. 자료 수집 및 모델 구축은 데이터 수집, 전처리, 예측 모델 구축, 모델 평가의 4단계로 구성되었다. 해당 데이터는 국민건강영양조사 공식 웹사이트(https://knhanes.kdca.go.kr/knhanes/main.do)에서 다운로드하였으며, 제공된 SAS 형식(.sas7bdat)의 데이터셋을 Phthon을 이용하여 Excel 형식으로 변환하였다. 조사 대상은 만 19세 복합만성질환자를 대상으로 구성되었으며, 858명의 성인들이 포함되었다. 주요 변수는 선행요인(나이,교육수준,성별,결혼여부) ,가능요인(소득(한달),건강 보험 여부, 평균 근로 시간, 가족 수 등) ,욕구요인(주관적 건강 인식, 외래 이용 여부, 입원 이용 여부, 주관적 체형 인식 등) 건강행위요인(흡연, 음주, 암검진 등)로 총 47개의 변수로 구성되었다. 랜덤포레스트 알고리즘을 통해 영향 요인을 파악하고, 이 중 주요 변수로 상위 20개의 변수를 선정하여 모델 해석을 진행하였다.랜덤 포레스트 모델을 이용한 복합만성질환자의 영향요인 예측 결과 주요 변수로는 주관적 건강 인식, 일주일 동안 걷는 횟수, 나이 등이 복합만성질환자의 건강 관련 삶의 질에 영향을 미치는 것으로 나타났으며, 특히 주관적 건강 인식이 가장 큰 영향을 미친다는 결과를 도출하였다. 모델 성능 결과 MAE 0.08, RMSE 0.11, MSE 0.01, MAPE 9.86, R²0.15 로 성능 최적화를 위해 하이퍼파라미터를 조정한 결과, 최적 값에서 모델의 성능을 개선할 수 있었다. 복합만성질환자의 건강 관련 삶의질에 중요한 영향을 미치는 변수들은 주관적 건강인식, 일주일에 걷는 횟수, 나이 등이 나타났다. 특히 주관적 건강 인식이 높을수록 건강 관련 삶의 질이 증가하는 경향을 보였으며, 일주일 동안 걷는 횟수가 많을수록 건강 관련 삶의 질이 증가하는 경향을 확인하였다. 이러한 결과를 바탕으로 본 연구는 주관적 건강 인식을 높이기 위한 건강 정보제공과 인식 개선 캠페인이 필요하고 걷기 실천과 같은 일상 기반 신체활동 장려자를 위해 지역 보건소 및 지자체 중심 프로그램 개발이 요구된다. 또한 민간의료 보험 미가입자, 저소득층, 고령층을 위한 맞춤형 복지와 의료 지원 체계가 강화되어야하며 국민건강영양조사와 같은 국가 단위 자료를 활용한 정책 효과 평가와 예측모형 기반 위험군 선별 시스템이 보건정책 기획에 반영되어야 한다. 마지막으로 공공과 민간의료기관 간 연계 체계를 강화하여, 통합적이고 지속적인 관리가 가능하도록 해야한다.

more

목차 도움말

Ⅰ. 서론 1
1. 연구배경 1
2. 연구목적 4
3. 용어의 정의 4
1) 복합 만성질환자 4
(1) 이론적 정의 4
(2) 조작적 정의 4
2) 건강 관련 삶의 질 5
(1) 이론적 정의 5
(2) 조작적 정의 5


Ⅱ. 문헌고찰 6
1. 복합 만성질환 6
2. 건강 관련 삶의 질 7
3. 랜덤 포레스트를 활용한 빅데이터 연구 8

Ⅲ.이론적 기틀

Ⅳ. 연구방법 11
1. 연구설계 11
2. 자료 수집 및 모델 구축
1) 데이터 수집 12
2) 데이터 전처리 15
(1) 데이터 클리닝 16
(2) 이상치 확인 16
3) 예측 모델 구축 16
(1) 모델 학습 16
(2) 하이퍼파라미터 설정 17
4) 모델 평가 18
5)윤리적 고려 19


Ⅴ. 연구결과 19
1. 탐색적 데이터 분석 19
1) 연속형 데이터 분석 19
2) 명목형 데이터 분석 22
3) Boxplot 분석
2. 예측 모델 성능 평가 32
1) Feature Importance 33
2) SHAP values 34
Ⅵ. 논의 37
Ⅶ. 결론 및 제언 40
참고문헌 41
Abstract 49

more