이것저것/R 통계 4

[R 통계] 일치도 (Agreement) 평가 - Bland-altman plot

진단방법이나 장비를 비교할 때, 두 측정 방법이 일치하는지를 평가하기 위해 '일치도 (Agreement) 평가'를 수행합니다.일치도 외에도 신뢰도 (reliability), 재현성 (reproducibility), 일치도 (concordance) 등으로 표현하기도 합니다.보통 이미 Golden standard로 쓰이고 있는 A 측정 방법과 새로 개발된 B 측정 방법이 사실상 교환해 가며 사용할만큼 Accuracy, Precision이 높은지 평가하는 것을 의미합니다.결국 새로운 측정방법이 High accuracy, High precision 임을 증명하는 과정을 위해 일치도 평가가 수행됩니다.주의할 점이 있다면 t-검정이나 상관분석은 일치도 평가에 적절하지 않다는 점을 염두해둬야 합니다. 예를 들어 t ..

[R 통계] 성향 점수 매칭 (Propensity score matching) - 3

이전 글에 이어서 본 글에서는 매칭 균형 평가와 통계분석을 다루겠습니다. 4. 매칭 균형 평가매칭 균형 평가는 매칭이 적절하게 잘 수행되었는지 평가하는 것으로 Balance diagnostics 라고 불립니다.바로 직전 글의 말미에서 보여드린 것처럼 매칭 전에는 군 간 유의미한 차이가 있던 변수가 매칭 후 군간 유의미한 차이가 없어지는 것으로 '매칭이 작동은 했겠구나' 라고 짐작할 수는 있지만 정확한 방법은 아닙니다.가장 정량적이고 직접적인 방법은 치료군과 비교군 간 공변량의 SMD (standardized mean differences) 와 VR (variance ratios) 을 비교하는 방법입니다. 쉽게 말해 군 간 공변량 차이를 보여주는 값이라고 생각하시면 됩니다.문헌마다 차이가 있습니다만 SMD..

[R 통계] 성향 점수 매칭 (Propensity score matching) - 2

이전 글에 이어서 본 글에서는 성향점수 평가와 매칭을 다루겠습니다. 3. 성향점수 평가 및 매칭데이터 준비 및 결측치 처리, 공변량 선택이 끝났다면 이제 어떤 성향점수 평가 및 매칭을 시작할 차례입니다.성향점수를 estimation 하는 방법 역시 여러가지가 있지만 본 글에서는 로지스틱 회귀분석(LR, Logistic regression) 만을 다루도록 하겠습니다.Generalized boosting model, random forest, artificial neural network 등 최근 관심도가 높은 머신러닝과 연관되는 방식도 있으나 로지스틱 회귀분석이 PSM에서는 주류로 알려져 있습니다. 이유는 단순하고 해석하기도 쉬워서입니다. 성향점수 평가 시 LR을 사용한다면, 주의해야할 점이 있습니다. 바..

[R 통계] 성향 점수 매칭 (Propensity score matching) - 1

후향적 연구를 하다보면 종종 성향 점수 매칭의 필요성을 느끼곤 합니다. 본 글에서는 R을 이용한 통계 분석에서 성향 점수 매칭을 하고 싶은 경우, 어떤 순서로 접근해야하는지 정리하고자 합니다. 성향 점수 매칭 (Propensity score matching, PSM)임상 연구에서는 무엇보다 연구자의 편향 (bias)을 줄여, 연구의 타당성을 확보하는 것이 중요합니다.무작위 대조 시험 (Randomized controlled trial, RCT) 을 설계하면 이러한 우려를 줄일 수 있지만, 윤리적 이슈, 비용, 가능성 등의 이유 때문에 모든 연구를 RCT로 수행할 수는 없습니다.관찰연구(Observational study) 시 큰 단점은 치료군과 대조군을 나눌 때 편향(bias)가 존재할 수 있다는 점입니..