[R통계분석]
코헨의 카파 Cohen's kappa (범주형 데이터의 신뢰도분석,2검사자)
<코드 모아보기>
#패키지 설치하고 불러오기
install.packages("vcd")
library("vcd")
#데이터 정리하고 변수에 저장
data("SexualFun")
md=SexualFun
#코헨 카바 구하기
result = Kappa(SexualFun)
#출력하기(결과와 CI)
print(result,CI=TRUE)
#출력하기(결과,weight)
summary(result)
신뢰도분석을 할 때, 연속형 데이터는 ICC를 사용합니다. 범주형데이터에서는 코헨의 카파와 플레이즈 카파를 사용합니다. 셋의 차이는 아래와 같습니다.
연속형 : ICC
범주형,2검사자 : Cohen's kappa
범주형,3이상검사자 : Fleiss kappa
R을 통해 코헨의 카파를 구하는 방법을 알아봅시다. 먼저 예시를 소개하겠습니다. 예시가 좀 그렇긴 한데 코헨의 카파를 구해주는 vcd 패키지에서 제공하는 예시라 선택했습니다.
먼저 vcd 패키지를 설치합시다.
>>> install.packages("vcd")
>>> library("vcd")
데이터를 불러와서 md라는 변수에 저장합시다.
>>> data("SexualFun")
>>> md=SexualFun
데이터는 아래와 같습니다.
> md
Wife
Husband Never Fun Fairly Often Very Often Always fun
Never Fun 7 7 2 3
Fairly Often 2 8 3 7
Very Often 1 5 4 9
Always fun 2 8 9 14
남편과 아내의 성적 만족도 조사결과입니다. 이 데이터를 이용하여 코헨의 카파를 구해봅시다.
>>> result = Kappa(SexualFun)
결과는 아래와 같습니다.
> result
value ASE z Pr(>|z|)
Unweighted 0.1293 0.06860 1.885 0.059387
Weighted 0.2374 0.07832 3.031 0.002437
신뢰구간(CI)과 함께 출력해봅시다 .
> print(result,CI=TRUE)
value ASE z Pr(>|z|) lower upper
Unweighted 0.1293 0.06860 1.885 0.059387 -0.00512 0.2638
Weighted 0.2374 0.07832 3.031 0.002437 0.08388 0.3909
summary 함수를 이용하면 weight 도 함께 출력됩니다.
> summary(result)
value ASE z Pr(>|z|)
Unweighted 0.1293 0.06860 1.885 0.059387
Weighted 0.2374 0.07832 3.031 0.002437
Weights:
[,1] [,2] [,3] [,4]
[1,] 1.0000000 0.6666667 0.3333333 0.0000000
[2,] 0.6666667 1.0000000 0.6666667 0.3333333
[3,] 0.3333333 0.6666667 1.0000000 0.6666667
[4,] 0.0000000 0.3333333 0.6666667 1.0000000
1에 가까울수록 신뢰도가 높은 것입니다. 판별 기준은 아래와 같은데 근거는 없습니다.
<Landis and Koch>
<0 no agreement
0-0.2 slight
0.21-0.4 fair
0.41-0.6 moderate
0.61-0.8 substantial
0.81-1 almost perfect
<Fleiss's>
<0.4 poor
0.40-0.75 fair
<0.75 excellent
댓글