본문 바로가기
12. 신뢰도 분석/Cohen's kappa

[R통계분석] 코헨의 카파 Cohen's kappa (범주형 데이터의 신뢰도분석,2검사자)

by makhimh 2020. 11. 10.
반응형

[R통계분석] 

코헨의 카파 Cohen's kappa (범주형 데이터의 신뢰도분석,2검사자)

<코드 모아보기>


#패키지 설치하고 불러오기

install.packages("vcd")

library("vcd")


#데이터 정리하고 변수에 저장

data("SexualFun")

md=SexualFun


#코헨 카바 구하기

result = Kappa(SexualFun)


#출력하기(결과와 CI)

print(result,CI=TRUE)


#출력하기(결과,weight)

summary(result)



신뢰도분석을 할 때, 연속형 데이터는 ICC를 사용합니다. 범주형데이터에서는 코헨의 카파와 플레이즈 카파를 사용합니다. 셋의 차이는 아래와 같습니다. 


연속형 : ICC

범주형,2검사자 : Cohen's kappa
범주형,3이상검사자 : Fleiss kappa


R을 통해 코헨의 카파를 구하는 방법을 알아봅시다. 먼저 예시를 소개하겠습니다. 예시가 좀 그렇긴 한데 코헨의 카파를 구해주는 vcd 패키지에서 제공하는 예시라 선택했습니다. 


먼저 vcd 패키지를 설치합시다. 


>>> install.packages("vcd")
>>> library("vcd")


데이터를 불러와서 md라는 변수에 저장합시다. 


>>> data("SexualFun")
>>> md=SexualFun


데이터는 아래와 같습니다. 


> md
              Wife
Husband        Never Fun Fairly Often Very Often Always fun
  Never Fun            7            7          2          3
  Fairly Often         2            8          3          7
  Very Often           1            5          4          9
  Always fun           2            8          9         14


남편과 아내의 성적 만족도 조사결과입니다. 이 데이터를 이용하여 코헨의 카파를 구해봅시다. 


>>> result = Kappa(SexualFun)


결과는 아래와 같습니다. 


> result
            value     ASE     z Pr(>|z|)
Unweighted 0.1293 0.06860 1.885 0.059387
Weighted   0.2374 0.07832 3.031 0.002437


신뢰구간(CI)과 함께 출력해봅시다 .


> print(result,CI=TRUE)
            value     ASE     z Pr(>|z|)    lower  upper
Unweighted 0.1293 0.06860 1.885 0.059387 -0.00512 0.2638
Weighted   0.2374 0.07832 3.031 0.002437  0.08388 0.3909


summary 함수를 이용하면 weight 도 함께 출력됩니다. 


> summary(result)
            value     ASE     z Pr(>|z|)
Unweighted 0.1293 0.06860 1.885 0.059387
Weighted   0.2374 0.07832 3.031 0.002437

Weights:
          [,1]      [,2]      [,3]      [,4]
[1,] 1.0000000 0.6666667 0.3333333 0.0000000
[2,] 0.6666667 1.0000000 0.6666667 0.3333333
[3,] 0.3333333 0.6666667 1.0000000 0.6666667
[4,] 0.0000000 0.3333333 0.6666667 1.0000000



1에 가까울수록 신뢰도가 높은 것입니다. 판별 기준은 아래와 같은데 근거는 없습니다. 


<Landis and Koch>


<0 no agreement

0-0.2 slight

0.21-0.4 fair

0.41-0.6 moderate

0.61-0.8 substantial

0.81-1 almost perfect


<Fleiss's>


<0.4 poor

0.40-0.75 fair

<0.75 excellent


반응형

댓글