[R통계] 선형회귀분석 간단 예제와 결과 해석 (p값이 왜 이렇게 여러개?)
1. 데이터 독립변수는 키, 종속변수는 몸무게입니다. 10명의 데이터입니다. #data height=c(158, 163, 142, 198, 172, 155, 165, 168, 175, 182) weight=c(53, 77, 58, 101, 73, 58, 78, 71, 68, 79) 2. 회귀분석 lm함수를 이용하여 아래와 같이 입력합니다. (종속변수~독립변수) 형식으로 입력합니다. 결과를 변수 result 에 저장합니다. #linear regression result=lm(weight~height) 3. 그래프 그래프를 그리면 아래와 같습니다. plot(height,weight) abline(result) text(mean(height),mean(weight)*1.1, paste("y=",round(re..
2021. 6. 15.
[R통계] 회귀분석 결측치 처리에서 omit 과 exclude 의 차이
회귀분석을 할 때 결측치를 처리하는 옵션은 na.action 입니다. 입력값은 아래 두가지 입니다. na.omit na.exclude na.omit 과 na.exclude 모두 결측값을 제외하는데, 결과 출력에 차이가 있습니다. na.omit 은 결과출력에서도 결측치를 제외하고 na.exclude 는 결과츨력에서는 결측치를 포함합니다. na.omit 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action=na.omit) > resid(fit) 1 2 3 0.1666667 -0.3333333 0.1666667 na.exclude 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action..
2020. 12. 26.
[R통계] 회귀분석 표현식에서 . 의 의미
종속변수가 y이고, 독립변수가 x1,x2,x3라고 합시다. 데이터가 아래와 같이 입력되어 있다고 합시다. > mydata=data.frame(y=c(1,2,3),x1=c(1,3,5),x2=c(2,4,6),x3=c(1,4,7)) > mydata y x1 x2 x3 1 1 1 2 1 2 2 3 4 4 3 3 5 6 7 회귀분석을 하려면 아래와 같이 표현식을 입력해야 합니다. lm(y~x1+x2+x3, mydata) 위 표현식을 쉽게 입력하는 방법이 있습니다. 점(.)을 사용하는 것입니다. 점은 모든 독립변수를 포함한다는 의미입니다. lm(y~., mydata) 점(.) 을 이용한 다른 예시도 살펴봅시다. 아래 두 표현식은 동일한 의미입니다. lm(y~.-x1,mydata) lm(y~x2+x3) 아래 두 표현..
2020. 12. 26.