본문 바로가기
반응형

11. 회귀분석/선형회귀분석4

[R통계] 선형회귀분석 간단 예제와 결과 해석 (p값이 왜 이렇게 여러개?) 1. 데이터 독립변수는 키, 종속변수는 몸무게입니다. 10명의 데이터입니다. #data height=c(158, 163, 142, 198, 172, 155, 165, 168, 175, 182) weight=c(53, 77, 58, 101, 73, 58, 78, 71, 68, 79) 2. 회귀분석 lm함수를 이용하여 아래와 같이 입력합니다. (종속변수~독립변수) 형식으로 입력합니다. 결과를 변수 result 에 저장합니다. #linear regression result=lm(weight~height) 3. 그래프 그래프를 그리면 아래와 같습니다. plot(height,weight) abline(result) text(mean(height),mean(weight)*1.1, paste("y=",round(re.. 2021. 6. 15.
[R통계] 회귀분석 결측치 처리에서 omit 과 exclude 의 차이 회귀분석을 할 때 결측치를 처리하는 옵션은 na.action 입니다. 입력값은 아래 두가지 입니다. na.omit na.exclude na.omit 과 na.exclude 모두 결측값을 제외하는데, 결과 출력에 차이가 있습니다. na.omit 은 결과출력에서도 결측치를 제외하고 na.exclude 는 결과츨력에서는 결측치를 포함합니다. na.omit 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action=na.omit) > resid(fit) 1 2 3 0.1666667 -0.3333333 0.1666667 na.exclude 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action.. 2020. 12. 26.
[R통계] 회귀분석 표현식에서 . 의 의미 종속변수가 y이고, 독립변수가 x1,x2,x3라고 합시다. 데이터가 아래와 같이 입력되어 있다고 합시다. > mydata=data.frame(y=c(1,2,3),x1=c(1,3,5),x2=c(2,4,6),x3=c(1,4,7)) > mydata y x1 x2 x3 1 1 1 2 1 2 2 3 4 4 3 3 5 6 7 회귀분석을 하려면 아래와 같이 표현식을 입력해야 합니다. lm(y~x1+x2+x3, mydata) 위 표현식을 쉽게 입력하는 방법이 있습니다. 점(.)을 사용하는 것입니다. 점은 모든 독립변수를 포함한다는 의미입니다. lm(y~., mydata) 점(.) 을 이용한 다른 예시도 살펴봅시다. 아래 두 표현식은 동일한 의미입니다. lm(y~.-x1,mydata) lm(y~x2+x3) 아래 두 표현.. 2020. 12. 26.
[R통계] 회귀분석에서 모형식을 입력하는 방법 회귀분석에서 모형식은 아래와 같이 입력합니다. y ~ x1 + x2 + ... y는 종속변수이고, x는 독립변수입니다. 종속변수가 y이고, 독립변수가 x1과 x2라고 한다면 R코드로는 아래와 같이 표현합니다. lm(y~x1+x2) 교호작용, 절편 등도 모형에 포함할 수 있습니다. 모형식에 사용되는 기호는 아래와 같습니다. 기호 의미 예시 1 절편을 포함 +1 + 변수를 포함 +x1 - 변수를 제거 -x1 : 교호작용 포함 x1:x2 * 각 변수 포함 + 교호작용 포함 x1*x2 | 조건부 x1 | x2 ^ 각 변수 포함 + 3차까지의 교호작용 포함 (x1+x2+x3)^3 I 괄호 안의 변수를 포함 I(x1*x2) - 항제거 x1-1 %in% x2가 x1에 내포됨, x1+x1:x2 와 동일 x1+x2%in.. 2020. 12. 26.
반응형