본문 바로가기
반응형

11. 회귀분석6

R 로지스틱 회귀분석 하는 법 (nodal 데이터 예시) 로지스틱 회귀분석은 독립변수가 여러개이고 종속변수가 한개인 경우 사용합니다. 독립변수는 연속형, 범주형 둘 다 가능하고 종속변수는 범주형이어야 합니다. 1. 데이터 살펴보기 로지스틱 회귀분석에 사용할 데이터는 boot 패키지의 nodal 데이터입니다. 아래와 같이 불러옵니다. library(boot) dt=nodal > head(dt) m r aged stage grade xray acid 1 1 1 0 1 1 1 1 2 1 1 0 1 1 1 1 3 1 1 0 1 1 1 1 4 1 1 0 1 1 1 1 5 1 1 0 1 1 1 1 6 1 0 0 1 1 1 1 변수 설명은 아래와 같습니다. r : 전립선암 양성 여부 aged : 연령 (60 이하는 0, 초과는 1) stage : 질병단계 (1이 더 심각).. 2023. 1. 8.
R 다항회귀분석 하는 방법 (Cars93 데이터 예시) 다중선형회귀분석은 독립변수가 여러개이고 종속변수가 한개인 경우에 사용합니다. 독립변수와 종속변수 모두 연속형 데이터인 경우 사용합니다. 1. 데이터 살펴보기 우리가 사용할 데이터를 살펴봅시다. 사용할 데이터는 MASS 패키지의 Cars93 데이터입니다. 자동차 가격, 마력, RPM, 길이 등의 데이터입니다. 총 93대의 자동차 정보가 있습니다. 변수가 27개나 되는 데이터입니다. 전부 사용하지는 않을 것이고 일부만 사용할 겁니다. 우리가 독립변수와 종속변수로 사용할 열이름은 아래와 같습니다. 독립변수 : Horsepower, RPM, Length, Wheelbase, Width, Weight 종속변수 : Price 종속변수인 Price 는 자동차 가격입니다. 자동차 가격을 예측하는 모델을 만들 것입니다... 2023. 1. 7.
[R통계] 선형회귀분석 간단 예제와 결과 해석 (p값이 왜 이렇게 여러개?) 1. 데이터 독립변수는 키, 종속변수는 몸무게입니다. 10명의 데이터입니다. #data height=c(158, 163, 142, 198, 172, 155, 165, 168, 175, 182) weight=c(53, 77, 58, 101, 73, 58, 78, 71, 68, 79) 2. 회귀분석 lm함수를 이용하여 아래와 같이 입력합니다. (종속변수~독립변수) 형식으로 입력합니다. 결과를 변수 result 에 저장합니다. #linear regression result=lm(weight~height) 3. 그래프 그래프를 그리면 아래와 같습니다. plot(height,weight) abline(result) text(mean(height),mean(weight)*1.1, paste("y=",round(re.. 2021. 6. 15.
[R통계] 회귀분석 결측치 처리에서 omit 과 exclude 의 차이 회귀분석을 할 때 결측치를 처리하는 옵션은 na.action 입니다. 입력값은 아래 두가지 입니다. na.omit na.exclude na.omit 과 na.exclude 모두 결측값을 제외하는데, 결과 출력에 차이가 있습니다. na.omit 은 결과출력에서도 결측치를 제외하고 na.exclude 는 결과츨력에서는 결측치를 포함합니다. na.omit 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action=na.omit) > resid(fit) 1 2 3 0.1666667 -0.3333333 0.1666667 na.exclude 적용 예시 > x=c(1,2,3,NA,NA) > y=c(2,3,5,7,11) > fit=lm(y~x,na.action.. 2020. 12. 26.
[R통계] 회귀분석 표현식에서 . 의 의미 종속변수가 y이고, 독립변수가 x1,x2,x3라고 합시다. 데이터가 아래와 같이 입력되어 있다고 합시다. > mydata=data.frame(y=c(1,2,3),x1=c(1,3,5),x2=c(2,4,6),x3=c(1,4,7)) > mydata y x1 x2 x3 1 1 1 2 1 2 2 3 4 4 3 3 5 6 7 회귀분석을 하려면 아래와 같이 표현식을 입력해야 합니다. lm(y~x1+x2+x3, mydata) 위 표현식을 쉽게 입력하는 방법이 있습니다. 점(.)을 사용하는 것입니다. 점은 모든 독립변수를 포함한다는 의미입니다. lm(y~., mydata) 점(.) 을 이용한 다른 예시도 살펴봅시다. 아래 두 표현식은 동일한 의미입니다. lm(y~.-x1,mydata) lm(y~x2+x3) 아래 두 표현.. 2020. 12. 26.
[R통계] 회귀분석에서 모형식을 입력하는 방법 회귀분석에서 모형식은 아래와 같이 입력합니다. y ~ x1 + x2 + ... y는 종속변수이고, x는 독립변수입니다. 종속변수가 y이고, 독립변수가 x1과 x2라고 한다면 R코드로는 아래와 같이 표현합니다. lm(y~x1+x2) 교호작용, 절편 등도 모형에 포함할 수 있습니다. 모형식에 사용되는 기호는 아래와 같습니다. 기호 의미 예시 1 절편을 포함 +1 + 변수를 포함 +x1 - 변수를 제거 -x1 : 교호작용 포함 x1:x2 * 각 변수 포함 + 교호작용 포함 x1*x2 | 조건부 x1 | x2 ^ 각 변수 포함 + 3차까지의 교호작용 포함 (x1+x2+x3)^3 I 괄호 안의 변수를 포함 I(x1*x2) - 항제거 x1-1 %in% x2가 x1에 내포됨, x1+x1:x2 와 동일 x1+x2%in.. 2020. 12. 26.
반응형