교육통계/Rstudio

교육통계 R랑가몰라 2. 기초통계 - 3) 다중회귀분석1

개노답이글스 2022. 11. 3. 15:45

 

안녕하세요. 이번에는 다중회귀분석에 대해 알아보겠습니다.

 

저번 회귀분석에 이어서 작업을 하고 있습니다. 사용하는 변수는 학업열의, 학업 무기력, 자아존중감입니다.

 

단순회귀분석에서는 독립변수 1개일 때 사용하는 분석방법입니다.

 

다중회귀분석은 독립변수 2개 이상일 때 사용하는 분석방법으로,

 

다양한 예측 요인들을 알아보고자 할 때 사용됩니다.

 

-------------------------------------------------------------------------------------------------------------------------------

1. 다중회귀분석

 

저번 회귀분석 때 기술통계부터 천천히 다뤘기 때문에 여기서는 바로 회귀분석으로 넘어가겠습니다.

 

다중회귀 분석할 때도 마찬가지로 lm함수를 사용합니다. 다중회귀니까 투입되는 변수가 늘어나겠죠?

 

lm(formula = 종속변수 ~ 독립변수1+독립변수2+···, data = 데이터셋)

 

단일 회귀에서 입력하는 방법과 비교하면, 독립변수 추가를 +를 사용해서 추가한다는 점입니다.

 

이제 적용해보면 [그림 1]처럼 입력되겠습니다.

 

[그림 1] 다중회귀분석 코드

저는 lmresult2 라는 객체에 분석 결과를 넣었습니다.

 

분석결과를 확인하기 위해 마찬가지로 summary함수를 사용하겠습니다.

 

[그림 2] 다중회귀분석 결과

결과를 한 번 보겠습니다

 

Coefficients

(Intercept) : 상수항

Estimate : 비표준화 회귀계수

플래그(*) 통해서 유의도 검증 결과 확인

 

상수항은 3.520

학업열의의 비표준화 회귀계수는 0.086

학업 무기력의 비표준화 회귀계수는 -0.4086

모두 유의 수준 0.001에서 통계적으로 유의하네요!

 

이를 바탕으로 회귀식을 만든다면

 

자아존중감 = 0.086*학업열의 + (-0.4086*학업무기력) + 3.520 + e 가 되겠습니다.

 

해석을 하자면,

학업 무기력이 통제된 상태에서 학업열의가 1 단위 올라가면 자아존중감은 0.086점 올라가는 것으로 나타났으며,

학업열의가 통제된 상태에서 학업무기력이 1단위 올라가면 자아존중감은 -0.4086점 내려가는 것으로 나타났습니다. 두 변수 모두 유의 수준 0.001에서 통계적으로 유의하였다.

 

회귀모형을 검증을 살펴볼까요

R-squared : 설명력, 독립변인이 종속 변인을 설명하는 정도

F-statistic, p-value : F검정 결괏값, 회귀모형의 유의도 검증

 

자아존중감을 학업열의 와 학업 무기력을 27.4% 정도 설명하고 있네요(0.274)

회귀모형은 유의 수준 0.001에서 통계적으로 유의하였습니다.

 

-------------------------------------------------------------------------------------------------------------------------------

2. 표준화 회귀계수

 

이렇게 마무리하면 좋을 수도(?) 있지만

 

일단 제가 배운 교육학 쪽에서는표준화 회귀계수도 다루고 있습니다.

 

말 그대로 비표준화 회귀계수를 표준화하여 회귀계수 값을 계산하는 것입니다.

 

표준화 회귀계수를 사용하였을 때 장점은 독립변인들 간의 상대적인 영향력을 확인할 수 있다는 것입니다.

 

비표준화 회귀계수는 각 측정도구에 영향을 받기 때문에, 직접적인 비교는 살짝 어려운 것으로 알고 있습니다.

 

아무튼, 그럼 표준화 회귀계수를 확인하는 방법을 알아볼까요?

 

이때 필요한 패키지는 'QunatPsyc' 입니다.

 

install.packages("QunatPsyc")

library(QunatPsyc)

 

를 설치한 후에 lm.beta함수를 사용할 것입니다.

 

lm.beta(lm분석)

 

회귀분석에 사용한 lm분석을 담은 객체를 담으면 되는데요

 

 

[그림 3] 다중회귀분석 코드

lmresult2 를

 

lm.beat(lmresult2) 이런식으로 말이죠.

 

그러면 [그림 4]와 같은 결과를 얻습니다.

 

[그림 4] 표준화 회귀계수 산출

고맙게도 한 번에 뜨네요ㅎㅎ

학업열의의 표준화 회귀계수는 0.098

학업무기력의 표준화 회귀계수는 -0.467

 

해석하자면, 학업 무기력이 학업열의 보다 자아존중감에 미치는 영향력이 더 큰 것으로 보입니다.

(절댓값 기준으로 보면 학업 무기력이 - 방향이지만 월등히 크니까요ㅎ)

 

-------------------------------------------------------------------------------------------------------------------------------

 

3. 결괏값 정리

 

이제 모든 결과를 표로 정리해보겠습니다.

 

 

 

표 양식은 여러분의 미적 감각에 따라 예쁘게 꾸미면 됩니다..ㅎㅎ

 

다만 내용이나 입력 순서는 빠지지 않도록 주의해주세요.

 

다음에는 더미변수를 포함한 다중회귀분석, 위계적 회귀분석에 대해서 알아보도록 하겠습니다.

 

감사합니다!