안녕하세요. 이번에는 다중회귀분석에 대해 알아보겠습니다.
저번 회귀분석에 이어서 작업을 하고 있습니다. 사용하는 변수는 학업열의, 학업 무기력, 자아존중감입니다.
단순회귀분석에서는 독립변수가 1개일 때 사용하는 분석방법입니다.
다중회귀분석은 독립변수가 2개 이상일 때 사용하는 분석방법으로,
다양한 예측 요인들을 알아보고자 할 때 사용됩니다.
-------------------------------------------------------------------------------------------------------------------------------
1. 다중회귀분석
저번 회귀분석 때 기술통계부터 천천히 다뤘기 때문에 여기서는 바로 회귀분석으로 넘어가겠습니다.
다중회귀 분석할 때도 마찬가지로 lm함수를 사용합니다. 다중회귀니까 투입되는 변수가 늘어나겠죠?
lm(formula = 종속변수 ~ 독립변수1+독립변수2+···, data = 데이터셋)
단일 회귀에서 입력하는 방법과 비교하면, 독립변수 추가를 +를 사용해서 추가한다는 점입니다.
이제 적용해보면 [그림 1]처럼 입력되겠습니다.
[그림 1] 다중회귀분석 코드
저는 lmresult2 라는 객체에 분석 결과를 넣었습니다.
분석결과를 확인하기 위해 마찬가지로 summary함수를 사용하겠습니다.
[그림 2] 다중회귀분석 결과
결과를 한 번 보겠습니다
Coefficients
(Intercept) : 상수항
Estimate : 비표준화 회귀계수
플래그(*) 통해서 유의도 검증 결과 확인
상수항은 3.520
학업열의의 비표준화 회귀계수는 0.086
학업 무기력의 비표준화 회귀계수는 -0.4086
모두 유의 수준 0.001에서 통계적으로 유의하네요!
이를 바탕으로 회귀식을 만든다면
자아존중감 = 0.086*학업열의 + (-0.4086*학업무기력) + 3.520 + e 가 되겠습니다.
해석을 하자면,
학업 무기력이 통제된 상태에서 학업열의가 1 단위 올라가면 자아존중감은 0.086점 올라가는 것으로 나타났으며,
학업열의가 통제된 상태에서 학업무기력이 1단위 올라가면 자아존중감은 -0.4086점 내려가는 것으로 나타났습니다. 두 변수 모두 유의 수준 0.001에서 통계적으로 유의하였다.
회귀모형을 검증을 살펴볼까요
R-squared : 설명력, 독립변인이 종속 변인을 설명하는 정도
F-statistic, p-value : F검정 결괏값, 회귀모형의 유의도 검증
자아존중감을 학업열의 와 학업 무기력을 27.4% 정도 설명하고 있네요(0.274)
회귀모형은 유의 수준 0.001에서 통계적으로 유의하였습니다.
-------------------------------------------------------------------------------------------------------------------------------
2. 표준화 회귀계수
이렇게 마무리하면 좋을 수도(?) 있지만
일단 제가 배운 교육학 쪽에서는표준화 회귀계수도 다루고 있습니다.
말 그대로 비표준화 회귀계수를 표준화하여 회귀계수 값을 계산하는 것입니다.
표준화 회귀계수를 사용하였을 때 장점은 독립변인들 간의 상대적인 영향력을 확인할 수 있다는 것입니다.
비표준화 회귀계수는 각 측정도구에 영향을 받기 때문에, 직접적인 비교는 살짝 어려운 것으로 알고 있습니다.
아무튼, 그럼 표준화 회귀계수를 확인하는 방법을 알아볼까요?
이때 필요한 패키지는 'QunatPsyc' 입니다.
install.packages("QunatPsyc")
library(QunatPsyc)
를 설치한 후에 lm.beta함수를 사용할 것입니다.
lm.beta(lm분석)
회귀분석에 사용한 lm분석을 담은 객체를 담으면 되는데요
[그림 3] 다중회귀분석 코드
lmresult2 를
lm.beat(lmresult2) 이런식으로 말이죠.
그러면 [그림 4]와 같은 결과를 얻습니다.
[그림 4] 표준화 회귀계수 산출
고맙게도 한 번에 뜨네요ㅎㅎ
학업열의의 표준화 회귀계수는 0.098
학업무기력의 표준화 회귀계수는 -0.467
해석하자면, 학업 무기력이 학업열의 보다 자아존중감에 미치는 영향력이 더 큰 것으로 보입니다.
(절댓값 기준으로 보면 학업 무기력이 - 방향이지만 월등히 크니까요ㅎ)
-------------------------------------------------------------------------------------------------------------------------------
3. 결괏값 정리
이제 모든 결과를 표로 정리해보겠습니다.
표 양식은 여러분의 미적 감각에 따라 예쁘게 꾸미면 됩니다..ㅎㅎ
다만 내용이나 입력 순서는 빠지지 않도록 주의해주세요.
다음에는 더미변수를 포함한 다중회귀분석, 위계적 회귀분석에 대해서 알아보도록 하겠습니다.
감사합니다!
'교육통계 > Rstudio' 카테고리의 다른 글
Educational statistics Using R - 1. Descriptive statistics 4) Descriptive statistics (0) | 2022.11.09 |
---|---|
교육통계 R랑가몰라 9. 구조방정식(SEM) 5) 자기회귀교차지연모형 (0) | 2022.11.03 |
교육통계 R랑가몰라 9. 구조방정식(SEM) 4) 잠재성장모형 (0) | 2022.11.03 |
교육통계 R랑가몰라 9. 구조방정식(SEM) 3) 경로모형 (0) | 2022.11.03 |
교육통계 R랑가몰라 9. 구조방정식(SEM) 2) 모형검증 (0) | 2022.11.03 |