교육통계/STATA

STATA - 5.다중회귀

개노답이글스 2023. 9. 4. 18:28

 

단순 회귀했으면

 

다중 회귀도 해볼만 할 겁니다

 

단순 회귀분석과 똑같습니다

 

제가 시연하는 모형은

 

종속변수: 삶의 만족도

독립변수: 여학생더미변수, 자아존중감, 학업열의

 

통계분석 - 선형회귀 클릭

 

 

다중 회귀니까

 

독립변수를 여러개 넣어 줍니다

 

하나 하나 클릭해서 넣으면 이렇게 쌓이고

 

'결과표' 탭으로 가서

 

 

'표준화된 베타계수' 클릭한 다음

 

'확인'하면 됩니다

 

 

모형 검증은 단순 회귀와 동일합니다

 

자세한 내용은 단순회귀를 다룬 곳을 참고해주시고..ㅎㅎ

 

독립변수를 넣은 만큼

 

각각의 독립변수의 회귀계수가

 

통계적으로 유의한 지,

 

유의하다면 어느정도 영향을 주고 있는지 기술해줍니다

 

일단 통계적으로 유의하지 않았던 것은 'girl' 여학생더미 변수입니다.

 

남학생이나 여학생, 성별에 따라 삶의 만족도는 차이가 없는 것으로 보입니다.

 

나머지, 자아존중감, 학업열의는 통계적으로 유의했습니다.

 

각각의 회귀계수는 0.699, 0.184 이고

 

'다른 변수들이 통제되었을 때',

 

자아존중감이 한 단위 올라갈 때 삶의 만족도가 0.699 올라가고,

 

학업열의가 한 단위 올라갈 때 삶의 만족도가 .184 만큼 올라간다고 해석할 수 있습니다.

 

그런데,

 

"Beta"값이 존재하는데

 

표준화계수 값입니다.

 

표준화계수는 각각의 회귀계수를

 

표준편차 단위로 '표준화'해준 것이기 때문에

 

각각의 독립변수들 간에 어떤 변수가 상대적으로 더 영향을 주는지

 

비교가 가능해집니다.

 

표준화하기 전에는

 

각각의 척도가 다르기 때문에

 

비표준화계수로는 값이 크다 작다로 직접적인 비교가 불가능합니다

 

그래서 표준화계수를 써서 봤을 때,

 

자아존중감이 .5835, 학업열의가 .168로

 

자아존중감이 학업열의보다 삶의 만족도에 더 큰 영향을 주고 있는 것으로 볼 수 있습니다.

 

한편,

 

다중회귀분석을 할 때

 

꼭 필요한 단계가 '공선성 검정'인데,

 

투입한 독립변수간 상관이 너무 높을 경우

 

그 추정값에 편향이 발생할 수 있게 됩니다

 

그래서 이 공선성을 검정하는데 쓰이는 것이

 

VIF(Variance Inflation Factor) 입니다

 

VIF가 10보다 크다면 문제가 있다고 보면 되고,

 

회귀분석을 실시한 다음 바로

 

명령어 입력 칸에

 

vif를 입력하고 실행해줍니다

 

 

결과값을 보면 크게 문제 삼을만 하지 않네요

 

기계적으로 돌리고 이렇게 보는 것은

 

참 쉽죠?ㅎㅋㅋ

 

'교육통계 > STATA' 카테고리의 다른 글

분산분석 4. 이원분산분석  (0) 2023.09.04
분산분석 3. 일원분산분석  (0) 2023.09.04
STATA - 4.상관 & 단순회귀  (0) 2023.09.04
STATA- 3. 기술통계  (0) 2023.09.04
STATA- 2. 변수 만들기  (0) 2023.09.04