교육통계/STATA

STATA - 4.상관 & 단순회귀

개노답이글스 2023. 9. 4. 18:24

 

상관분석과 회귀분석은 매우 밀접한 관련이 있습니다.

 

상관분석은 선형관계에 대한 수치를 알려주고

 

회귀분석은 선형관계에 기초해서 모형이 설정 됩니다.

 

그러니 상관관계에서 유의미한 결과를 보여주지 않으면

 

회귀분석 해봤자 아무 상관 없겠죠?

 

그러니 일단 상관분석 하는 것부터 봅시다

 

 

통계분석 - 요약, 표 및 검정 - 요약 및 기술통계량 - 쌍별상관 눌러줍니다.

 

(상관을 기술통계로 포함시켜놨네 ㅋㅋ)

 

그리고 관심 가지는 두 변수를 선택해줍니다.

 

저는 학업열의와 삶의 만족도를 볼께요

 

이 때, 아래 유의수준 V 표시 해주고

 

아래 설정으로 진행해줍니다.

 

그러면 결과값이 짜잔

 

pwcorr 명령문 체크... ㅋㅋ 옆에 star(5) 없으면 유의수준에 따른 플래그 안 달아줍니다 ㅎㅎ

 

상관이 꽤나 높네요..0.4236

 

일단 그럼 회귀분석 ㄱㄱ

 

통계분석 - 선형회귀 클릭

 

종속변수에 삶의 만족도

 

독립변수에 학업열의 넣겠습니다.

결과가 나왔군요

 

하나하나 살펴봅시다

 

먼저 모형 검증

 

 

SS는 분산을 의미하며

 

Model은 회귀식이고

 

아래 Residual은 잔차

 

Total은 Model +Residual 값

 

옆에 MS는 분산은 df(자유도)로 나누어준 값.

 

이게 맞나 궁금하신 분은 직접 계산해보시길 ㅋㅋ

 

모형 유의도 검증값은 오른쪽 값을 보면 됩니다

 

모형에 대해서는 F검증이라는 것을 하는데.

 

대략 T검정이란 비슷한 친구로 생각하고 넘어갑시다...ㅎㅋ

 

이 모형이 의미있는지 없는지

 

F값은 Model MS(169.42)를 Residual MS(.299)로 나눈 값!

 

F분포에 대한 검정은 Model 자유도가 1, 잔차 자유도가 2588인 분포에 따라 검증 진행

 

통계적으로 유의하므로 이제 아래 절편과 기울기들이 의미있는지 확인하면 끝

 

R-squared는 방금 다루었던 설명력

 

이는 Model SS를 Total SS로 나눠주면 쉽게 확인 가능합니다잉

 

이제 아래 결과들을 봅시다

 

 

Coefficient는 회귀계수를 의미하는데

 

이때 Cons는 상수항 = 절편값

 

즉 이 결과를 바탕으로 다시 회귀식으로 써보면

 

$삶의\ 만족도\ =\ 1.63\ +\ 0.46\ \cdot \ 학업열의\ +\ \epsilon $  = 1.63 + 0.46 ·  + ε

 

학생들의 평균적인 삶의 만족도는 1.63이며(왜이리 낮니..?)

 

학업열의가 1단위 올라갈 때, 삶의 만족도는 0.46 정도 올라가게 된다

 

이 회귀계수에 대한 ‘t’ 검정 값은 옆에 나와있고

 

이에 따라 유의도(p)값과 신뢰도 역시 확인이 가능합니다.

 

여기서 이제 '표준화'값을 찾으신다면..

 

추가 옵션을 넣어주어야 합니다.

 

 

결과표 탭에 '표준화된 베타계수' check!

 

하고 확인

 

명령문 regress 종속변수 독립변수, beta 확인..

 

그러면 아래 Beta라고 나와있네요

 

어라

 

저 Beta 값 어디서 봤던 숫자인데..?

 

상관계수랑 같죠? ㅋㅋ

 

단순회귀분석에서의 특징입니다.

 

 

'교육통계 > STATA' 카테고리의 다른 글

분산분석 3. 일원분산분석  (0) 2023.09.04
STATA - 5.다중회귀  (0) 2023.09.04
STATA- 3. 기술통계  (0) 2023.09.04
STATA- 2. 변수 만들기  (0) 2023.09.04
STATA 1. 파일 불러오기  (0) 2023.09.04