교육통계/분산분석

분산분석 2. 분산분석 수식 해체쇼

개노답이글스 2023. 9. 4. 18:44

 

분산분석 검정은 F검정을 활용하다

 

F검정은 '집단 간 분산 / 집단 내 분산'

 

이 비율을 활용했다

 

그럼 집단 간 분산 + 집단 내 분산 = 전체 분산 인가??

 

1.수식은 즐거ㅇ...

 

수식을 함 활용해보면서 찬찬히 가보자

 

 

예를 들면,

 

한국 청소년 A의 우울은

 

'한국 청소년 전체 평균 우울 값 + 개인별 오차'

 

로 설명될 수 있다

 

전체 평균 3이고, A의 우울이 2면

 

2 = 3 - 1

 

로 개념적으로 분리할 수 있다

 

여기서 집단의 개념을 넣어 다시 분리해보자

 

 

A가 읍면지역에 속해있는데,

 

읍면지역의 평균이 1.5라면,

 

2 = 1.5 + 5

 

로 표현할 수 있다

 

이제 '오차항'를 다시 개념적으로 변환을 해보면

 

 

이렇게 전개 된다

 

여기서 좌변과 우변에 동일하게 전체 평균을 빼주면

 

다시 예쁘게 정리하면,

 

 

 

이렇게 다시 정리가 되는데,

 

이 모평균을 표본평균으로 바꿔주면

 

 

 

기적의 좌우놀이

 

여기서 양변을 제곱하면?

 

 

여기에 이제 각 사례수, 집단 수 만큼 다 합쳐주면?

 

 

슬슬 토나오죠?

 

우변을 정리하면,

 

 

아악 제발..

 

거의 다왔으니 좀만 더 참아봐요..

 

주목할 것은 이 놈

 

 

 

 

얘가 왜?

 

이놈 해결 안 되면 이 식 전개한 것이 의미가 없어진다

 

얘는 0으로 사라진다

 

왜지?

 

 

 

편차의 총합은? 0

 

0*0 = ?

 

그렇다 그렇게 최종 생존식은?

 

 

 

이것만 남는다

 

이게 뭐라고 이걸 여기까지 끌고왔노...

 

라고 한다면

 

 

으로 정리된다

 

영어로 바꾸면

 

SST(total sum of suqares) = SSB(sum of squares between means) + SSE(error sum of squares)

 

우ㅞㄱ

 

집단 간 편차 제곱 합의 자유도는 집단 수 - 1

 

집단 내 편차 제곱 합의 자유도는 전체 사례수 - 집단 수

 

2.분산분석표가 뾰로롱

 

저번에 구했던

 

집단 간 분산 / 집단 내 분산

 

이건 사실 여기서 구했던 식을 전개해서 얻은 값들이다

 

자 전체 자유도? N-1

 

집단 간 편차 제곱의 자유도? J-1

 

집단 내 편차 제곱의 자유도? N-J

 

이거 하나

 

총 편차 제곱합 = 집단 간 제곱합 + 집단 내 제곱합

 

이거를 '분산'처럼 쓰기 위해

 

각각의 자유도로 나눠준다

 

평균제곱으로 바뀌면서

 

평균제곱오차(MSSE)

 

평균집단간제곱합(MSSB)

 

분산분석표 ANOVA table이 완성된다

 

아 다음장엔 진짜 진짜 분산분석 검정 넣어야지

'교육통계 > 분산분석' 카테고리의 다른 글

분산분석 1. F분포 누구냐 넌?  (0) 2023.09.04
분산분석 0.자 다시 시작이야~  (0) 2023.09.04