ANOVA 6

분산분석 5. 상호작용

1.상호작용? A, B 따로 따로 보는 게 아니라 사실 같은 영향안에 있는 것이니까 서로 상호작용이 있는 거 아니냐? 원래있던 기득권 세력인 주효과 A, B와 함께 상호작용효과 A*B도 고려해야 하는 것 아닌가 하는 생각은 또 누가 시작했을 까 상호작용 효과가 있다면, 그 평균의 차이가 주효과(A, B)에 의한 것이 아니라 서로 영향을 주고 받고 있어서 주효과+상호작용 효과로 봐야 되는 것 아닌가? 라고 누가 시작했다 상호작용 효과를 확인하기 위해서는 그래프과 효과적이긴 한데 상호작용이 없는 경우, 두 직선이 평행 또는 일치된 상태를 보인다 x축에 집단 변수 둘 중 1개, Y축은 종속변수 x축은 해당 수준에 따른 값을 표기해준다 아래 그림에선 X1, X2 모두 2개의 수준만 가지고 있다고 했을 때 이렇게..

교육통계/STATA 2023.09.04

분산분석 4. 이원분산분석

일원분산분석에서 요인, 집단을 구부하는 변수 하나만 넣고 분석을 한 건데 두 개 넣고 싶으면 어쩌나 했을 때 쓰는 방법이 이원분산분석 가령, 앞서 우울을 지역규모로만 구별해서 분석을 했는데 학교 성별유형(남녀공학, 남학교, 여학교)에 따라서도 약간 차이있지 않을까 라는 쓸데없는 생각이 든다면 그 때 쓸 수 있다. 아니 근데 두 개면 일원분산분석 두 번 하면 되는 거 아니냐고 할 수 있는데 그걸 언제 하나 하나 돌리고 있노.. 보다는 t-test 에서 다중검정의 문제가 있을 수 있으니 그냥 한 큐에 하자고.. 1.일단 먼저 고정효과모형 수식을 살펴보자 A집단의 평균과 B집단의 평균과 함께 오차항으로 구성되어 있고 이걸 다시 풀어쓰면 세상 끔찍하지만 한 번 만 더 분산분석스럽게 정리하면 --- 중간 과정까진..

교육통계/STATA 2023.09.04

분산분석 3. 일원분산분석

뭔가 엄청 나간것 갔지만 사실 아직 출발하지도 않았다 연구가설만 세우고 아무것도 안했으니ㅋㅋㅋ 연구가설이 뭐였지.. Q. 지역규모에 따라 청소년의 우울에 차이가 있는가? 이 때 연구자가 관심있어 하는 '지역규모'를 요인으로 부른다 이 요인의 수준이 미리 정해져(알고 있으면) 고정효과 모형 모르겠는데, 뭔가 뭔가 있지 않을까? 싶으면 무선효과 모형으로 놓고 돌린다 1.고정효과 모형 지역규모의 수준을 연구자가 이미 너무 잘 알고 있다 읍면지역, 중소도시, 대도시, 특별시 총 4개의 수준으로 나누어보겠다는 거지~ 이제 분산분석, F검정을 실시한다 R로 그냥 해보면, aov 함수 사용해서~ 앞 장을 열심히 보았다면.. 이제 이 표 보는 것 쯤이야 일도 아니다 F검정 결과 통계적으로 유의하였고, 즉, 집단 간 분..

교육통계/STATA 2023.09.04

분산분석 2. 분산분석 수식 해체쇼

분산분석 검정은 F검정을 활용하다 F검정은 '집단 간 분산 / 집단 내 분산' 이 비율을 활용했다 그럼 집단 간 분산 + 집단 내 분산 = 전체 분산 인가?? 1.수식은 즐거ㅇ... 수식을 함 활용해보면서 찬찬히 가보자 예를 들면, 한국 청소년 A의 우울은 '한국 청소년 전체 평균 우울 값 + 개인별 오차' 로 설명될 수 있다 전체 평균 3이고, A의 우울이 2면 2 = 3 - 1 로 개념적으로 분리할 수 있다 여기서 집단의 개념을 넣어 다시 분리해보자 A가 읍면지역에 속해있는데, 읍면지역의 평균이 1.5라면, 2 = 1.5 + 5 로 표현할 수 있다 이제 '오차항'를 다시 개념적으로 변환을 해보면 이렇게 전개 된다 여기서 좌변과 우변에 동일하게 전체 평균을 빼주면 다시 예쁘게 정리하면, 이렇게 다시 정..

분산분석 1. F분포 누구냐 넌?

분산과 평균의 관련성에 대해 간략히 살펴보았고, 그럼 통계적으로 어떻게 검정할 것인가? 1. 분포가 뭐노 먹는건가? 각 통계량들은 각각 사용되는 확률분포로 부터 검정을 실시한다 이왕 시작하는거 처음으로 돌아가자 일단 '모평균'에 대한 통계적 추론을 한다고 했을 때, 정규분포로 시작해서 t분포로 이어지는 흐름은 아래 글에 열심히 정리한 기억이 갑자기 생각났다 https://blog.naver.com/tmalqr/223095864877 그럼 분산은 어떤 분포를 따르는 가? 라고 했을 때 t분포를 제곱해서 모두 합친 카이제곱분포를 따르게 된다 t분포를 제곱해서 합쳤기 때문에 0부터 시작하는 괴상한 모양의 분포가 만들어진다 표본분포에서의 자유도는 n-1 대표사진 삭제 사진 설명을 입력하세요. *카이제곱분포 그리..

교육통계 R랑가몰라 6. 분산분석

안녕하세요 이번에는 분산분석에 대해서 알아보려 합니다. ​ 분산분석은 평균값이 3개 이상이 있는 값들에 대해서 차이가 있는지 없는지 분석할 때 사용하는 방법입니다. ​ 종속변수는 연속변수이고, 독립변수는 범주형 변수일 때 사용할 수 있겠죠 ​ 구체적으로 A, B, C 집단이 있을 때 각 집단별로 평균의 차이가 있는지 ​ 이것을 가설을 통해서 표현을 하면 ​ 영가설: A, B, C 집단의 00에 평균 차이가 없다. 대립 가설: A, B, C 집단의 00에 평균 차이가 있다. ​ 영가설을 만족되었을 때의 수식은 A = B = C ​ 영가설이 기각되었을 때는 등호가 단 하나라도 성립이 안 되는 것을 의미합니다. ​ 그러니까 $A\ \ne B\ =C$A ≠B =C​ $A\ =B\ \ne C$A =B ≠C​ $A..