교육통계/STATA 8

분산분석 5. 상호작용

1.상호작용? A, B 따로 따로 보는 게 아니라 사실 같은 영향안에 있는 것이니까 서로 상호작용이 있는 거 아니냐? 원래있던 기득권 세력인 주효과 A, B와 함께 상호작용효과 A*B도 고려해야 하는 것 아닌가 하는 생각은 또 누가 시작했을 까 상호작용 효과가 있다면, 그 평균의 차이가 주효과(A, B)에 의한 것이 아니라 서로 영향을 주고 받고 있어서 주효과+상호작용 효과로 봐야 되는 것 아닌가? 라고 누가 시작했다 상호작용 효과를 확인하기 위해서는 그래프과 효과적이긴 한데 상호작용이 없는 경우, 두 직선이 평행 또는 일치된 상태를 보인다 x축에 집단 변수 둘 중 1개, Y축은 종속변수 x축은 해당 수준에 따른 값을 표기해준다 아래 그림에선 X1, X2 모두 2개의 수준만 가지고 있다고 했을 때 이렇게..

교육통계/STATA 2023.09.04

분산분석 4. 이원분산분석

일원분산분석에서 요인, 집단을 구부하는 변수 하나만 넣고 분석을 한 건데 두 개 넣고 싶으면 어쩌나 했을 때 쓰는 방법이 이원분산분석 가령, 앞서 우울을 지역규모로만 구별해서 분석을 했는데 학교 성별유형(남녀공학, 남학교, 여학교)에 따라서도 약간 차이있지 않을까 라는 쓸데없는 생각이 든다면 그 때 쓸 수 있다. 아니 근데 두 개면 일원분산분석 두 번 하면 되는 거 아니냐고 할 수 있는데 그걸 언제 하나 하나 돌리고 있노.. 보다는 t-test 에서 다중검정의 문제가 있을 수 있으니 그냥 한 큐에 하자고.. 1.일단 먼저 고정효과모형 수식을 살펴보자 A집단의 평균과 B집단의 평균과 함께 오차항으로 구성되어 있고 이걸 다시 풀어쓰면 세상 끔찍하지만 한 번 만 더 분산분석스럽게 정리하면 --- 중간 과정까진..

교육통계/STATA 2023.09.04

분산분석 3. 일원분산분석

뭔가 엄청 나간것 갔지만 사실 아직 출발하지도 않았다 연구가설만 세우고 아무것도 안했으니ㅋㅋㅋ 연구가설이 뭐였지.. Q. 지역규모에 따라 청소년의 우울에 차이가 있는가? 이 때 연구자가 관심있어 하는 '지역규모'를 요인으로 부른다 이 요인의 수준이 미리 정해져(알고 있으면) 고정효과 모형 모르겠는데, 뭔가 뭔가 있지 않을까? 싶으면 무선효과 모형으로 놓고 돌린다 1.고정효과 모형 지역규모의 수준을 연구자가 이미 너무 잘 알고 있다 읍면지역, 중소도시, 대도시, 특별시 총 4개의 수준으로 나누어보겠다는 거지~ 이제 분산분석, F검정을 실시한다 R로 그냥 해보면, aov 함수 사용해서~ 앞 장을 열심히 보았다면.. 이제 이 표 보는 것 쯤이야 일도 아니다 F검정 결과 통계적으로 유의하였고, 즉, 집단 간 분..

교육통계/STATA 2023.09.04

STATA - 5.다중회귀

단순 회귀했으면 다중 회귀도 해볼만 할 겁니다 단순 회귀분석과 똑같습니다 제가 시연하는 모형은 종속변수: 삶의 만족도 독립변수: 여학생더미변수, 자아존중감, 학업열의 통계분석 - 선형회귀 클릭 다중 회귀니까 독립변수를 여러개 넣어 줍니다 하나 하나 클릭해서 넣으면 이렇게 쌓이고 '결과표' 탭으로 가서 '표준화된 베타계수' 클릭한 다음 '확인'하면 됩니다 모형 검증은 단순 회귀와 동일합니다 자세한 내용은 단순회귀를 다룬 곳을 참고해주시고..ㅎㅎ 독립변수를 넣은 만큼 각각의 독립변수의 회귀계수가 통계적으로 유의한 지, 유의하다면 어느정도 영향을 주고 있는지 기술해줍니다 일단 통계적으로 유의하지 않았던 것은 'girl' 여학생더미 변수입니다. 남학생이나 여학생, 성별에 따라 삶의 만족도는 차이가 없는 것으로 ..

교육통계/STATA 2023.09.04

STATA - 4.상관 & 단순회귀

상관분석과 회귀분석은 매우 밀접한 관련이 있습니다. 상관분석은 선형관계에 대한 수치를 알려주고 회귀분석은 선형관계에 기초해서 모형이 설정 됩니다. 그러니 상관관계에서 유의미한 결과를 보여주지 않으면 회귀분석 해봤자 아무 상관 없겠죠? 그러니 일단 상관분석 하는 것부터 봅시다 통계분석 - 요약, 표 및 검정 - 요약 및 기술통계량 - 쌍별상관 눌러줍니다. (상관을 기술통계로 포함시켜놨네 ㅋㅋ) 그리고 관심 가지는 두 변수를 선택해줍니다. 저는 학업열의와 삶의 만족도를 볼께요 이 때, 아래 유의수준 V 표시 해주고 아래 설정으로 진행해줍니다. 그러면 결과값이 짜잔 pwcorr 명령문 체크... ㅋㅋ 옆에 star(5) 없으면 유의수준에 따른 플래그 안 달아줍니다 ㅎㅎ 상관이 꽤나 높네요..0.4236 일단 ..

교육통계/STATA 2023.09.04

STATA- 3. 기술통계

변수까지 만들었다면, 이제 확인을 해봐야겠죠? 일단 간단히 빈도 확인하는 것부터 볼께요 통계분석 - 요약, 표 및 검정 - 빈도표를 눌러줍니다 '범주형 변수' 에서 확인하고자 하는 변수를 눌러줍니다. 일단 성별로 간단히 확인해볼께요 결과를 보면 빈도, 비율, 누적비율 순으로 나옵니다. 결측이 없는 데이터라 결측이 따로 표시되지 않는 군요 그럼 이제 생성한 변수들 중심으로 기술통계를 보면, 통계분석 - 요약, 표 및 검정 - 기타표 - 요약통계량(간략) 눌러줍니다 다른 방식으로 보는 방법들이 있지만, 제가 보기엔 이렇게 보는게 제일 깔끔한 것 같아요 변수에 기술통계를 내고자 한 변수들을 모두 집어 넣습니다 4개 모두 넣어넣고 확인을 누른 다음 아래 '표시할 통계량'에 보고자 하는 값들을 정리해줍니다. 옆에..

교육통계/STATA 2023.09.04

STATA- 2. 변수 만들기

자료를 불러왔으면 다음으로는 변수를 만들어야겠죠? 사용하고 있는 데이터는 KCYP2018 데이터이고 만들 변수는 학업열의, 학업무기력, 삶 만족도&행복, 자아존중감입니다. 변수 생성을 위해서는 데이터- 데이터 생성 또는 변경 - 새 변수 생성을 눌러줍니다. 그러면 이런식으로 변수생성 창이 나오는데, 변수 타입은 'double'로 해서 숫자로 인식하게 해주고 변수 명에 만들 변수 이름을 넣어줍니다. 학업열의를 만들어주려하니, 학업열의라 써주고 학업열의를 묻는 문항은 총 16개 문항이라 16개 평균을 구하는 식으로 작성해서 만들어줍니다. 그리고 확인을 누르면 변수가 생성 되는데요, 마찬가지로 학업무기력, 삶_만족도, 자아존중감을 만들려고 봤더니 자아존중감에 역문항이 있네요.. 바꿔줘야겠죠? 다시 계산해서 4..

교육통계/STATA 2023.09.04

STATA 1. 파일 불러오기

Stata로 spss 파일을 불러 오는 방법을 볼까요 먼저.. STATA 실행하고.. STATA는 기본적으로 stata 전용 데이터셋인 .dta 가 기본입니다. 그래서 만약 .dta 파일 형식이 있다면 바로 .dta로 불러오면 쉽죠 하지만.. 다른 형식으로 데이터를 가지고 있다면.. 어카누.. 그럼 그 형식에 맞게 불러오면 됩니다 ㅎㅋㅋ 파일 - 불러오기 - SPSS 데이터 가 있네요 이외에도 다양한 형식의 데이터가 있는데 필요시 다른 것들을 클릭해서 사용하심 될 듯 합니다 저걸 클릭하면 이런 화면이 나올텐데, 저기서 이제 찾아보기를 누르면 spss형식인 .sav 를 저장한 곳에 가서 가져오면 됩니다 그러면 이렇게 데이터에 어떤 변수들이 있는지 대략적으로 보여주구요 확인을 누르면, 기본 화면에 이렇게 변..

교육통계/STATA 2023.09.04