교육통계/Rstudio 23

교육통계 R랑가몰라 7. 로지스틱 회귀분석-1 (이론..?)

안녕하세요 이번에는 로지스틱 회귀분석에 대해서 알아보려 합니다. ​ 이전까지 다루었던 선형 회귀분석, 다중회귀분석은 종속변수가 연속 변수일 때 활용하였습니다. ​ 하지만 종속변수가 범주 변수일 때는 선형 회귀분석을 사용할 수 없습니다. ​ 왤까요..?ㅎㅎ ​ --------------------------------------------------------------------------------------------------------------------------- ​ 1. 로지스틱 회귀분석 ​ 범주 변수가 1 또는 0으로 구성돼있다면 종속변수는 '확률'로 계산됩니다. ​ 예를 들면... 변수 코딩이 ​ 1: 대학원을 진학할 생각이 있다. 0: 대학원을 진학할 생각이 없다. ​ 이렇게 되어있다..

교육통계 R랑가몰라 6. 분산분석

안녕하세요 이번에는 분산분석에 대해서 알아보려 합니다. ​ 분산분석은 평균값이 3개 이상이 있는 값들에 대해서 차이가 있는지 없는지 분석할 때 사용하는 방법입니다. ​ 종속변수는 연속변수이고, 독립변수는 범주형 변수일 때 사용할 수 있겠죠 ​ 구체적으로 A, B, C 집단이 있을 때 각 집단별로 평균의 차이가 있는지 ​ 이것을 가설을 통해서 표현을 하면 ​ 영가설: A, B, C 집단의 00에 평균 차이가 없다. 대립 가설: A, B, C 집단의 00에 평균 차이가 있다. ​ 영가설을 만족되었을 때의 수식은 A = B = C ​ 영가설이 기각되었을 때는 등호가 단 하나라도 성립이 안 되는 것을 의미합니다. ​ 그러니까 $A\ \ne B\ =C$A ≠B =C​ $A\ =B\ \ne C$A =B ≠C​ $A..

교육통계 R랑가몰라 5. t-test

안녕하세요 이번에는 t-test, t 검정에 대해서 알아보려 합니다. t-test는 집단 간 평균 차이를 검증할 때 사용하는 방법입니다. 그리고 검증을 위해선 평균값이 두 개가 있어야 합니다. 세 개 이상이면 분산분석을 사용하지요 ㅎ t-test에서도 하나의 집단에서 평균값을 두 번 뽑아서 분석할지 아니면 두 개의 독립된 집단에서 평균값을 각각 뽑아서 분석할 지에 따라 대응표본 분석과 독립 표본 분석으로 나누어집니다. 대응표본은 전자인, 하나의 집단에서 두 개의 평균을 독립 표본은 ------------------------------------------------------------------------------------------------------------------------------..

교육통계 R랑가몰라 4. 조절효과 2) 연속형변수

안녕하세요. 이번에는 연속형변수를 활용한 조절효과분석​에 대해 알아보겠습니다. 분석을 위한 변수로 우울, 사회적 위축, 학업 무기력을 사용하였습니다. 독립변수: 우울 종속변수: 사회적 위축 조절변수: 학업 무기력 ------------------------------------------------------------------------------------------------------------------------------- 1. 조절 효과 분석 변수 만드는 과정은 [그림 1]과 같고요 ㅎㅎ ​ [그림 1] 변수 생성 분석은 앞선 범주형 변수와 같습니다. lm함수를 사용해서, 상호작용 항을 투입하면 되는 것이지요. [그림 2] 조절 효과 분석 코드 아 분석 전에 조절 효과를 해석하는데 조금 ..

교육통계 R랑가몰라 4. 조절효과 1) 범주형변수

안녕하세요. 이번에는 범주형 변수를 활용한 조절효과분석에 대해 알아보겠습니다. 조절 효과는 독립변인이 종속 변인에 미치는 영향이 제3의 변수에 의해 변화가 나타나는 것을 뜻합니다. [그림 1] 조절 효과 분석모형 조절 효과도 회귀분석의 연장인데, 독립변수가 종속변수에 미치는 영향 즉, 회귀선이 조절 변수에 의해 영향을 받는 것입니다. 기울기가 영향을 받는 것이지요. 조절 효과가 통계적으로 유의하다면, 조절 변수에 의해서 기울기가 더 가팔라지거나, 완만해지는 변화가 나타납니다. ------------------------------------------------------------------------------------------------------------------------------- 1..

교육통계 R랑가몰라 3. 매개효과분석

안녕하세요. 이번에는 매개효과에 대해 알아보도록 하겠습니다. ​ 매개효과는 독립변수와 종속변수의 관계에서 영향을 줄 수 있는 제3 변수의 영향력을 확인하는 분석방법입니다. ​ 말그대로 독립변수와 종속변수를 매개하는 변인이 존재한다는 가정에 따라서 분석을 하게 됩니다. ​ 그림을 그려보면, ​ [그림 1] 매개효과 모형 X: 독립변수 Y: 종속변수 M: 매개변수 ​ 독립변수가 종속변수에 직접 효과를 줄 수 있지만, 매개변수를 통해서 간접적으로 영향(간접효과)을 줄 수 있습니다. ​ 따라서 연구시에 매개 변인이 있는지 철저히 확인이 필요하며, 이에 따른 연구 설계가 중요합니다. ​ 논리에 따라서 회귀분석으로 가능할지, 매개분석이 필요한지 결정해야 되겠습니다. ​ 물론, 이 역시 철저히 이론적으로 타당하게 검..

교육통계 R랑가몰라 2. 기초통계 - 4) 다중회귀분석2

안녕하세요. 이번에는 저번에 이어 더미변수를 포함한 다중회귀분석과 위계적회귀분석에 대해 알아보겠습니다. ​ ------------------------------------------------------------------------------------------------------------------------------- ​ 1. 더미변수 ​ 더미변수는 범주형 변수를 분석에 사용하기 위해 코딩을 해주는 것을 뜻합니다. ​ 예를 들어, 남자 1 여자 2로 조사를 받았는데, ​ 이전의 연속변수들 처럼 이 둘을 합쳐서 성별변수를 만든다고하면... ​ 평균이 뭐 1.2, 1.3 이런식으로 나올텐데 ​ 소숫점으로 나오는 결과는 해석이 불가능 하겠죠?ㅎㅎ ​ 따라서 기준이 되는 변수를 0으로 하고 그 ..

교육통계 R랑가몰라 2. 기초통계 - 2) 회귀분석

안녕하세요. 이번에는 회귀분석에 대해 알아보겠습니다. ​ 회귀분석은 독립변인의 값을 이용해서 종속 변인의 값을 예측하는 방법입니다. ​ 회귀분석을 위해선 먼저 두 변인간의 관계가 어떤지 상관관계 분석에서 출발합니다. ​ 두 변수간의 상관관계가 통계적으로 유의하다면, 독립변수가 종속 변인에 미치는 영향 역시 생각해볼 수 있겠죠. ​ 회귀분석까지 하는 김에 기술통계부터 산포도 및 상관관계 그리고 회귀분석까지 확인해보겠습니다. ​ ------------------------------------------------------------------------------------------------------------------------------- ​ 1. 기술통계 ​ 이번에는 계속 사용하던 학업열의와..

교육통계 R랑가몰라 2. 기초통계 - 1) 상관관계

안녕하세요. 이번에는 상관관계 분석을 알아보도록 하겠습니다. ​ 상관관계란 변수들, 변인들 간의 관계를 보여주는 통계치로 ​ 독립변인과 종속 변인들 간의 관계를 보기 전에 두 변인 간의 관계성을 확인할 수 있는 통계치라 할 수 있습니다. ​ ------------------------------------------------------------------------------------------------------------------------------- ​ 1. 산포도 ​ 상관계수를 확인하는 단계로 먼저 산포도(scatter plot)을 통해 두 변인 간의 관계를 확인할 수 있습니다. ​ 산포도란 변수들을 x, y 축에 놓고 각 변수의 값을 x, y 축으로 하는 공간에 점으로 표시하여 나타내..

교육통계 R랑가몰라 - 1. 기술통계 4) 기술통계 결과확인하기

안녕하세요, 이번에는 기술통계 마지막 장으로 기술통계 결괏값 확인하는 법에 대해 알아보도록 하겠습니다. ​ 기술통계는 모든 통계 분석의 기초라고 할 수 있습니다. ​ 주로 사용되는 분석값으로는 평균, 중앙값, 최소-최대, 분산, 편차, 왜도, 첨도 등이 있지요. ​ 시중에 R을 통해서 기술통계를 분석하면 각 값을 하나하나 분석하게 해서 상당히 귀찮은 작업으로 보입니다. ​ 만약 사용하려는 변수가 많으면.. 언제 값을 하나하나 다 구할까요.. ​ 이러니까 R이 다른 통계프로그램에 비해 불친절(?)하다는 평이 있는 것 같기도 합니다. ​ 하지만, 이번 장으로 R로도 한 방에 내가 보고자 하는 값을 볼 수 있구나 느끼실 꺼라 믿습니다..ㅎㅋㅋ ​ 먼저 패키지 설치가 필요합니다. ​ install.package..