교육통계/Rstudio

교육통계 R랑가몰라 4. 조절효과 1) 범주형변수

개노답이글스 2022. 11. 2. 19:38

 

안녕하세요. 이번에는 범주형 변수를 활용한 조절효과분석에 대해 알아보겠습니다.

 

조절 효과는 독립변인이 종속 변인에 미치는 영향이 제3의 변수에 의해 변화가 나타나는 것을 뜻합니다.

 

[그림 1] 조절 효과 분석모형

 

조절 효과도 회귀분석의 연장인데,

 

독립변수가 종속변수에 미치는 영향 즉, 회귀선 조절 변수에 의해 영향을 받는 것입니다.

 

기울기가 영향을 받는 것이지요.

 

조절 효과가 통계적으로 유의하다면,

 

조절 변수에 의해서 기울기가 더 가팔라지거나, 완만해지는 변화가 나타납니다.

 

-------------------------------------------------------------------------------------------------------------------------------

 

1. 조절 효과 분석 실습

 

이번에 사용할 변수는 우울, 사회적 위축, 성별입니다.

 

독립변수는 우울

종속변수는 사회적 위축

조절 변수는 성별(여학생 더미)입니다.

[그림 2] 변수 생성

[그림 3] 변수 이름 변경

 

앞서 이야기했듯이 조절 효과도 회귀분석의 연장이기 때문에

 

회귀분석함수 lm을 활용합니다.

 

조절 효과를 확인하기 위해서는 상호작용항을 만들어주어야 합니다.

 

상호작용항은 변수 간의 곱으로 표현합니다.

 

변수 1*변수 2

 

그래서 lm함수에 투입하면,

 

[그림 4] 조절 효과 분석

[그림 5] 조절 효과 분석 결과

종속변수는 사회적 위축

 

독립변수로 우울

 

조절 변수로

 

상호작용항 우울*성별입니다.

 

이것을 회귀식으로 표현하면

 

사회적위축 = 0.92 + 0.69*우울 + 0.003*여학생더미 + (-0.02*(우울*여학생더미)) + e 가 됩니다.

 

이렇게 식으로 표현하는 게 이해를 위해서 정말 중요한데요, 여기서 조절 변인을 고려해서 회귀식을 정리하면

 

사회적위축 = 0.92 + 0.003*여학생더미 +(0.69-0.02*여학생더미)*우울

 

이렇게 정리할 수 있습니다.

 

이렇게 보면, 원래 우울의 회귀계수는 0.69 였는데, 여학생 더미에 따라서 기울기가 -0.02 줄어드는 것을 직관적으로 확인할 수 있습니다.

 

근데, 분석 결과 상호작용항이 통계적으로 유의하지 않네요;;;ㅎㅎㅎ

 

그래도 이어서 그래프를 그려주겠습니다ㅠ

 

-------------------------------------------------------------------------------------------------------------------------------

 

2. 조절 효과 그래프 그리기

 

조절 효과 분석에서는 대부분 그래프를 같이 보고합니다.

 

그래프를 위해서 잠시 변수 생성 부분으로 돌아가겠습니다.

 

조절 효과 분석으로 보고 싶은 것은

 

남학생과 여학생의 차이니까, 성별을 남학생-여학생으로 이름을 지정해주는 작업이 필요합니다.

 

이 작업을 하지 않으면 성별 변수를 연속형 변수로 인식해서, 그래프를 이해하기 조금 어렵습니다.

 

[그림 6] 범주형 변수 이름 부여

사용하는 함수는 ifelse(조건)입니다.

 

ifelse(데이터셋$변수 == 1,"이름1","이름2") : 변수 중에서 1인 값을 가지고 있으면 "이름1" 바꾸고

 

1이 아니면 "이름 2"로 바꾸기

 

이렇게 한 다음 head함수로 비교해보면

 

[그림 7] 이름 부여 전후 비교

보다시피 1은 girl 0은 boy로 바뀌었습니다!

 

이제 그래프를 그려보겠습니다.

 

그래프는 그릴 때는 plot함수도 있지만

 

ggplot이 뭔가 예쁘게 나와서 ㅎ ggplot을 사용하렵니다.

 

library(ggplot2)를 불러온 뒤에

[그림 8] 조절 효과 그래프 그리기 코드

aes(x = 독립변수, y = 종속변수, colour = 조절 변수)

 

colour는 색깔을 표시하라는 명령어인데, 범주형 변수를 넣으면 범주에 맞춰서 구분하여 표시해줍니다.

 

대표사진 삭제

[그림 9] 조절 효과 그래프

 

아까 상호작용항이 통계적으로 유의하지 않았습니다.

 

따라서 그래프에서 큰 차이가 없는 것으로 나오네요... ㅎㅎㅎ

 

아마 통계적으로 유의했다면 그래프 간격이 조금 벌어져서 나왔을 것 같은데... 하하하

 

통계적으로 유의하다는 가정하에 해석을 해본다면,

 

사회적위축 = 0.92 + 0.003*여학생더미 +(0.69-0.02*여학생더미)*우울

 

남학생의 경우 우울이 1 단위 증가할수록 사회적 위축이 0.69만큼 증가하는데,

 

여학생은 우울이 1 단위 증가할수록 사회적 위축이 0.67만큼 증가하는 것으로 나타났고,

 

남학생이 여학생보다 사회적 위축이 더 큰 것으로 나타났습니다.

 

 

이상으로 범주형 변수를 이용한 조절 효과 분석을 해보았습니다.

 

다음에는 연속형 변수를 이용한 조절 효과에 대해서 알아보겠습니다.

 

감사합니다!