안녕하세요. 이번에는 범주형 변수를 활용한 조절효과분석에 대해 알아보겠습니다.
조절 효과는 독립변인이 종속 변인에 미치는 영향이 제3의 변수에 의해 변화가 나타나는 것을 뜻합니다.
[그림 1] 조절 효과 분석모형
조절 효과도 회귀분석의 연장인데,
독립변수가 종속변수에 미치는 영향 즉, 회귀선이 조절 변수에 의해 영향을 받는 것입니다.
기울기가 영향을 받는 것이지요.
조절 효과가 통계적으로 유의하다면,
조절 변수에 의해서 기울기가 더 가팔라지거나, 완만해지는 변화가 나타납니다.
-------------------------------------------------------------------------------------------------------------------------------
1. 조절 효과 분석 실습
이번에 사용할 변수는 우울, 사회적 위축, 성별입니다.
독립변수는 우울
종속변수는 사회적 위축
조절 변수는 성별(여학생 더미)입니다.
[그림 2] 변수 생성
[그림 3] 변수 이름 변경
앞서 이야기했듯이 조절 효과도 회귀분석의 연장이기 때문에
회귀분석함수 lm을 활용합니다.
조절 효과를 확인하기 위해서는 상호작용항을 만들어주어야 합니다.
상호작용항은 변수 간의 곱으로 표현합니다.
변수 1*변수 2
그래서 lm함수에 투입하면,
[그림 4] 조절 효과 분석
[그림 5] 조절 효과 분석 결과
종속변수는 사회적 위축
독립변수로 우울
조절 변수로
상호작용항은 우울*성별입니다.
이것을 회귀식으로 표현하면
사회적위축 = 0.92 + 0.69*우울 + 0.003*여학생더미 + (-0.02*(우울*여학생더미)) + e 가 됩니다.
이렇게 식으로 표현하는 게 이해를 위해서 정말 중요한데요, 여기서 조절 변인을 고려해서 회귀식을 정리하면
사회적위축 = 0.92 + 0.003*여학생더미 +(0.69-0.02*여학생더미)*우울
이렇게 정리할 수 있습니다.
이렇게 보면, 원래 우울의 회귀계수는 0.69 였는데, 여학생 더미에 따라서 기울기가 -0.02 줄어드는 것을 직관적으로 확인할 수 있습니다.
근데, 분석 결과 상호작용항이 통계적으로 유의하지 않네요;;;ㅎㅎㅎ
그래도 이어서 그래프를 그려주겠습니다ㅠ
-------------------------------------------------------------------------------------------------------------------------------
2. 조절 효과 그래프 그리기
조절 효과 분석에서는 대부분 그래프를 같이 보고합니다.
그래프를 위해서 잠시 변수 생성 부분으로 돌아가겠습니다.
조절 효과 분석으로 보고 싶은 것은
남학생과 여학생의 차이니까, 성별을 남학생-여학생으로 이름을 지정해주는 작업이 필요합니다.
이 작업을 하지 않으면 성별 변수를 연속형 변수로 인식해서, 그래프를 이해하기 조금 어렵습니다.
[그림 6] 범주형 변수 이름 부여
사용하는 함수는 ifelse(조건)입니다.
ifelse(데이터셋$변수 == 1,"이름1","이름2") : 변수 중에서 1인 값을 가지고 있으면 "이름1"로 바꾸고
1이 아니면 "이름 2"로 바꾸기
이렇게 한 다음 head함수로 비교해보면
[그림 7] 이름 부여 전후 비교
보다시피 1은 girl로 0은 boy로 바뀌었습니다!
이제 그래프를 그려보겠습니다.
그래프는 그릴 때는 plot함수도 있지만
ggplot이 뭔가 예쁘게 나와서 ㅎ ggplot을 사용하렵니다.
library(ggplot2)를 불러온 뒤에
[그림 8] 조절 효과 그래프 그리기 코드
aes(x = 독립변수, y = 종속변수, colour = 조절 변수)
colour는 색깔을 표시하라는 명령어인데, 범주형 변수를 넣으면 범주에 맞춰서 구분하여 표시해줍니다.
[그림 9] 조절 효과 그래프
아까 상호작용항이 통계적으로 유의하지 않았습니다.
따라서 그래프에서 큰 차이가 없는 것으로 나오네요... ㅎㅎㅎ
아마 통계적으로 유의했다면 그래프 간격이 조금 벌어져서 나왔을 것 같은데... 하하하
통계적으로 유의하다는 가정하에 해석을 해본다면,
사회적위축 = 0.92 + 0.003*여학생더미 +(0.69-0.02*여학생더미)*우울
남학생의 경우 우울이 1 단위 증가할수록 사회적 위축이 0.69만큼 증가하는데,
여학생은 우울이 1 단위 증가할수록 사회적 위축이 0.67만큼 증가하는 것으로 나타났고,
남학생이 여학생보다 사회적 위축이 더 큰 것으로 나타났습니다.
이상으로 범주형 변수를 이용한 조절 효과 분석을 해보았습니다.
다음에는 연속형 변수를 이용한 조절 효과에 대해서 알아보겠습니다.
감사합니다!
'교육통계 > Rstudio' 카테고리의 다른 글
교육통계 R랑가몰라 5. t-test (0) | 2022.11.02 |
---|---|
교육통계 R랑가몰라 4. 조절효과 2) 연속형변수 (0) | 2022.11.02 |
교육통계 R랑가몰라 3. 매개효과분석 (0) | 2022.11.02 |
교육통계 R랑가몰라 2. 기초통계 - 4) 다중회귀분석2 (0) | 2022.11.02 |
교육통계 R랑가몰라 2. 기초통계 - 2) 회귀분석 (0) | 2022.11.02 |