안녕하세요, 이번에는 기술통계 마지막 장으로 기술통계 결괏값 확인하는 법에 대해 알아보도록 하겠습니다.
기술통계는 모든 통계 분석의 기초라고 할 수 있습니다.
주로 사용되는 분석값으로는 평균, 중앙값, 최소-최대, 분산, 편차, 왜도, 첨도 등이 있지요.
시중에 R을 통해서 기술통계를 분석하면 각 값을 하나하나 분석하게 해서 상당히 귀찮은 작업으로 보입니다.
만약 사용하려는 변수가 많으면.. 언제 값을 하나하나 다 구할까요..
이러니까 R이 다른 통계프로그램에 비해 불친절(?)하다는 평이 있는 것 같기도 합니다.
하지만, 이번 장으로 R로도 한 방에 내가 보고자 하는 값을 볼 수 있구나 느끼실 꺼라 믿습니다..ㅎㅋㅋ
먼저 패키지 설치가 필요합니다.
install.package("psych")를 통해 설치를 하신 후
library(psych)로 불러와야겠죠?
그리고 이 패키지의 내장함수인 'describe'를 활용하고자 합니다.
사용법은 간단합니다.
describe(객체) 만 하면 모든 결괏값이 한 번에 다 나옵니다.
그럼 한 번 볼까요?
-----------------------------------------------------------------------------------------------------------------------------
지금까지 잘 따라와주션다는 가정하에 먼저 만들었던 '학업열의'와 '자아존중감'을 변수로 활용하겠습니다.
먼저 학업열의부터 볼까요?
[그림 1] 기술통계
제가 사용하고 있는 데이터셋인 study에서 $를 사용하여 engage라는 변수를 사용하였습니다.
이렇게 $를 사용하면 데이터셋의 열을 쉽게 불러올 수 있습니다.
이를 실행하면 [그림 2]와 같이 나타납니다.
[그림 2] 학업열의 기술 통계치
결괏값에 대한 설명을 드리자면
n: 사례수
mean: 평균
sd: 표준편차
median: 중앙값
min: 최솟값
max: 최댓값
skew: 왜도
kurtosis: 첨도
보통 보고서(논문)에 위의 값들 기술통계로 보고합니다.
이처럼 한 번에 해주는 함수가 또 있을까요..(개발자 만세!)
아마 summary 함수도 한 번에 보여주는 것 아니냐 할 수 있습니다.
같이 비교해볼까요?
[그림 3] summary를 사용한 기술통계
편차 없고.. 왜도 없고.. 첨도 없고..
아 사분위 값(1st Qu. , 3rd Qu.)이랑 결측 값(NA's)은 나오네요.
이래도 summary 쓰시겠다면 할 말은 없지만...ㅋ
이렇게 변수 하나하나 확인할 수 있지만
변수들을 데이터프레임데이터 프레임의 형태로 만들면 역시 한 방에 확인할 수 있습니다.
그럼 데이터 프레임으로 만들어 보겠습니다. [그림 4]
[그림 4] 데이터 프레임 만들기
sample이라는 객체에 데이터 프레임을 만들었습니다.
data.frame(객체1, 객체2, 객체3..)
데이터 프레임을 만드는 함수인 data.frame은
구성하려는 객체들의 길이(length)만 같으면 데이터 프레임으로 만들 수 있습니다.
즉, 길이가 다르면 데이터프레임으로 만들 수 없다는 것인데요.
제가 지금까지 만든 변수는 데이터셋 안에서 변수를 새로 만들었기 때문에
길이가 달라질 이유가 거의 없다고 할 수 있습니다(이래 놓고 안되면 굉장히 당황스럽지만...)
만약 안 된다면 데이터셋에 무언가 새로운 행이 추가된 상태이니 꼭 확인해주길 바랍니다.
이렇게 데이터 프레임을 만들고 describe 함수를 사용하면 [그림 5]와 같습니다.
[그림 5] 기술통계 한 번에 1
이것을 실행하면 [그림 6]과 같은 결과가 나타납니다.
[그림 6] 기술통계 한 번에 2
오우 친절하게도 이번엔 변수 이름도 같이 들어갔네요!
더 이상 mean.. var 이런 함수를 계속 사용하지 않아도 됩니다 ㅎ
변수만 잘 만들었다면, 이렇게 쉽게 기술통계를 해결할 수 있답니다.
다음장에서는 상관관계에 대해서 알아보도록 하겠습니다.
감사합니다!
'교육통계 > Rstudio' 카테고리의 다른 글
교육통계 R랑가몰라 2. 기초통계 - 2) 회귀분석 (0) | 2022.11.02 |
---|---|
교육통계 R랑가몰라 2. 기초통계 - 1) 상관관계 (0) | 2022.11.02 |
교육통계 R랑가몰라 - 1. 기술통계 3) 역문항 포함된 변수 만들기 (0) | 2022.11.02 |
교육통계 R랑가몰라 - 1. 기술통계 1) 자료불러오기 (0) | 2022.11.02 |
교육통계 R랑가몰라 - 1. 기술통계 2) 변수 만들기 (0) | 2022.11.02 |