교육통계/Rstudio

교육통계 R랑가몰라 - 1. 기술통계 4) 기술통계 결과확인하기

개노답이글스 2022. 11. 2. 19:14

안녕하세요, 이번에는 기술통계 마지막 장으로 기술통계 결괏값 확인하는 법에 대해 알아보도록 하겠습니다.

기술통계는 모든 통계 분석의 기초라고 할 수 있습니다.

주로 사용되는 분석값으로는 평균, 중앙값, 최소-최대, 분산, 편차, 왜도, 첨도 등이 있지요.

시중에 R을 통해서 기술통계를 분석하면 각 값을 하나하나 분석하게 해서 상당히 귀찮은 작업으로 보입니다.

만약 사용하려는 변수가 많으면.. 언제 값을 하나하나 다 구할까요..

이러니까 R이 다른 통계프로그램에 비해 불친절(?)하다는 평이 있는 것 같기도 합니다.

하지만, 이번 장으로 R로도 한 방에 내가 보고자 하는 값을 볼 수 있구나 느끼실 꺼라 믿습니다..ㅎㅋㅋ

먼저 패키지 설치가 필요합니다.

install.package("psych")를 통해 설치를 하신 후

library(psych)로 불러와야겠죠?

그리고 이 패키지의 내장함수인 'describe'를 활용하고자 합니다.

사용법은 간단합니다.

describe(객체) 만 하면 모든 결괏값이 한 번에 다 나옵니다.

그럼 한 번 볼까요?

-----------------------------------------------------------------------------------------------------------------------------

지금까지 잘 따라와주션다는 가정하에 먼저 만들었던 '학업열의'와 '자아존중감'을 변수로 활용하겠습니다.

먼저 학업열의부터 볼까요?

[그림 1] 기술통계

제가 사용하고 있는 데이터셋인 study에서 $를 사용하여 engage라는 변수를 사용하였습니다.

이렇게 $를 사용하면 데이터셋의 열을 쉽게 불러올 수 있습니다.

이를 실행하면 [그림 2]와 같이 나타납니다.

[그림 2] 학업열의 기술 통계치

결괏값에 대한 설명을 드리자면

n: 사례수

mean: 평균

sd: 표준편차

median: 중앙값

min: 최솟값

max: 최댓값

skew: 왜도

kurtosis: 첨도

보통 보고서(논문)에 위의 값들 기술통계로 보고합니다.

이처럼 한 번에 해주는 함수가 또 있을까요..(개발자 만세!)

아마 summary 함수도 한 번에 보여주는 것 아니냐 할 수 있습니다.

같이 비교해볼까요?

[그림 3] summary를 사용한 기술통계

편차 없고.. 왜도 없고.. 첨도 없고..

아 사분위 값(1st Qu. , 3rd Qu.)이랑 결측 값(NA's)은 나오네요.

이래도 summary 쓰시겠다면 할 말은 없지만...ㅋ

이렇게 변수 하나하나 확인할 수 있지만

변수들을 데이터프레임데이터 프레임의 형태로 만들면 역시 한 방에 확인할 수 있습니다.

그럼 데이터 프레임으로 만들어 보겠습니다. [그림 4]

[그림 4] 데이터 프레임 만들기

sample이라는 객체에 데이터 프레임을 만들었습니다.

data.frame(객체1, 객체2, 객체3..)

데이터 프레임을 만드는 함수인 data.frame

구성하려는 객체들의 길이(length)만 같으면 데이터 프레임으로 만들 수 있습니다.

즉, 길이가 다르면 데이터프레임으로 만들 수 없다는 것인데요.

제가 지금까지 만든 변수는 데이터셋 안에서 변수를 새로 만들었기 때문에

길이가 달라질 이유가 거의 없다고 할 수 있습니다(이래 놓고 안되면 굉장히 당황스럽지만...)

만약 안 된다면 데이터셋에 무언가 새로운 행이 추가된 상태이니 꼭 확인해주길 바랍니다.

이렇게 데이터 프레임을 만들고 describe 함수를 사용하면 [그림 5]와 같습니다.

[그림 5] 기술통계 한 번에 1

이것을 실행하면 [그림 6]과 같은 결과가 나타납니다.

[그림 6] 기술통계 한 번에 2

오우 친절하게도 이번엔 변수 이름도 같이 들어갔네요!

더 이상 mean.. var 이런 함수를 계속 사용하지 않아도 됩니다 ㅎ

변수만 잘 만들었다면, 이렇게 쉽게 기술통계를 해결할 수 있답니다.

다음장에서는 상관관계에 대해서 알아보도록 하겠습니다.

감사합니다!