R

[R] 평균, 중앙값, 최소값, 최대값, 분산, 표준편차

두부너겟 2022. 6. 6. 15:35

절사평균

데이터 요약을 통해서 데이터의 특징, 데이터 간 차이를 파악할수 있으며, 대부분의 값이 어디쯤 위치하는지 추정

 

절사평균: mean() 함수에 trim 매개변수

mean(A_salary, trim =0.1)   #양끝 10%제외하고 평균구함

 

가중평균

모집단의 샘플이 똑같이 수집되지 않는 경우가 많음

스마트폰 사용자를 대상으로 조사하는데, 10대 20대 30대 샘플 다수, 50 60 샘플이 많이 부족하다  -> 가중평균구함

보정 -> 데이터가 부족한 그룹에 더 높은 가중치

 

범위

최소값 최대값 차이

이해쉽고 계산편하지만 극단적인 수치차이만 나타냄

분포 양상은 설명하지 못함

 

range(A_salary)  #최소값 25 최대값 100

[1] 25 100

 

최소값 최대값

min()

max()

 

분산

var(A_salary)

 

표준편차

sd(A_salary)