기술통계(Descriptive analysis)
주어진 데이터를 요약/집계하여 결과를 도출
과거의 데이터의 단순 계산/집계 Fact
분석 결과를 따로 해석하는 과정은 거치지 않음
탐색적 분석(EDA - Exporatory analysis)
여러 변수 간 trend, 패턴, 관계를 찾는 것
통계적 기법을 사용한 모델링이라기보다는 그래프 (주로Plot)를 통한 사실 확인이 주된 작업
주로 데이터 분석 프로젝트 초기에 가설을 수립하기 위해 사용
추론적 통계 분석(Inferential analysis)
샘플- 모집단 간의 관계를 탐구하는 것이 분석 유형의 목적
샘플에서 얻어낸 정보가 모집단에도 적용될 수 있을지를 검토하는 것
예) 95%의 확률로 모집단의 평균 점수는 80~85점 사이라고 말할 수 있다.
예) 그룹A의 성적이 그룹B 보다 유의미하게 높았다는 식의 결론이 Inferential analysis의 결과
T검정, ANOVA
예측적 통계분석
머신러닝, 의사결정나무(Decision Tree)등 다양한 통계적 기법을 사용하여 미래 혹은 발생하지 않은 어떤 사건에 대한 예측이 주요 목표
"왜" 보다는 "정확한 예측"을 하는 것이 주요 관심
특정한 설명 변수가 어떤 매커니즘으로 목표 변수에 영향을 미치는 가에 대한 설명력은 약하다.