연관토픽
개념
- 데이터가 중심에서 얼마나 퍼져 있는지 나타내는 통계량
- 각 데이터와 평균과의 차이(편차)를 합친 것
- 모분산과 표본분산이 있음
모분산과 표본분산 공식
구분 | 설명 |
모분산 | - population variance - 모집단을 구성하는 모든 자료값과 모평균의 편차 제곱에 대한 평균 - 모집단 모든 자료값과 모평균의 변동량의 제곱을 평균한 값 |
표본분산 | - sample variance - 표본을 구성하는 모든 자료값과 표본평균의 편차의 제곱합을 n-1로 나눈 수치 |
평균절대편차(MAD)
- 절대값을 사용해서 편차를 평가
분산은 왜 제곱할까?
① 제곱하는 것이 이론 전개 및 최적화를 수행할 때 훨씬 편리
② 편차를 제곱하는 경우에는 데이터의 산포를 강조하는 효과
분산의 단점
- 편차를 제곱한 값이기 때문에 다른 지표들과 비교하기가 쉽지 않음
모범답안
참고 사이트