평균, 중앙값, 최빈값 비교
설명
- 변량의 개수와 변량의 범위를 각각 슬라이더 n과 r로 정한다. 1
- 무작위로 뽑힌 변량들로 어떤 자료를 만들고,
- 그 자료에서 평균과 중앙값 그리고 최빈값을 동시에 관찰한다.
- 다양한 자료의 형태를 보고, 여러 대푯값이 어떻게 나타나는지 주목하자.
중앙값의 절대편차평균 최소화
설명
- 편차란, 자료의 값(
)에서 대푯값( )을 뺀 값( )이다. - 절대편차란, 편차의 절댓값(
)이다. - 어떤 대푯값에 대하여 자료의 절대편차들의 평균을 구할 수 있다.
- 특히, 중앙값은 절대편차평균의 최솟값을 갖는다. 2
- 학교에서 중앙값은 자료의 값 중에서 매우 크거나 매우 작은 값이 있는 경우에 평균의 대안책으로 주로 쓰인다.
- 그런데 중앙값만이 갖는 최소성도 있다는 점에 주목하자.
참고
- https://en.wikipedia.org/wiki/Median#Inequality_relating_means_and_medians
- https://math.stackexchange.com/questions/85448/why-does-the-median-minimize-ex-c
- https://en.wikipedia.org/wiki/Deviation_(statistics)
- 자료의 값. 어떤 자료를 측정한 수량이다. 예를 들어, A라는 사람의 키가 180cm라면, 사람의 키라는 자료에서 A의 변량이 180이다. [본문으로]
- 수학 스택익스체인지의 "Why does the median minimize E(|X−c|)?"라는 질문에서 그 답을 찾을 수 있다. [본문으로]