• 확률과 통계에서 쓰이는 수많은 용어는 일상적 의미와 결합하여 혼동하기 쉽다.
  • 여기서는 학교에서 사용되는 수많은 확률과 통계 용어를 차례대로 정리한다.

중학교

1학년 수학

  • 변량 : 자료를 수량으로 나타낸 것
    • (예) 도서관을 이용한 사람의 나이 17, 28, 44
  • 도수분포표 : 자료를 몇 개의 계급으로 나누고 각 계급에 속하는 도수를 조사하여 나타낸 표
    • 계급 : 변량을 일정한 간격으로 나눈 구간
    • 계급의 크기 : 구간의 너비
    • 도수(Frequency) : 각 계급에 속하는 변량의 개수
    • 상대도수 : 전체 도수에 대한 각 계급의 도수의 비율

2학년 수학

  • 사건(Event) : 동일한 조건에서 반복할 수 있는 실험이나 관찰에 의하여 나타나는 결과
    • (예) 주사위를 던지는 경우
  • 경우의 수 : 사건이 일어나는 모든 가짓수
  • 확률(Probability) : 동일한 조건에서 이루어지는 많은 횟수의 실험이나 관찰에서 어떤 사건이 일어나는 상대도수가 가까워지는 일정한 값
    • 어떤 실험이나 관찰에서 일어나는 모든 경우의 수가 n이고
    • 각 경우가 일어날 가능성이 모두 같을 때,
    • 사건 A가 일어나는 경우의 수가 a이면
    • 사건 A가 일어날 확률 p는 a/n이다.

3학년 수학

  • 대푯값(Central tendency) : 자료의 중심적인 경향이나 특징을 대표적으로 나타내는 값
    • 중앙값(Median) : 자료의 변량을 작은 값부터 순서대로 나열할 때, 중앙에 위치하는 값
    • 최빈값 (Mode) : 자료의 변량 중에서 가장 많이 나타나는 값
  • 산포도(Statistical dispersion) : 자료의 분포 상태를 알아보기 위하여 변량들이 대푯값을 중심으로 흩어져 있는 정도를 하나의 수로 나타낸 값
  • 산점도(Scatter plot) : 어떤 자료에서 두 변량 x와 y에 대하여 순서쌍 (x, y)를 좌표평면 위에 점으로 나타낸 그래프
  • 상관관계(Correlation) : 두 변량 사이의 관계

고등학교 수학

  • n개에서 r개를 택하는 순열(Permutation) : 서로 다른 n개에서 r(r≤n)개를 택하여 일렬로 배열하는 것
    • nPr : 순열의 수를 나타내는 기호
  • n의 계승(Factorial) : 1부터 n까지의 자연수의 곱
    • n! : n의 계승을 나타내는 기호
  • n개에서 r개를 택하는 조합(Combination) : 서로 다른 n개에서 r(r≤n)개를 택하는 것
    • nCr : 조합의 수를 나타내는 기호

고등학교 확률과 통계

경우의 수

  • 원순열 : 서로 다른 것을 원 모양으로 배열하는 순열
  • n개에서 r개를 택하는 중복순열 : 서로 다른 n개에서 중복을 허용하여 r개를 택하는 순열
    • nΠr : 중복순열의 수를 나타내는 기호
  • n개에서 r개를 택하는 중복조합 : 서로 다른 n개에서 중복을 허용하여 r개를 택하는 조합
    • nHr : 중복조합의 수를 나타내는 기호
  • 이항정리(Binomial theorem) : 다항식 (a+b)n의 전개식을 나타내는 것
  • 이항계수(Binomial coefficient) : 이항정리의 전개식에서 각 항의 계수
  • 파스칼의 삼각형(Pascal's triangle) : 이항계수를 차례로 배열한 것

확률

  • 시행(Experiment, Trial) : 같은 조건에서 여러 번 반복할 수 있고, 그 결과가 우연에 의하여 결정되는 실험이나 관찰
    • (예) 주사위나 동전을 던지는 것
  • 표본공간(Sample space) : 어떤 시행에서 일어날 수 있는 모든 결과의 집합
  • 사건(Event) : 표본공간의 부분집합
  • 근원사건(Singleton) : 표본공간의 부분집합 중에서 한 개의 원소로 이루어진 집합
  • 확률(Probability) : 어떤 시행에서 사건 A가 일어날 가능성을 수로 나타낸 것
    • P(A) : 사건 A가 일어날 확률을 나타내는 기호
  • 수학적 확률 : 아래와 같은 경우의 P(A)
    • 어떤 시행에서 표본공간 S가 n개의 근원사건들로 이루어져 있고,
    • 각 근원사건이 일어날 가능성이 같다고 할 때,
    • 사건 A가 r개의 근원사건들로 이루어져 있으면
    • 사건 A가 일어날 확률 P(A)는 r/n이다.
  • 통계적 확률 : 같은 시행을 n번 반복하여 사건 A가 일어난 횟수를 rn이라고 할 때, n이 충분히 커짐에 따라 상대도수 rn/n이 가까워지는 일정한 값
  • 배반사건 : 어느 한 사건이 일어나면 다른 사건은 일어나지 않는 두 사건
  • 여사건(Complementary event) : 어떤 사건이 일어나지 않는 사건
  • 사건 A가 일어났을 때의 사건 B의 조건부확률(Conditional probability) : 표본공간 S의 사건 A, B에 대하여 확률이 0이 아닌 사건 A가 일어났다는 조건 아래에서 사건 B가 일어날 확률
    • P(B|A) : 사건 A가 일어났을 때의 사건 B의 조건부확률
  • 사건 A와 B는 서로 독립(Independence)
    • 두 사건 A, B에서 한 사건이 일어나는 것이 다른 사건이 일어날 확률에 아무런 영향을 주지 않을 때
    • 즉 P(B|A)=P(B) 또는 P(A|B)=P(A)일 때
    • 두 사건은 서로 종속 : 두 사건이 서로 독립이 아닐 때
  • 독립시행(Bernoulli trial)
    • 동일한 시행을 반복할 때, 각 시행의 결과가 그 다음 시행의 결과에 아무런 영향을 주지 않을 경우,
    • 즉 각 시행에서 일어나는 사건이 모두 서로 독립인 경우 그러한 시행

통계

  • 확률변수(Random variable) : 어떤 시행에서 표본공간의 각 근원사건에 하나의 실수를 대응시키는 관계
    • (예) 한 개의 동전을 두 번 던지는 시행에서 앞면이 나온 횟수
  • 이산확률변수 : 확률변수 X가 취하는 값이 유한개이거나 자연수처럼 셀 수 있을 때, 확률변수 X
    • P(X=x) : 이산확률변수 X가 어떤 값 x를 취할 확률을 나타내는 기호
  • 이산확률변수 X의 확률분포(Probability distribution)
    • 이산확률변수 X가 취하는 값이 x1, x2, x3, ..., xn일 확률을
    • 각각 p1, p2, p3, ..., pn이라고 하면 P(X=xi)=pi (i=1, 2, 3, ..., n)로 나타낼 수 있고,
    • 이때 x1, x2, x3, ..., xn과 그 각각에 대응하는 확률 p1, p2, p3, ..., pn 사이의 관계
  • 확률질량함수(Probability mass function) : 이산확률변수의 X의 확률분포를 나타내는 함수 P(X=xi)=pi
  • 연속확률변수 : 확률변수 X가 최하는 값이 어떤 범위에 속하는 모든 실수의 값일 때, 확률변수 X
    • (예) 지하철을 기다리는 시간
    • P(a≤X≤b) : 연속확률변수 X에 대하여 a≤X≤b일 확률을 나타내는 기호
  • 연속확률변수 X의 확률분포확률밀도함수(Probability density function)
    • 연속확률변수 X가 취하는 값이 α≤X≤β에 속하는 모든 실수의 값이고,
    • 이 범위에서 정의된 함수 y=f(x)가 다음 성질을 가질 때,
    • 함수수 y=f(x)를 연속확률변수 X의 확률밀도함수라고 하고,
    • X는 확률밀도함수가 y=f(x)인 확률분포를 따른다고 한다.
    • 더보기
      • f(x)≥0
      • 함수 y=f(x)의 그래프와 x축 및 두 직선 x=α, x=β로 둘러싸인 부분의 넓이는 1이다.
      • P(a≤X≤b)는 함수 y=f(x)의 그래프와 x축 및 두 직선 x=a, x=b로 둘러싸인 부분의 넓이와 같다. (단, α≤a≤b≤β)
  • 모집단(Statistical population) : 통계 조사에서 조사의 대상이 되는 집단 전체
    • 전수조사 : 모집단 전체를 조사하는 것
  • 표본 : 통계 조사를 하기 위해 뽑은 모집단의 일부분
    • 표본의 크기 : 포본에 포함된 대상의 개수
    • 추출(Sampling) : 모집단에서 표본을 뽑는 것
    • 표본조사 : 조사하려는 모집단에서 표본을 추출하여 그 자료의 성질을 조사하는 것
  • 임의추출 : 표본을 추출할 때 통계 조사자의 주관을 배제하고 모집단의 각 대상이 같은 확률로 추출되도록 하는 것
    • 복원추출 : 모집단에서 표본을 추출할 때, 한 번 뽑은 대상을 되돌려 놓은 후 다시 뽑는 것
    • 비복원추출 : 모집단에서 표본을 추출할 때, 한 번 뽑은 대상을 되돌려 놓지 않고 계속 뽑는 것
  • 모평균, 모분산, 모표준편차 : 모집단에서 조사하고자 하는 특성을 나타내는 확률변수를 X라고 할 때, X의 평균, 분산, 표준편차
    • m, σ2, σ : 모평균, 모분산, 모표준편차를 나타내는 기호
  • 표본평균(Sample mean), 표본분산, 표본표준편차 : 모집단에서 임의추출한 크기가 n인 표본에 대한 평균, 분산, 표준편차
    • \(\bar{X}\), S2, S : 표본평균, 표본분산, 표본표준편차를 나타내는 기호
    • 모집단에서 크기가 같은 표본을 임의추출하였을 때, 모집단은 변하지 않기 때문에 모평균은 변하지 않지만 표본평균 \(\bar{X}\)는 추출한 표본에 따라 다른 값을 가질 수 있으므로 표본평균 \(\bar{X}\)는 확률변수이다.
  • 추정(Estimation) : 표본에서 얻은 정보를 이용하여 모평균, 모표준편차와 같은 모집단의 특성을 확률적으로 추측하는 것

참고

  • 황선욱 외 6인(2018). 중학교 수학 1. 미래엔.
  • 황선욱 외 6인(2019). 중학교 수학 2. 미래엔.
  • 황선욱 외 5인(2020). 중학교 수학 3. 미래엔.
  • 박교식 외 19인(2018). 고등학교 수학. 동아출판.
  • 박교식 외 19인(2019). 고등학교 확률과 통계. 동아출판.