Ch1. 표본공간과 확률변수
통계 이론을 공부할 때 가장 먼저 알아야 될 용어는 확률실험입니다.
확률실험은 쉽게는 주사위 던지기부터 시작하여, 오늘 지각을 할지 안할지 실험하는 것 까지 모든 일상생활을 확률실험이라고 할 수 있습니다. 여기서 확률 실험의 모든 가능한 결과들의 집합을 표본공간(Sample Sapce)이라고 합니다.
만약, 동전을 던져 앞, 뒷면이 나오는지 확인하는 확률실험을 진행하였을 경우, 표본공간은 {앞, 뒤}가 됩니다.
다음으로는 통계학에서 가장 중요하다고 할 수 있는 확률변수(Random Variable)가 등장합니다.
확률변수(Random Variable)는 발생 가능한 모든 경우에 대해서 각각의 실숫값을 대입해주는 하나의 함수입니다. 표본공간의 각 원소 하나하나에 원하는 목적에 따라 그에 걸맞은 실수를 대입해 주는 것이죠.
직관적으로 받아들이기 쉽지 않은 개념이니 몇 가지 예를 통해 확인해보도록 합시다.
성별
어떤 팀에서 한 명을 리더로 선출하려고 하는데 성별에 관심이 있습니다. 이 경우 표본공간은 (남자,여자) 두 가지로 이루어진 집합이 될 것입니다. 이때 확률변수 X를 '여자는 0 남자는 1' 이라고 정의해 봅시다. 반대로 해도 상관 없습니다. 그렇다면 리더가 선출되었을 때 0또는 1이라는 확률변수 값을 얻을 수 있을 것입니다.
이는 (남자, 여자)라는 표본공간에서 각 원소들을 0과 1이라는 실수로 전화해주는 변환 함수 입니다.
주사위
눈이 3까지 있는 주사위 두 개를 굴리는 상황입니다. 확률변수 Y를 '두 주사위 눈의 합'이라고 정의해 봅시다. 변수 Y라고 하면 나올 수 있는 경우는 다음과 같습니다.
경우 | Y |
---|---|
(1,1) | 2 |
(1,2) (2,1) | 3 |
(1,3) (3,1) (2,2) | 4 |
(2,3) (3,2) | 5 |
(3,3) | 6 |
가능한 경우는 총 9가지입니다. 이는 표본공간이 9개의 원소를 가지고 있는 집합이라는 뜻이고 '두 눈의 합' 이라는 함수인 확률변수는 총 5개의 값을 갖게 됩니다. 위 표에서 보면 표본공간은 왼쪽 부분이 되겠고 확률변수가 가질 수 있는 실수는 오른쪽이겠지요. 이렇게 표본공간에서 실수로 변환해주는 변환 함수가 확률변수입니다. 또한 확률변수의 특징은 각 경우가 나올 확률이 알려져 있다는 것입니다.
경우 | Y | P(Y) |
---|---|---|
(1,1) | 2 | 1/9 |
(1,2) (2,1) | 3 | 2/9 |
(1,3) (3,1) (2,2) | 4 | 3/9 |
(2,3) (3,2) | 5 | 2/9 |
(3,3) | 6 | 1/9 |
확률변수는 2가지로 나뉩니다.
- 이산형 확률변수(Discrete Random Variable) : 어떤 값을 가질 확률을 계산하는 확률변수
- 연속형 확률변수(Conituous Random Variable) : 어떤 구간 내에 포함될 확률을 계산하는 확률변수
주의해야 할 점은 확률변수는 그 자체로도 함수라는 사실입니다. 흔히 많은 분들이 확률변수와 확률함수를 헷갈리시는데, 확률변수는 표본공간에서 실수로 가는 함수이고 확률함수는 확률변수가 어떤 값을 가질 때(혹은 어떤 범위 내에 포함될 때)의 확률을 계산하는 함수입니다. 위 표에서는 세 번째 열이 확률함수 값이라고 할 수 있습니다.