카테고리 없음

marginal probability distribution(주변확률분포)

고요한하늘... 2009. 9. 22. 10:42

일반적으로 확률(probability)이라 함은 나타날수 있는 가능성을 의미한다.

쉬운 예로 주사위를 던졌을때 각 눈이 나올 확률은 1/6이다.

 

그러면 확률 변수는 무엇인가

임의의 실험에 의해 값이 결정되는 변수를 말한다.

이때 나온 값을 셀수 있으면 이산 확률 변수라고 하고

셀수 없으면 연속 확률 변수라고 한다.

 

위에서 설명한 이산확률변수와, 연속확률변수를 하나의 함수로 표현할수 있는데

이 함수를 확률질량(mass)함수와, 확률밀도(density)함수로 부른다.

확률질량함수는 이산확률변수를 표현할때 사용하고

확률밀도함수는 연속확률변수를 표현할때 사용한다.

 

그러면 이산확률변수(discrite probability variable)가 두개일때

이를 표현하는 방법은 두개의 이산확률변수(discrite probability variable) X,Y가 있을때

이 둘의 결합확률 함수는 다음과 같다.

 

첫번째 변수 X에서 임의의 값x와 두번째 변수 Y에서 임의의값 y가 동시에 나타날 확률을 나타내는 함수를 결합확률함수라 한다.

 

두 이산확률변수의 결합확룰분포(joint probability distribution)로부터 각각의 이산확률변수에 대한 분포를 구할 수 있다.

이를 주변확률분포라고 하고 의미는

Y가 가질수 있는 모든 값들의 결합함수의 합은 확률 변수 X의 주변확률이라고 하고,

 그 확률을 나타내는 함수를 주변확률 함수라고 한다.

 

간다히 예를 보면 

 

x=  1

x=  2

 x= 3

x=  4

y= 1

 1/8

1/16 

 1/32

 1/32

y= 2

 1/16

 1/8

 1/32

 1/32

y= 3

 1/16

 1/16

 1/16

 1/16

y= 4

 1/4

 0

 0

 0

 

X의 주변확률분포 P(X) = 1/2, 1/4, 1/8, 1/8이다.

첫번째값 1/2은 x=1로 고정된 상태에서 y가 1,2,3,4일때 각 값을 모두 더한값이다

수식으로 표현하면

 

 

 

와 같다.( 이산확률분포일때 )

 

예)

X : 앞면의 수

Y : 첫번째 동전이 앞면이면 1, 뒷면이면 0  < 표1>

 실험

 HH

HT 

TH 

TT 

 X

 2

 1

0

 Y

 1

 확률

 1/4

1/4 

1/4 

1/4 

  X의 확률 분포를 보면 < 표2>

X

 확률

1/4 

2/4 

1/4 

  Y의 확률 분포를 보면 < 표3>

 Y

 확률

1/2

1/2

 1

 (X,Y)의 확률 분포

 

X = 0 

X = 1 

X = 2 

합 

Y= 0

1/4

1/4

0/4

 1/2

Y= 1

0/4

1/4 

1/4 

 1/2

 합

 1/4

2/4 

1/4 

 

X = 0, Y = 0 의 경우

< 표1>을 확인해보면 X = 0일때 즉 <표1>에서는 TT가 0일때 Y가 0인 경우가 0이기 때문에 X = 0, Y = 0 의 확률은 0이다.

다른 예를 보면

X = 1, Y = 1 의 경우

<표1>을 확인해보면 X가 1인 경우는 각각 1번씩 나타났으면 이중 Y가 1인 경우는 1회이다.

이때의 확률은 1/4이 된다.