이항분포는 '성공'과 '실패'의 두 가지 속성만을 갖는 모집단을 대상으로 하지만, 다항분포는 세 가지 이상의 속성을 갖는 모집단에서 발생한다.
k개의 속성이 존재하고, 각 속성의 비율이 p1,p2,...,pk 인 무한 모집단에서 n 개의 표본을 추출할 경우, 각 속성의 갯수를 X1,X2,...,Xk 라 하면, 다음과 같이 다항분포를 따른다.
MN(n,p1,p2,...,pk)
다항분포(Multinomial Distribution)
P(X1=x1,X2=x2,...Xk=xk)=(x1)!(x2)!...(xk)!n!p1x1p2x2...pkxk
Where, Σi=1kpi=1, Σi=1kxi=n, 0≤xi≤n.
(x1)!(x2)!...(xk)!n!는 n 개의 표본 중 각각의 속성이 x1,x2,...,xk 개씩 나오는 경우의 수이며, p1x1p2x2...pkxk 는 특정 조합의 확률임을 알 수 있다.
다항분포의 특성 중 하나는 Xi 의 주변확률(marginal probability) 분포가 이항분포가 된다는 사실이다. 특정한 i 번째 속성만을 '성공'으로 정하면 전체 모집단은 '성공'과 '실패'의 두 가지 속성으로 나눌 수 있기 때문이다. 따라서 Xi의 주변확률분포는 다음과 같다.
P(Xi=xi)=(xin)pixi(1−p)n−xi, xi=0,1,...,n.
Expected Value and Variance of Multinomial Distribution
E(Xi)=npi, Var(Xi)=npi(1−pi).
EXAMPLE 13. 세 가지 속성을 갖는 아래의 세 모집단에서 각각 5개씩 표본을 취하였을 때, 다항 확률분포 그래프를 작성하고, 기대값 분산을 구하여 비교하시오.
(p1,p2,p3)=(0.1,0.1,0.8)
(p1,p2,p3)=(0.1,0.5,0.4)
(p1,p2,p3)=(1/3,1/3,1/3)
[ Solution ]
E(X1)=5×0.1=0.5, E(X2)=5×0.1=0.5, E(X3)=5×0.8=0.4
Var(X1)=5×0.09=0.45, Var(X2)=5×0.09=0.45,
Var(X3)=5×0.16=0.8
E(X1)=5×0.1=0.5, E(X2)=5×0.5=2.5, E(X3)=5×0.4=2
Var(X1)=5×0.09=0.45, Var(X2)=5×0.25=1.25,
Var(X3)=5×0.24=1.2
E(X1)=5/3, E(X2)=5/3, E(X3)=5/3
Var(X1)=Var(X2)=Var(X3)=5×(1/3)×(2/3)=10/9≐1.111
EXAMPLE 14. 어떤 프로세스에서 생산되는 제품의 품질이 A, B, C, D 등급으로 구분되며, 각 등급의 비율은 20%, 40%, 30%, 10%로 알려져 있다. 이 공정에서 20개의 제품을 샘플링하였을 때, 각 등급 제품의 수를 X1,X2,X3,X4라 하자.
X1=3,X2=6,X3=8 이 나올 확률을 구하라.
X1=3,X2=6 이 나올 확률을 구하라.
X1=3 이 나올 확률을 구하라.
[ Solution ]
f(x1,x2,x3,x4)=x1!x2!x3!x4!20!(0.2)x1(0.4)x2(0.3)x3(0.1)x4
E(X1)=20×0.2=4, E(X2)=8, E(X3)=6, E(X4)=2
Var(X1)=20×0.2×0.8=3.2, Var(X2)=4.8, Var(X3)=4.2, Var(X4)=1.8
X1=3,X2=6,X3=8 이면, X4=3.
f(3,6,8,3)=3!×6!×8!×3!20!(0.2)3(0.4)6(0.3)8(0.1)3≐0.005
X1=3,X2=6 이면, 나머지 속성은 11.
f(3,6,11)=3!×6!×11!20!(0.2)3(0.4)6(0.4)11≐0.019
X1=3이면, 나머지 속성은 17.
f(3,17)=3!×17!20!(0.2)3(0.8)17≐0.205