(x1)!(x2)!...(xk)!n!는 n 개의 표본 중 각각의 속성이 x1,x2,...,xk 개씩 나오는 경우의 수이며, p1x1p2x2...pkxk 는 특정 조합의 확률임을 알 수 있다.
다항분포의 특성 중 하나는 Xi 의 주변확률(marginal probability) 분포가 이항분포가 된다는 사실이다. 특정한 i 번째 속성만을 '성공'으로 정하면 전체 모집단은 '성공'과 '실패'의 두 가지 속성으로 나눌 수 있기 때문이다. 따라서 Xi의 주변확률분포는 다음과 같다.
P(Xi=xi)=(xin)pixi(1−p)n−xi,xi=0,1,...,n.
Expected Value and Variance of Multinomial Distribution
E(Xi)=npi,Var(Xi)=npi(1−pi).
EXAMPLE 13. 세 가지 속성을 갖는 아래의 세 모집단에서 각각 5개씩 표본을 취하였을 때, 다항 확률분포 그래프를 작성하고, 기대값 분산을 구하여 비교하시오.
(p1,p2,p3)=(0.1,0.1,0.8)
(p1,p2,p3)=(0.1,0.5,0.4)
(p1,p2,p3)=(1/3,1/3,1/3)
[ Solution ]
library(Rstat)
# pi, n, range of xi
p <- matrix(c(1, 1, 8, 1, 5, 4, 1, 1, 1), nrow=3, ncol=3, byrow=T)
# Packages : scatterplot3d
# install.packages("scatterplot3d")
library(scatterplot3d)
# multinorm.plot()
multinorm.plot(p, 5)
확률분포함수를 구하라.
기대값과 분산을 구하라.
[ Solution ]
library(Rstat)
# pi, n, range of xi
p <- c(2, 4, 3, 1)
n <- 20
# 3. f(3, 6, 8, 3)
x <- c(3, 6, 8, 3)
dmultinom(x, size=n, prob=p)
# 4. f(3, 6, 11)
x <- c(3, 6, 11)
dmultinom(x, size=n, prob=c(2, 4, 4))
# 5. f(3, 17)
x <- c(3, 17)
dmultinom(x, size=n, prob=c(2,8))
EXAMPLE 14. 어떤 프로세스에서 생산되는 제품의 품질이 A, B, C, D 등급으로 구분되며, 각 등급의 비율은 20%, 40%, 30%, 10%로 알려져 있다. 이 공정에서 20개의 제품을 샘플링하였을 때, 각 등급 제품의 수를 X1,X2,X3,X4라 하자.