4-8. Negative Binomial Distribution (*)

1. Negative Binomial Distribution

기하분포의 개념을 보다 일반화해서 rr 번째 성공이 발생할 때까지 시행하는 독립시행의 횟수를 XX 라 하면, 확률변수 XX는 다음과 같은 음이항분포(Negative Binomial Distribution)를 따른다.

[ 이를 XNB(p,r)X \sim NB(p, r) 로 표기한다. ]

xx번째 시행에서 rr번째 성공이 발생하려면 그 이전의 (x1)(x-1) 번의 시행까지 (r1)(r-1)번의 '성공'이 나와야 하고, 마지막 시행에서 '성공'이 나와야 한다.

P(X=x) = P(x-1 번의 \space 시행 \space중에서 \spacer-1번의\space 성공)P(x번째 \space시행은\space '성공') =(x1r1)pr1(1p)xr×p,= \binom{x-1}{r-1} p^{r-1} (1-p)^{x-r} \times p, x=r,r+1,r+2,...x = r, r+1, r+2, ...

음이항분포(Negative Binomial Distribution)는 성공확률이 일정한 시행에서 주어진 횟수(rr)의 성공이 발생할 때까지 시행한 횟수의 확률분포로 다음과 같은 확률밀도함수를 갖는다.

f(x)=(x1r1)pr(1p)xr,f(x) = \binom{x-1}{r-1} p^r (1-p)^{x-r}, x=r,r+1,r+2,...x = r, r+1, r+2, ...

2. Geometric Distribution and Negative Binomial Distribution

X1,X2,...,XnX_1, X_2, ..., X_n 이 독립이고 동일한 기하분포(Geometric Distribution)를 따르는 확률변수일 때, X=Σi=1rXiX = \Sigma _{i=1}^{r}X_i 의 분포는 음이항분포(Negative Binomial Distribution)를 따른다.

3. Expected Value and Variance of Negative Binomial Distribution

E(X)=E(Σi=1rXi)=r/p,E(X) = E(\Sigma _{i=1}^{r}X_i) = r/p,

Var(X)=Var(Σi=1rXi)=r(1p)/p2.Var(X) = Var(\Sigma _{i=1}^{r}X_i) = r(1-p) / p^2.

EXAMPLE 27. 성공확률이 0.4인 무한모집단에서 각각 1회, 2회, 4회의 성공을 얻을 때까지 시행하였을 때, 시행횟수의 확률분포 그래프를 작성하고, 기대값과 분산을 구하여 비교하라.

[ Solution ]

library(Rstat)

# p, r, range of x
p <- 0.4; r <- c(1, 2, 4); xr <- 1:100
len <- length(r)

# dnbinom() : failures before the r-th success
fx <- list()
for (i in 1:len) fx[[i]] <- dnbinom(xr - r[i], r[i], p)

# Sum(fx) == 1 ?
sapply(fx, sum)

# Plot
mt <- paste0("Neg-Binomial(0.4,", r, ")")
win.graph(9,3); par(mfrow=c(1,3)); par(mar=c(3,4,4,2))
for (k in 1:len) plot(xr[1:30], fx[[k]][1:30], type="h", 
                      main=mt[k], ylab="f(x)", xlab="", lwd=3, col=2)

# E(X) and Var(X)
disc.mexp(xr, fx, plot=F)

EXAMPLE 28. 성공확률이 각각 0.1인 세 개의 프로젝트를 성공시킬 때까지 기획한 횟수 XX 에 대하여 다음을 구하시오.

  1. 확률분포함수

  2. 기대값과 분산

  3. 10번째 시도 만에 3 개의 프로젝트를 성공시킬 확률

[ Solution ]

  1. f(x)=(x131)(0.1)3(0.9)x3,f(x) = \binom{x-1}{3-1} (0.1)^3 (0.9)^{x-3}, x=3,4,5,...x = 3, 4, 5, ...

  2. E(X)=r/p=3/0.1=30,E(X) = r/p = 3/0.1 = 30, Var(X)=r(1p)/p2=3×(0.9)/(0.1)2=270Var(X) =r(1-p) / p^2 = 3 \times (0.9) / (0.1) ^ 2 = 270

  3. f(10)=(10131)(0.1)3(0.9)1030.017f(10) = \binom{10-1}{3-1} (0.1)^3 (0.9)^{10-3} \doteq 0.017

library(Rstat)

# p, r, range of x
p <- 0.1; r <- 3; xr <- 3:250

# dnbinom() : failures before the r-th success
fx <- dnbinom(xr - r, r, p)
disc.exp(xr, fx)

# f(10)? :
xr <- 10
dnbinom(xr-r, r, p)

Last updated