4-7. Geometric Distribution

한 번의 시행에서 성공확률이 $p$ 인 경우, 첫 번째 성공이 발생할 때까지 시행하는 독립시행의 횟수를 $X$ 라 하면, 확률변수 $X$ 는 다음과 같은 기하분포를 따른다[ $X \sim G(p)$ ]. 그 이유는 $x$ 번째 시행에서 첫 번째 성공이 발생하려면 그 이전의 $(x-1)$ 번의 시행에서 연속해서 '실패'가 나와야 하고, 마지막 시행에서 '성공'이 나와야 하기 때문이다.

기하분포(Geometric Distribution)
성공확률이 일정한 시행에서 첫 번째 성공이 발생할 때까지 시행한 횟수의 확률분포는 다음과 같다.
$f(x) = P(X=x) = (1-p)^{x-1}p ,$ $x = 1, 2, 3,...$

기하 확률변수는 처음 성공이 나올 때 까지 얼마만큼 시도했는지가 중요하다.

기하확률변수의 누적분포함수
$F(x) = \sum_{y=1}^{x} (1-p)^{y-1}p = \frac{p[1-(1-p)^x]}{1-(1-p))}$ $= 1-(1-p)^x,$ $x = 1, 2, 3,...$

Expected Value and Variance of Geometric Distribution
$E(X) = \frac{1}{p},$ $Var(X) = \frac{1-p}{p^2}$

EXAMPLE 25. 성공확률이 각각 0.1, 0.3, 0.5인 무한모집단에서 첫 번째 성공을 시행하였을 때, 확률분포 그래프를 작성하고, 기대값과 분산을 구하여 비교하라.

Using Rstat Package : dgeom(), disc.mexp()

library(Rstat)

# success : p, Range of X
p <- c(0.1, 0.3, 0.5); x <- 1:200
len <- length(p)

# Compute the Probability : dgeom() uses the number of failure.
fx <- list()
for ( i in 1:len) fx[[i]] <- dgeom(x-1, p[i])

# Sum(P(X)) == 1 ?
sapply(fx, sum)

# E(X) and Var(X)
disc.mexp(x, fx, plot=F)

# Plotting
mt <- paste0("Geometric(", p, ")")
win.graph(9,3); par(mfrow=c(1,3)); par(mar=c(3,4,4,2))
for (k in 1:len) plot(1:50, fx[[k]][1:50], type="h", main=mt[k],
                      ylab="f(x)", xlab="", lwd=3, col=2)

> # E(X) and Var(X)
> disc.mexp(x, fx, plot=F)
## E(X) = 10        V(X) = 190 - 10² = 90          D(X) = √(90) = 9.487 
## E(X) = 3.333     V(X) = 18.889 - 3.333² = 7.778         D(X) = √(7.778) = 2.789 
## E(X) = 2         V(X) = 6 - 2² = 2      D(X) = √(2) = 1.414

EXAMPLE 26. 주사위 1개를 '6'이 나올 때까지 반복해서 굴리는 실험에서 시행횟수를 X라 할 때, 다음을 구하라.

X의 확률분포함수
X의 기대값과 분산
3회의 시행 이내에 '6'이 나올 확률

[ Solution ]

$p = 1/6$ . $f(x) = \frac {1}{6} (\frac{5}{6}) ^ {x-1},$ $x = 1,2,3,...$
$E(X) = 1/ p =6,$ $Var(X) = \frac{(1 - \frac{1}{6})}{(\frac{1}{6})^2} = 30$ .
$F(3) = 1 - (5/6)^3 = 91/216 \approx 0.421$

library(Rstat)

p <- 1/6; x <- 1:100
fx <- dgeom(x-1, p)

# E(X) and Var(X)
disc.exp(x, fx, prt=TRUE)

# Within 0, 1, 2 failures, P(Success)
f <- c(0, 1, 2)
dgeom(f, p)

sum(dgeom(0:2, p))

pgeom(2, p)

> # E(X) and Var(X)
> disc.exp(x, fx, prt=TRUE)
## E(X) = 6 
## V(X) = 66 - 6² = 30 
## D(X) = √(30) = 5.477

> dgeom(f, p)
## [1] 0.1666667 0.1388889 0.1157407
> 
> sum(dgeom(0:2, p))
## [1] 0.4212963
> 
> pgeom(2, p)
## [1] 0.4212963

Previous4-6. Exercises Next4-8. Negative Binomial Distribution (*)

Last updated 5 years ago

Was this helpful?