한 번의 시행에서 성공확률이 p인 경우, 첫 번째 성공이 발생할 때까지 시행하는 독립시행의 횟수를 X라 하면, 확률변수 X는 다음과 같은 기하분포를 따른다[X∼G(p)]. 그 이유는 x 번째 시행에서 첫 번째 성공이 발생하려면 그 이전의 (x−1)번의 시행에서 연속해서 '실패'가 나와야 하고, 마지막 시행에서 '성공'이 나와야 하기 때문이다.
기하분포(Geometric Distribution)
성공확률이 일정한 시행에서 첫 번째 성공이 발생할 때까지 시행한 횟수의 확률분포는 다음과 같다.
Expected Value and Variance of Geometric Distribution
E(X)=p1,Var(X)=p21−p
EXAMPLE 25. 성공확률이 각각 0.1, 0.3, 0.5인 무한모집단에서 첫 번째 성공을 시행하였을 때, 확률분포 그래프를 작성하고, 기대값과 분산을 구하여 비교하라.
Using Rstat Package : dgeom(), disc.mexp()
library(Rstat)
# success : p, Range of X
p <- c(0.1, 0.3, 0.5); x <- 1:200
len <- length(p)
# Compute the Probability : dgeom() uses the number of failure.
fx <- list()
for ( i in 1:len) fx[[i]] <- dgeom(x-1, p[i])
# Sum(P(X)) == 1 ?
sapply(fx, sum)
# E(X) and Var(X)
disc.mexp(x, fx, plot=F)
# Plotting
mt <- paste0("Geometric(", p, ")")
win.graph(9,3); par(mfrow=c(1,3)); par(mar=c(3,4,4,2))
for (k in 1:len) plot(1:50, fx[[k]][1:50], type="h", main=mt[k],
ylab="f(x)", xlab="", lwd=3, col=2)