Hypergeometric distribution, in statistics, distribution function in which selections are made from two groups without replacing members of the groups. The hypergeometric distribution differs from the binomial distribution in the lack of replacements. Thus, it often is employed in random sampling for statistical quality control. A simple everyday example would be the random selection of members for a team from a population of girls and boys.
In symbols, let the size of the population selected from be N , with r elements of the population belonging to one group (for convenience, called successes) and (N−r) belonging to the other group (called failures). Further, let the number of samples drawn from the population be n , such that 0≤n≤N . Then the probability ( P ) that the number ( X ) of elements drawn from the successful group is equal to some number ( x ) is given by
EXAMPLE 15. A batch of 100 piston rings is known to contain 10 defective rings. If two piston rings are drawn from the batch, write down the probabilities that:
the first ring is defective;
the second ring is defective given that the first one is defective.
[ Solution ]
10/ 100 = 1/10
9/99 = 1/11
EAXMPLE 16. A batch of 10 rocker cover gaskets contains 4 defective gaskets. If we draw samples of size 3 without replacement, from the batch of 10, find the probability that a sample contains 2 defective gaskets. And Find the expectation and variance of samples.
EXAMPLE 17. In the manufacture of car tyres, a particular production process is know to yield 10 tyres with defective walls in every batch of 100 tyres produced. From a production batch of 100 tyres, a sample of 4 is selected for testing to destruction. Find:
the probability that the sample contains 1 defective tyre
the expectation of the number of defectives in samples of size 4
the variance of the number of defectives in samples of size 4.
library(Rstat)
# 1. Success (r), Sample Size (n)
N <- 100; n <- 4; r <- 10; x <- 0:n
# 2. Probability Distribution
fx <- dhyper(x, r, N-r, n)
fx
# 3. E(X), Var(X) & Plot
disc.exp(x, fx, plot=TRUE)
> # 2. Probability Distribution
> fx <- dhyper(x, r, N-r, n)
> fx
## [1] 6.516305e-01 2.996003e-01 4.596140e-02 2.754241e-03 5.355469e-05
EXAMPLE 18. 어떤 바리스타가 아메리카노 향 냄새를 맡아보기만 하면 "콜롬비아 원두"로 만든 것인지 아닌지를 맞출 수 있다고 주장하였다고 합니다. 그래서 그 바리스타를 데려다가 실험을 해보았습니다. "콜롬비아 원두"로 만든 아메리카노 5잔 (m=5), 콜롬비아 원두 말고 다른 지역 원두로 만든 아메리카노 20잔 (n=20) 을 만들어 놓고 그 바리스타에게 "콜롬비아 원두"로 만든 아메리카노 5잔(k)을 골라내 보라고 시켰습니다. 이때 "콜롬비아 원두"로 만든 아메리카노를 4잔(x) 골라낼 확률은?
[ Solution ]
m : "콜롬비아 원두"로 만든 아메리카노 5잔 (원하는 결과 대상)
n : 다른 지역 원두로 만든 아메리카노 20잔 (원하지 않는 결과 대상)
k : 골라내는 커피 5잔 (시행횟수)
x : 원하는 결과의 횟수 (4잔)
=> P(X=4)=dhyper(x=4,m=5,n=20,k=5)
dhyper(x=4, m=5, n=20, k=5)
> dhyper(x=4, m=5, n=20, k=5)
[1] 0.001882176
EXAMPLE 19. TV를 생산하는 제조회사에서 생산한 TV 100 대 중에서 품질이 양호한 TV가 95대, 불량품이 5대가 재고창고에 들어있다고 합니다. 이 재고 창고에서 TV 10개를 비복원추출한다고 했을 때 불량품이 3개가 포함되어 있을 확률은?
[Solution]
m : 불량품의 대수 5대
n : 양호한 TV 대수 95대
k : 10대 비복원추출
x : 불량품이 3대
=> dhyper(3,m=5,n=95,k=10)
dhyper(3, m=5, n=95, k=10)
> dhyper(3, m=5, n=95, k=10)
[1] 0.006383528
2) P(X<=4)
phyper(x, m, n, k, lower.tail=TRUE) : lower.tail=TRUE 사용
EXAMPLE 23. 총 50개의 개체로 구성되며, 각각 10개, 20개, 40개의 성공개체가 잇는 세 종류의 유한모집단에서 10개의 표본을 취하였을 때, 성공개수의 확률분포를 구하여 비교하라.
[ Solution ]
library(Rstat)
# 1. Success (r), Sample Size (n)
N <- 50; n <- 10; r <- c(10, 25, 40); x <- 0:n
# Make empty list
fx <- list()
# Compute the Probability Distribution of each p
for (i in 1:3) fx[[i]] <- dhyper(x, r[i], N-r[i], n)
# Summation of Each fx
sapply(fx, sum)
# E(X), Var(X), and Plot using disc.mexp()
mt2 <- paste0("HG(10, 50, ", r, ")") # Title of the plot
disc.mexp(x, fx, mt=mt2) # E(X), Var(X) and Plot
EXAMPLE 24. 불량률이 5%이고 1,000개의 제품으로 구성된 Lot에서 30개의 표본을 추출하였을 때 나오는 불량품의 갯수를 X 라 할 때, 다음을 구하시오.
X의 확률분포함수
E(X) 와 Var(X)
P(X=3)
P(X≤3)
[ Solution ]
library(Rstat)
# 1. Success (r), Sample Size (n)
N <- 1000; n <- 30; r <- 50; x <- 0:n
fx <- dhyper(x, r, N-r, n); fx
# E(X), Var(X), and Plot using disc.exp()
disc.exp(x, fx, plot=TRUE)