Nếu tôi hiểu chính xác câu hỏi của bạn, bạn cần sử dụng phân phối Hypergeometric . Phân phối này thường được liên kết với các mô hình urn, tức là có quả bóng trong một chiếc bình, được sơn màu đỏ và bạn vẽ quả bóng từ chiếc bình. Sau đó, nếu là số lượng bóng trong mẫu của bạn có màu đỏ, có phân phối siêu hình học.nymXmX
Ví dụ cụ thể của bạn, hãy , và biểu thị độ dài của ba danh sách của bạn và để cho biểu thị sự chồng chéo giữa và . Sau đónAnBnCnABAB
nAB∼HG(nA,nC,nB)
Để tính giá trị p, bạn có thể sử dụng lệnh R này:
#Some example values
n_A = 100;n_B = 200; n_C = 500; n_A_B = 50
1-phyper(n_A_B, n_B, n_C-n_B, n_A)
[1] 0.008626697
Lời cảnh báo. Hãy nhớ nhiều thử nghiệm, nghĩa là nếu bạn có nhiều danh sách A và B , thì bạn sẽ cần điều chỉnh giá trị p của mình bằng một hiệu chỉnh. Ví dụ, các hiệu chỉnh FDR hoặc Bonferroni.