Kiểm tra thống kê để cho biết hai mẫu được kéo từ cùng một quần thể?


30

Hãy nói rằng tôi có hai mẫu. Nếu tôi muốn biết liệu chúng có được kéo từ các quần thể khác nhau hay không, tôi có thể chạy thử nghiệm t. Nhưng hãy nói rằng tôi muốn kiểm tra xem các mẫu có thuộc cùng một quần thể hay không. Làm thế nào để làm điều này? Đó là, làm thế nào để tôi tính xác suất thống kê rằng hai mẫu này được kéo từ cùng một quần thể?


1
Vui lòng giải thích - càng định lượng càng tốt - ý của bạn là "giống nhau". Nó cũng sẽ giúp làm rõ những gì bạn có nghĩa là "điều kiện".
whuber

Một thử nghiệm như Kolmogorov-Smirnov hai mẫu (không phải là khả năng duy nhất; với các giả định thông thường, thử nghiệm t đang thử nghiệm điều tương tự, như bạn lưu ý) có thể kiểm tra xem phân phối dân số có khác không (nhưng không từ chối không ' t có nghĩa là chúng thực sự giống nhau). Tuy nhiên, không có thử nghiệm nào có thể cho bạn biết liệu hai phân phối không quá khác biệt có thực sự đến từ cùng một quần thể hay không, thay vì hai quần thể khác nhau có phân phối tương tự nhau. Điều đó sẽ phải đến từ các giả định hoặc điều tra khác. ... ctd
Glen_b -Reinstate Monica

3
ctd ... Tương tự, các bài kiểm tra thậm chí không thể cho bạn biết rằng các bản phân phối là giống hệt nhau, vì chúng có thể khác nhau theo những cách tầm thường. Bạn có thể muốn tìm kiếm trên test kiểm tra tương đương 'hoặc' kiểm tra tương đương ', trên đó bạn sẽ nhận được khá nhiều lượt truy cập tại đây hoặc trên google.
Glen_b -Reinstate Monica

Câu trả lời:


20

Các thử nghiệm so sánh phân phối là thử nghiệm loại trừ. Họ bắt đầu với giả thuyết khống rằng 2 quần thể giống hệt nhau, sau đó cố gắng bác bỏ giả thuyết đó. Chúng tôi không bao giờ có thể chứng minh null là đúng, chỉ cần từ chối nó, vì vậy những thử nghiệm này thực sự không thể được sử dụng để chỉ ra rằng 2 mẫu đến từ cùng một quần thể (hoặc dân số giống hệt nhau).

Điều này là do có thể có sự khác biệt nhỏ trong các bản phân phối (có nghĩa là chúng không giống nhau), nhưng nhỏ đến mức các bài kiểm tra không thể thực sự tìm thấy sự khác biệt.

Hãy xem xét 2 phân phối, lần đầu tiên là thống nhất từ ​​0 đến 1, lần thứ hai là hỗn hợp của 2 đồng phục, vì vậy nó là 1 giữa 0 và 0,999 và cũng là 1 giữa 9,999 và 10 (0 ở nơi khác). Vì vậy, rõ ràng các phân phối này là khác nhau (cho dù sự khác biệt có ý nghĩa hay không là một câu hỏi khác), nhưng nếu bạn lấy cỡ mẫu là 50 từ mỗi (tổng số 100) thì có hơn 90% khả năng bạn sẽ chỉ thấy các giá trị trong khoảng từ 0 đến 0,999 và không thể thấy bất kỳ sự khác biệt thực sự.

Có nhiều cách để thực hiện cái được gọi là kiểm tra tương đương trong đó bạn hỏi xem 2 phân phối / quần thể có tương đương không, nhưng bạn cần xác định những gì bạn cho là tương đương. Thông thường, một số thước đo khác biệt nằm trong một phạm vi nhất định, nghĩa là chênh lệch trong 2 phương tiện nhỏ hơn 5% so với trung bình của 2 phương tiện, hoặc thống kê của KS nằm dưới ngưỡng giới hạn, v.v. Nếu bạn sau đó có thể tính toán khoảng tin cậy cho thống kê chênh lệch (chênh lệch của phương tiện có thể chỉ là khoảng tin cậy t, bootstrapping, mô phỏng hoặc các phương pháp khác có thể cần thiết cho các thống kê khác). Nếu toàn bộ khoảng tin cậy rơi vào "vùng tương đương" thì chúng tôi coi 2 quần thể / phân phối là "tương đương".

Phần khó là tìm ra vùng tương đương sẽ là gì.


2
Một thử nghiệm giả thuyết null không bao giờ có thể cung cấp bằng chứng cho giả thuyết null, đúng. Tuy nhiên, lựa chọn mô hình, Bayes hoặc dựa trên một số "tiêu chí" (AIC, BIC) có thể chỉ ra rằng một mô hình null (phân phối giống hệt nhau) là một mô tả dữ liệu tốt hơn so với một mô hình thay thế (phân phối khác nhau). Tất cả điều đó dưới một loạt các giả định tất nhiên.
A. Donda

6

http://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test

Giả sử giá trị mẫu của bạn đến từ các phân phối liên tục, tôi sẽ đề xuất thử nghiệm Kolmogorov-Smirnov. Nó có thể được sử dụng để kiểm tra xem hai mẫu có đến từ các bản phân phối khác nhau hay không (đây là cách tôi diễn giải việc sử dụng dân số của bạn) dựa trên các bản phân phối thực nghiệm có liên quan của chúng.

Trực tiếp từ Wikipedia:

Phân phối null của thống kê này được tính theo giả thuyết null rằng các mẫu được rút ra từ cùng một phân phối (trong trường hợp hai mẫu)

Hàm ks.test trong R có thể được sử dụng cho thử nghiệm này.

Mặc dù đúng là kstest không kiểm tra tính đồng nhất, tôi sẽ lập luận rằng nếu bạn không từ chối với cỡ mẫu đủ lớn (một thử nghiệm công suất cao), bạn có thể khẳng định sự khác biệt không thực sự có ý nghĩa. Bạn có thể suy luận rằng nếu sự khác biệt tồn tại, chúng có thể không có ý nghĩa (một lần nữa, giả sử kích thước mẫu lớn). Bạn không thể kết luận họ đến từ cùng một dân số như những người khác đã nêu chính xác. Tất cả điều này đang được nói, thông thường tôi sẽ chỉ kiểm tra đồ họa của hai mẫu cho sự tương đồng.


6
Tôi nghi ngờ rằng thử nghiệm KS có thể được sử dụng để hiển thị tương đương phân phối.
Michael M

@MichaelMayer điều đó hoàn toàn chính xác. OP quan tâm đến một thử nghiệm về tính đồng nhất ... có nhiều vấn đề phương pháp cơ bản. KS không đồng nhất cũng có vấn đề của nó: thực tế, nó sẽ loại bỏ trong các mẫu lớn bất kể dân số có thực sự giống nhau về mọi mặt hay không. Nó chỉ cho thấy rằng thử nghiệm, và do đó, giá trị p, được hình thành tốt hơn như là các thước đo kích thước mẫu hơn là ý nghĩa thống kê.
AdamO

@AdamO Có, nhưng nếu bạn có mẫu lớn và bạn không từ chối, tôi sẽ tự tin rằng quần thể giống hệt nhau trên thực tế. Theo như tôi biết, không có lý thuyết nào để sao lưu điều này, nhưng từ kinh nghiệm, việc biết rằng KS không đồng nhất có thể phát hiện ra sự khác biệt nhỏ với kích thước mẫu lớn có thể cho phép bạn sử dụng thử nghiệm mẫu lớn thất bại như một tuyên bố thực tế về thực tế quần thể giống hệt nhau. Câu trả lời của tôi có trả lời câu hỏi "tính xác suất thống kê rằng hai mẫu này được lấy từ cùng một quần thể" không? Chắc chắn là không rồi.
Underminer

Tôi có thể làm gì nếu điểm của tôi là hai chiều ? Đó là, tôi có hai mẫu điểm hai chiều và tôi muốn biết liệu chúng có đến từ các bản phân phối riêng biệt không.
vẫy gọi

Kiểm tra KS chỉ hoạt động đối với phân phối được xác định trước, không phải từ phân phối với các tham số ước tính từ dữ liệu.
qwr

2

Bạn có thể sử dụng 'hàm dịch chuyển' để kiểm tra xem 2 bản phân phối có khác nhau ở mỗi lần dịch hay không. Mặc dù về mặt kỹ thuật, đây là một thử nghiệm xem liệu chúng đến từ các quần thể khác nhau chứ không phải giống nhau, nếu phân phối không khác nhau trên bất kỳ decile nào thì bạn có thể chắc chắn rằng chúng thuộc cùng một quần thể, đặc biệt là nếu kích thước nhóm lớn.

Tôi cũng sẽ hình dung 2 nhóm: chồng các bản phân phối của chúng lên và xem chúng có giống nhau không, hay tốt hơn là vẽ một vài nghìn mẫu bootstrap từ mỗi nhóm và vẽ chúng , vì điều này sẽ cho bạn biết liệu chúng có đến từ cùng không dân số đặc biệt nếu dân số trong câu hỏi không được phân phối bình thường cho bạn cho biến.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.