Thử nghiệm tính độc lập so với thử nghiệm tính đồng nhất


10

Tôi đang giảng dạy một khóa học thống kê cơ bản và hôm nay tôi sẽ đề cập đến bài kiểm tra độc lập chi bình phương cho hai loại và bài kiểm tra về tính đồng nhất. Hai kịch bản này khác nhau về mặt khái niệm, nhưng có thể sử dụng cùng một thống kê kiểm tra và phân phối. Trong một thử nghiệm về tính đồng nhất, tổng số biên cho một trong các loại được coi là một phần của chính thiết kế - chúng đại diện cho số lượng đối tượng được chọn cho mỗi nhóm thử nghiệm. Nhưng vì thử nghiệm chi bình phương xoay quanh điều hòa trên tất cả các tổng biên, nên không có hậu quả toán học nào để phân biệt giữa các thử nghiệm về tính đồng nhất và thử nghiệm tính độc lập với dữ liệu phân loại - ít nhất là không có khi thử nghiệm này được sử dụng.

Câu hỏi của tôi là như sau: có trường phái tư duy thống kê hoặc phương pháp thống kê nào mang lại các phân tích khác nhau hay không, tùy thuộc vào việc chúng tôi đang kiểm tra tính độc lập (trong đó tất cả các biên là biến ngẫu nhiên) hay thử nghiệm tính đồng nhất (trong đó một tập hợp các lề thiết kế theo thiết kế)?

Trong trường hợp liên tục, giả sử chúng ta quan sát trên cùng một đối tượng và kiểm tra tính độc lập hoặc quan sát trong các quần thể khác nhau và kiểm tra nếu chúng đến từ cùng một phân phối, phương pháp sẽ khác nhau (tương quan phân tích so với kiểm tra t). Điều gì xảy ra nếu dữ liệu phân loại đến từ các biến liên tục rời rạc? Các xét nghiệm độc lập và đồng nhất có nên không thể phân biệt?( X 1 , X 2 )(X,Y)(X1,X2)


2
Bạn có thể cung cấp một nguồn phân biệt "thử nghiệm tính đồng nhất" và "thử nghiệm tính độc lập" không? Tôi đã từng nghĩ rằng nó giống nhau (và Wikipedia cũng vậy). Nó cũng được gọi là thử nghiệm liên kết chi bình phương cho bảng tiếp giáp 2 chiều hoặc thử nghiệm so sánh chi-vuông mẫu độc lập K. Nên không nhầm lẫn với một mẫu chi-square test còn được gọi là chi-square test của thỏa thuận . Trong đó, chúng tôi kiểm tra tần số quan sát được so với tần số dự kiến ​​lý thuyết mà chúng tôi cung cấp.
ttnphns

2
@ttnphns Có vẻ là đặc hữu. Tôi đang sử dụng "Mong đợi điều bất ngờ" của Raluca Balan và Gilles Lamothe. Năm ngoái tôi đã dạy từ Thống kê kinh doanh của Sharpe, De Veaux, et al. Cả hai văn bản làm cho một bữa ăn của sự khác biệt. Trong cả hai trường hợp, chúng tôi có một bảng dự phòng 2 chiều. Không cần phải nói, cả sách giáo khoa đều không nghĩ rằng nó đáng để dạy một kích thước hiệu ứng cho bảng dự phòng: một trường hợp khác trong đó chiến thắng tinh tế về tính hữu dụng trong các khóa học thống kê cơ bản.
Placidia

2
Sự khác biệt sẽ hiển thị nếu bạn cố gắng có được khoảng tin cậy cho kích thước hiệu ứng.
Ray Koopman

2
Nghe có vẻ hấp dẫn. Bạn có nhớ thêm một số chi tiết cụ thể và làm cho nó một câu trả lời?
Placidia

4
Nó phụ thuộc nếu bạn muốn tra tấn các sinh viên bằng cách phân biệt các lề có điều kiện / vô điều kiện. Nếu không, bạn chỉ có thể tập trung giải thích rằng "tính độc lập của hai biến phân loại" tương đương với "tính đồng nhất của các phân phối có điều kiện" và sau đó trình bày một -test. (Tôi thường trình bày nó cùng với giới hạn độ tin cậy thấp hơn cho Cramer thực sự đo lường sức mạnh của sự liên kết.) Vχ2V
Michael M

Câu trả lời:


4

Bạn chỉ cần tự hỏi mình, "Làm thế nào để tôi viết giả thuyết khống?". Hãy xem xét một bảng dự phòng tần số của một số hành vi (y / n) trong số một số nhóm . Đối xử với nhóm thứ nhất là người giới thiệu, bạn có tỷ lệ cược ( ) mô tả mối liên hệ giữa tần suất và nhóm.k k - 1 θ i , i = 1 , 2 , ... , k - 12×kkk1θi,i=1,2,,k1

Trong tính độc lập như với tính đồng nhất, bạn cho rằng tất cả các tỷ lệ cược là 1. Nghĩa là, khả năng đáp ứng "có" với điều kiện có khả năng như nhau bất kể phân công nhóm. Nếu những giả định đó thất bại, ít nhất một nhóm là khác nhau.

H0(homogeneity):i=1k1|θi|=0

H0(independence):i=1k1|θi|=0

Và thử nghiệm này có thể được thực hiện với thử nghiệm Pear-Chi-vuông bằng cách sử dụng tần số quan sát / dự kiến, đây là thử nghiệm điểm cho mô hình hồi quy logistic điều chỉnh các biến chỉ báo cho thành viên nhóm. Vì vậy, về mặt cấu trúc, chúng tôi có thể nói rằng các xét nghiệm này là như nhau.k1

Tuy nhiên, sự khác biệt phát sinh khi chúng ta xem xét bản chất của yếu tố nhóm. Theo nghĩa này, ứng dụng theo ngữ cảnh của bài kiểm tra, hay đúng hơn là tên của nó, rất quan trọng. Một nhóm có thể là nguyên nhân trực tiếp dẫn đến kết quả, như sự hiện diện hay vắng mặt của một kiểu gen hoặc alen của một tính trạng trong trường hợp đó, khi chúng tôi từ chối null, chúng tôi kết luận rằng kết quả phụ thuộc vào yếu tố nhóm trong câu hỏi.

Mặt khác, khi chúng tôi kiểm tra tính đồng nhất, chúng tôi tự tha thứ cho việc đưa ra bất kỳ giả định nguyên nhân nào. Do đó, khi "nhóm" là một cấu trúc tinh vi như chủng tộc (nguyên nhân và nguyên nhân do các yếu tố quyết định di truyền, hành vi và kinh tế xã hội), chúng ta có thể đưa ra kết luận như "dân tộc thiểu số trải qua sự chênh lệch nhà ở được chứng minh bằng sự không đồng nhất trong chỉ số thiếu hụt khu dân cư" . Nếu ai đó phản bác lập luận như vậy bằng cách nói, "đó là vì người thiểu số đạt được trình độ học vấn thấp hơn, thu nhập thấp hơn và kiếm được ít việc làm hơn", bạn có thể nói rằng "chủng tộc của họ đã gây ra những điều này, chỉ đơn giản là nếu bạn nhìn tại cuộc đua của một người, bạn có thể dự đoán về điều kiện sống của họ. "

Theo cách đó, các thử nghiệm về sự phụ thuộc là một trường hợp đặc biệt của các thử nghiệm về tính đồng nhất trong đó ảnh hưởng có thể có của các yếu tố ẩn là mối quan tâm và cần được xử lý trong phân tích phân tầng. Sử dụng điều chỉnh đa biến trong mô hình hồi quy logistic tương tự đạt được điều đó, và chúng tôi vẫn có thể nói rằng chúng tôi đang tiến hành một thử nghiệm về sự phụ thuộc, nhưng không nhất thiết phải đồng nhất.


3

Có một sự khác biệt rõ ràng giữa hai vấn đề nếu bạn mô hình hóa chúng theo cách Bayes. Trong một số giấy tờ, trường hợp đầu tiên (tính đồng nhất) được gọi là lấy mẫu với "một lề cố định" và trường hợp thứ hai (tính độc lập) là "tổng bảng cố định". Có một cái nhìn, ví dụ, tại Casella et al. (JASA 2009) .
Tôi đang làm việc về chủ đề này nhưng bài báo của tôi - cũng mô tả sự khác biệt này - vẫn chưa ra :)


2
Cũng có một sự khác biệt rõ ràng từ quan điểm thường xuyên - chỉ là nó không có vấn đề gì, và các đối số thường được đưa ra để điều chỉnh trên một hoặc cả hai lề trong mọi trường hợp.
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.