Kiểm tra chính xác của Fisher với trọng lượng?


12

Có ai biết về một biến thể của Thử nghiệm chính xác của Fisher có tính đến trọng số không? Ví dụ trọng lượng lấy mẫu .
Vì vậy, thay vì bảng chéo 2x2 thông thường, mọi điểm dữ liệu đều có giá trị "khối lượng" hoặc "kích thước" cân điểm.

Dữ liệu ví dụ:

A B weight
N N 1
N N 3
Y N 1
Y N 2
N Y 6
N Y 7
Y Y 1
Y Y 2
Y Y 3
Y Y 4

Kiểm tra chính xác của Fisher sau đó sử dụng bảng chéo 2x2 này:

A\B  N  Y All
 N   2  2   4
 Y   2  4   6
All  4  6  10

Nếu chúng ta lấy trọng số làm số điểm dữ liệu 'thực tế', điều này sẽ dẫn đến:

A\B  N  Y All
 N   4 13  17
 Y   3 10  13
All  7 23  30

Nhưng điều đó sẽ dẫn đến sự tự tin quá cao. Một điểm dữ liệu thay đổi từ N / Y sang N / N sẽ tạo ra sự khác biệt rất lớn trong thống kê.
Thêm vào đó, nó sẽ không hoạt động nếu bất kỳ trọng lượng nào chứa phân số.

Câu trả lời:


10

Tôi có một nghi ngờ rằng các thử nghiệm 'chính xác' và trọng lượng lấy mẫu về cơ bản là các khái niệm không tương thích. Tôi đã kiểm tra ở Stata, nơi có các phương tiện tốt để khảo sát mẫu và hợp lý cho các thử nghiệm chính xác và 8 thống kê thử nghiệm có thể có của một crosstab với trọng số mẫu không bao gồm bất kỳ thử nghiệm 'chính xác nào' như của Fisher.

Mục nhập thủ công Stata có liên quan (đối với svy: tabulation twoway ) khuyên bạn nên sử dụng thử nghiệm mặc định của nó trong mọi trường hợp. Phương pháp mặc định này dựa trên thống kê chi bình phương của Pearson. Để trích:

"Để giải thích cho thiết kế khảo sát, số liệu thống kê được chuyển thành thống kê F với mức độ tự do không phân phối bằng cách sử dụng hiệu chỉnh Rao và Scott (1981, 1984) bậc hai".

Tham chiếu:

  • Rao, JNK và AJ Scott. 1981. Phân tích dữ liệu phân loại từ các khảo sát mẫu phức tạp: Các xét nghiệm Chi bình phương về mức độ phù hợp và tính độc lập trong các bảng hai chiều. Tạp chí của Hiệp hội Thống kê Hoa Kỳ 76: 221 Từ230.
  • Rao, JNK và AJ Scott. 1984. Trong các thử nghiệm chi bình phương cho các bảng dự phòng nhiều đường với tỷ lệ ô được ước tính từ dữ liệu khảo sát. Biên niên sử Thống kê 12: 46 Gian60.

3

Câu hỏi thú vị. Bạn có ý nghĩa gì về cân nặng?

Tôi sẽ có xu hướng thực hiện bootstrap ... chọn số liệu thống kê yêu thích của bạn (ví dụ: Chính xác của Fisher) và tính toán nó trên dữ liệu của bạn. Sau đó gán các ô mới cho mỗi trường hợp theo giả thuyết null của bạn và lặp lại quy trình 999 lần. Điều này sẽ cung cấp một phân phối thực nghiệm khá tốt cho thống kê kiểm tra của bạn theo giả thuyết null và cho phép tính toán dễ dàng giá trị p của bạn!


Cảm ơn! Nhưng tôi hy vọng một thống kê nhanh hơn và ổn định hơn để tính toán ...
Michel de Ruiter

2

Một điều nhanh chóng về trọng lượng mẫu - chúng thường là một cách để kết hợp một số thông tin về dân số mà chúng đang lấy mẫu - nhưng thông thường chúng dựa trên các kịch bản loại "mẫu lớn" (thường là dự đoán BLUP hoặc BLUE bị ngụy trang). Vì vậy, tôi sẽ tưởng tượng rằng trọng lượng mẫu có thể sẽ không tốt hơn không có trọng lượng. Điều gì sẽ tốt hơn tôi nghĩ là sử dụng thông tin về dân số mà thiết kế mẫu được dựa trực tiếp.

R1,Giáo dục,RkkR1;11,R1;12,R1;21,R1;22,Giáo dụcΣtôi= =1kRtôi;TôijRtôi;Tôijrtôi;TôijΣTôi,jRtôi;Tôij= =Rtôi(tôi= =1,Giáo dục,k)

P(Dm)= =1P(Dm)= =0nếu họ không có trong mẫu. Tuy nhiên, thông thường thiết kế dựa trên nhiều thông tin hơn là dữ liệu mà người ta có thể quan sát. nhưng lưu ý rằng đó là thông tin chứ không phải là thiết kế khảo sát quan trọng. Thiết kế dựa trên suy luận chỉ là một cách khá hiệu quả để kết hợp tất cả thông tin đó vào phân tích của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.