Tại sao tỷ lệ cược từ công thức và câu cá của R khác nhau? Nên chọn cái nào?


13

Trong ví dụ sau

> m = matrix(c(3, 6, 5, 6), nrow=2)
> m
     [,1] [,2]
[1,]    3    5
[2,]    6    6
> (OR = (3/6)/(5/6))    #1
[1] 0.6
> fisher.test(m)        #2

    Fisher's Exact Test for Count Data

data:  m 
p-value = 0.6699
alternative hypothesis: true odds ratio is not equal to 1 
95 percent confidence interval:
 0.06390055 5.07793271 
sample estimates:
odds ratio 
 0.6155891 

Tôi đã tính tỷ lệ cược (# 1) "thủ công", 0,600; sau đó (# 2) là một trong những kết quả đầu ra của bài kiểm tra chính xác của Fisher, 0,616.

Tại sao tôi không nhận được cùng một giá trị?

Tại sao một số cách tính tỷ lệ cược tồn tại và làm thế nào để chọn cách phù hợp nhất?

Câu trả lời:


10

Từ trang trợ giúp cho fisher.test():

Lưu ý rằng Ước tính khả năng tối đa có điều kiện (MLE) thay vì MLE vô điều kiện (tỷ lệ chênh lệch mẫu) được sử dụng.


3

Để thêm vào cuộc thảo luận ở đây, thật hữu ích khi hỏi chính xác điều gì được quy định trong khả năng "có điều kiện" này. Thử nghiệm Fisher khác với các phân tích phân loại khác ở chỗ nó coi tất cả các lề của bảng là cố định trong khi mô hình hồi quy logistic (và thử nghiệm chi bình phương Pearson tương ứng là thử nghiệm điểm của mô hình logistic) chỉ xem xét một lề là cố định .

Thử nghiệm Fisher sau đó coi phân phối siêu bội như một mô hình xác suất cho số lượng quan sát được trong mỗi 4 ô. Phân phối siêu bội có một điểm đặc biệt là, do phân phối tỷ lệ chênh lệch gốc không liên tục, bạn thường lấy OR khác nhau như một ước tính khả năng tối đa.


2
Tôi không nghĩ câu trả lời của bạn cho thấy rõ khả năng này có thể phát sinh như thế nào. Nếu bạn mô hình hóa quy trình tạo dữ liệu bằng nhị thức sản phẩm, giả sử, bạn sẽ có một điều kiện khác (& MLE) trên các tổng số biên, từ những gì bạn nhận được nếu bạn mô hình hóa nó với phân phối siêu bội không trung tâm của Wallenius - cận biên tổng số được "coi là cố định" trong cả hai trường hợp.
Scortchi - Tái lập Monica

1

Để trả lời câu hỏi thứ hai của bạn, biostats không phải là sở trường của tôi nhưng tôi tin rằng lý do cho nhiều thống kê tỷ lệ cược là để tính toán thiết kế lấy mẫu và thiết kế thí nghiệm.

Tôi đã tìm thấy ba tài liệu tham khảo ở đây sẽ cung cấp cho bạn một chút hiểu biết về lý do tại sao có sự khác biệt giữa MLE có điều kiện so với vô điều kiện về tỷ lệ cược, cũng như các loại khác.

  1. Ước tính điểm và khoảng của tỷ lệ cược chung trong sự kết hợp của các bảng 2 × 2 với các mức cố định

  2. Ảnh hưởng của xu hướng đối với các ước tính rủi ro tương đối đối với các mẫu được ghép đôi và phân tầng

  3. Một nghiên cứu so sánh về ước tính khả năng tối đa có điều kiện của tỷ lệ cược chung


3
Sẽ rất hữu ích khi tóm tắt ít nhất một chút những gì các tài liệu tham khảo đó nói.
Scortchi - Tái lập Monica

@Scortchi, đồng ý. Tôi đã bận rộn với công việc và chỉ có cơ hội đọc qua một hoặc hai trang đầu tiên. Tôi sẽ thêm một bản tóm tắt của mỗi cuối tuần này.
Jon

@Jon Nếu bạn có thể, sẽ rất hữu ích khi thêm tóm tắt ngắn gọn đó
Glen_b -Reinstate Monica

@Jon mình chỉ hỏi một câu thôi. Đó là bli đã thêm một câu hỏi thứ hai 4 năm sau khi tôi đăng câu hỏi ban đầu của mình. Tôi không đảo ngược chỉnh sửa gây phiền nhiễu của bạn khi bạn tham khảo câu hỏi thứ hai, nhưng tôi không chắc làm thế nào để chấp nhận câu trả lời nữa.
thắng cuộc
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.