Phân tích Bayes của bảng dự phòng: Cách mô tả kích thước hiệu ứng


9

Tôi đang làm việc thông qua các ví dụ trong Phân tích dữ liệu Bay Bay của Kruschke , cụ thể là ANOVA theo cấp số nhân của Poisson trong ch. 22, mà ông trình bày như là một thay thế cho các bài kiểm tra chi bình phương thường xuyên về tính độc lập cho các bảng dự phòng.

Tôi có thể thấy cách chúng tôi nhận thông tin về các tương tác xảy ra thường xuyên hơn hoặc ít hơn mong đợi nếu các biến độc lập (nghĩa là khi HDI loại trừ 0).

Câu hỏi của tôi là làm thế nào tôi có thể tính toán hoặc giải thích một kích thước hiệu ứng trong khung này? Ví dụ, Kruschke viết "sự kết hợp giữa mắt xanh với tóc đen xảy ra ít thường xuyên hơn mong đợi nếu màu mắt và màu tóc là độc lập", nhưng làm thế nào chúng ta có thể mô tả sức mạnh của sự liên kết đó? Làm thế nào tôi có thể biết những tương tác nào cực đoan hơn những tương tác khác? Nếu chúng tôi thực hiện kiểm tra chi bình phương các dữ liệu này, chúng tôi có thể tính toán Cramér's V như một thước đo kích thước hiệu ứng tổng thể. Làm thế nào để tôi thể hiện kích thước hiệu ứng trong bối cảnh Bayes này?

Đây là ví dụ độc lập từ cuốn sách (được mã hóa R), chỉ trong trường hợp câu trả lời bị ẩn khỏi tôi trong tầm nhìn rõ ràng ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

Đây là đầu ra thường xuyên, với các số đo kích thước hiệu ứng (không có trong sách):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

Đây là đầu ra Bayes, với HDI và xác suất di động (trực tiếp từ cuốn sách):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

Và đây là các sơ đồ của mô hình hàm mũ Poisson được áp dụng cho dữ liệu:

nhập mô tả hình ảnh ở đây

Và các sơ đồ phân bố sau về xác suất tế bào ước tính:

nhập mô tả hình ảnh ở đây

Câu trả lời:


1

Theo chỉ số, Kruschke chỉ đề cập đến kích thước hiệu ứng hai lần và cả hai lần đều nằm trong bối cảnh của một biến số dự đoán. Nhưng có một chút trên p. 601:

Nếu nhà nghiên cứu quan tâm đến việc vi phạm tính độc lập, thì sự quan tâm sẽ nằm ở tầm quan trọng của . Mô hình này đặc biệt thuận tiện cho mục đích này, bởi vì sự tương phản tùy ý có thể được nghiên cứu để xác định nơi phát sinh sự không phụ thuộc.βrc

Vì vậy, tôi tập hợp rằng là tham số cần diễn giải. Đặt bằng tổng sản phẩm của tất cả các hệ số và các phần tử x tương ứng của chúng, ngoại trừ và . Vì và . Khi = 1, thì tăng hoặc thu hẹp theo hệ số , không? S β 1 , 2 x 1 , 2 y i P o i s ( λ i ) λ i = e β 1 , 2 x 1 , 2 + S = e β 1 , 2 x 1 , 2 e S x 1 , 2 λ i e β 1 , 2β1,2Sβ1,2x1,2yTôi~PoTôiS(λTôi)λTôi= =eβ1,2x1,2+S= =eβ1,2x1,2eSx1,2λTôieβ1,2


1

Một cách để nghiên cứu kích thước hiệu ứng trong mô hình ANOVA là bằng cách xem xét độ lệch chuẩn "siêu dân số" và "dân số hữu hạn". Bạn có một bảng hai chiều, vì vậy đây là 3 thành phần phương sai (2 hiệu ứng chính và 1 tương tác). Điều này dựa trên phân tích mcmc. Bạn tính độ lệch chuẩn cho từng hiệu ứng cho từng mẫu mcmc.

Sk= =1dk-1Σj= =1dk(βk,j-β¯k)2

kSkk

Andrew Gelman ủng hộ cách tiếp cận này. Xem bài viết năm 2005 của ông "phân tích phương sai: tại sao nó quan trọng hơn bao giờ hết"


Giấy đó có sẵn ở đây .
Sean Easter

Cả hai câu trả lời này có vẻ rất hứa hẹn, cảm ơn. Một trong hai bạn có đủ quen thuộc Rđể chỉ ra cách nó có thể được lập trình không?
Ben

@seaneaster - cảm ơn vì đã thêm liên kết. @ben, các tính toán này rất đơn giản trong R. Tuy nhiên tôi không chắc mẫu của bạn ở dạng nào. Bạn sẽ có thể sử dụng sd ()kết hợp với một trong các chức năng "áp dụng". Đối với boxplots, đây là những đơn giản để có được những cái cơ bản với boxplot ().
xác suất

Cảm ơn, bạn có thể chứng minh bằng cách sử dụng dữ liệu mẫu và mã trong câu hỏi của tôi không?
Ben

Nói tóm lại, không vì tôi không hiểu mã bạn đã đăng - Tôi không thể thấy cách dữ liệu được sắp xếp. Và như tôi đã nói, đây không phải là một phân tích khó khăn để tự làm. Cách tiếp cận này đang tính toán một biện pháp đơn giản (độ lệch chuẩn). Ngoài ra, mã hóa R không phải là một phần của câu hỏi của bạn - bạn đã hỏi về cách tóm tắt phân tích bảng dự phòng.
xác suất
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.