Làm thế nào để thực hiện nhiều bài kiểm tra chi bình phương sau hoc trên bảng 2 X 3?


9

Tập dữ liệu của tôi bao gồm tổng tỷ lệ tử vong hoặc tỷ lệ sống của một sinh vật ở ba loại địa điểm, trong nước, giữa kênh và ngoài khơi. Các số trong bảng dưới đây đại diện cho số lượng trang web.

              100% Mortality            100% Survival
Inshore             30                       31 
Midchannel          10                       20 
Offshore             1                       10

Tôi muốn biết liệu # của các trang web xảy ra tỷ lệ tử vong 100% có ý nghĩa dựa trên loại trang web. Nếu tôi chạy một hình vuông 2 x 3, tôi nhận được một kết quả quan trọng. Có một so sánh cặp sau-hoc mà tôi có thể chạy hoặc tôi thực sự nên sử dụng ANOVA hậu cần hoặc hồi quy với phân phối nhị thức? Cảm ơn!

Câu trả lời:


7

Một bảng dự phòng nên chứa tất cả các loại loại trừ lẫn nhau trên cả hai trục. Tuy nhiên, trong nước / Midchannel / Ngoài khơi trông vẫn ổn, trừ khi "tỷ lệ tử vong dưới 100%" có nghĩa là "tỷ lệ sống 100%" trong môi trường sinh học này, bạn có thể cần phải xây dựng các bảng giải thích cho tất cả các trường hợp được quan sát hoặc giải thích tại sao bạn hạn chế phân tích của mình đến mức cực đoan kết thúc của mẫu.

Vì tỷ lệ sống 100% có nghĩa là tỷ lệ tử vong 0%, bạn có thể có một bảng với các cột 100% = tỷ lệ tử vong / 100%> tỷ lệ tử vong> 0% / tỷ lệ tử vong = 0%. Trong trường hợp này, bạn sẽ không so sánh tỷ lệ phần trăm nữa, nhưng so sánh các biện pháp tử vong thông thường trên ba loại trang web. .

Có các bài kiểm tra bài hoc được thiết lập cho bài kiểm tra Kruskal-Wallis: 1 , 2, 3 . (Cách tiếp cận lấy mẫu lại có thể giúp giải quyết các mối quan hệ.)

Hồi quy logistic và hồi quy nhị thức có thể còn tốt hơn vì chúng không chỉ cung cấp cho bạn các giá trị p, mà còn các ước tính hữu ích và khoảng tin cậy của các kích thước hiệu ứng. Tuy nhiên, để thiết lập các mô hình đó, sẽ cần thêm chi tiết về các trang web 100%> tỷ lệ tử vong> 0%.


4

Tôi sẽ giả định rằng "sống sót 100%" có nghĩa là các trang web của bạn chỉ chứa một sinh vật duy nhất. vì vậy 30 có nghĩa là 30 sinh vật đã chết và 31 có nghĩa là 31 sinh vật thì không. Dựa trên điều này, bình phương sẽ ổn, nhưng nó sẽ chỉ cho biết giả thuyết nào không được hỗ trợ bởi dữ liệu - nó sẽ không cho bạn biết liệu hai giả thuyết hợp lý có tốt hơn hay không. Tôi trình bày một phân tích xác suất trích xuất thông tin này - nó đồng ý với kiểm tra chi bình phương, nhưng nó cung cấp cho bạn nhiều thông tin hơn kiểm tra chi bình phương, và cách tốt hơn để trình bày kết quả.

Mô hình này là mô hình bernouli cho chỉ báo "cái chết", ( biểu thị ô của bảng và biểu thị đơn vị riêng lẻ trong tế bào).i 2 × 3 jYTôij~BTôin(1,θTôij)Tôi2×3j

Có hai giả định toàn cầu trong bài kiểm tra chi bình phương:

  1. trong một ô đã cho của bảng, đều bằng nhau, đó là θ i j = θ i k = θ iθTôijθTôij= =θTôik= =θTôi
  2. các là độc lập về mặt thống kê, do . Điều này có nghĩa là các tham số xác suất cho bạn biết mọi thứ về - tất cả thông tin khác đều không liên quan nếu bạn biết θ i Y i j θ iYTôijθTôiYTôijθTôi

Suy ra là tổng của , (vì vậy ) và đặt là kích thước nhóm (vì vậy ). Bây giờ chúng tôi có một giả thuyết để kiểm tra: Y i j X 1 = 30 , X 2 = 10 , X 3 = 1 N i N 1 = 61 , N 2 = 30 , N 3 = 11XTôiYTôijX1= =30,X2= =10,X3= =1NTôiN1= =61,N2= =30,N3= =11

HMột:θ1= =θ2,θ1= =θ3,θ2= =θ3

Nhưng các lựa chọn thay thế là gì? Tôi sẽ nói các kết hợp khác có thể bằng hoặc không bằng.

H B 2 : θ 1θ 2 , q 1 = θ 3 , θ 2θ 3 H B 3 : θ 1 = θ 2 , θ 1θ 3 , θ 2

HB1:θ1θ2,θ1θ3,θ2= =θ3
HB2:θ1θ2,θ1= =θ3,θ2θ3
HB3:θ1= =θ2,θ1θ3,θ2θ3
HC:θ1θ2,θ1θ3,θ2θ3

Một trong những giả thuyết này phải là sự thật, với các giả định "toàn cầu" ở trên. Nhưng lưu ý rằng không ai trong số này chỉ định các giá trị cụ thể cho tỷ lệ - vì vậy chúng phải được tích hợp. Bây giờ được cho rằng là đúng, chúng ta chỉ có một tham số (vì tất cả đều bằng nhau) và đồng phục trước là một lựa chọn bảo thủ, biểu thị điều này và các giả định toàn cầu bởi . vì vậy chúng tôi có:HMộtTôi0

P(X1,X2,X3|N1,N2,N3,HMột,Tôi0)= =01P(X1,X2,X3,θ|N1,N2,N3,HMột,Tôi0)dθ
= =(N1X1)(N2X2)(N3X3)01θX1+X2+X3(1-θ)N1+N2+N3-X1-X2-X3dθ
= =(N1X1)(N2X2)(N3X3)(N1+N2+N3+1)(N1+N2+N3X1+X2+X3)

Đó là một phân phối siêu bội chia cho một hằng số. Tương tự cho chúng ta sẽ có: HB1

P(X1,X2,X3|N1,N2,N3,HB1,Tôi0)= =01P(X1,X2,X3,θ1θ2|N1,N2,N3,HB1,Tôi0)dθ1dθ2
= =(N2X2)(N3X3)(N1+1)(N2+N3+1)(N2+N3X2+X3)

Bạn có thể thấy mô hình cho những người khác. Chúng ta có thể tính toán tỷ lệ cược cho bằng cách chia hai biểu thức trên. Câu trả lời là khoảng , có nghĩa là dữ liệu hỗ trợ so với theo hệ số - bằng chứng khá yếu ủng hộ tỷ lệ bằng nhau. Các xác suất khác được đưa ra dưới đây.HMộtvSHB14HMộtHB14

HypotheSTôiSprobmộtbTôitôiTôity(HMột|D)0,018982265(HB1|D)0,004790669(HB2|D)0,051620022(HB3|D)0.484155874(HC|D)0,440451171

Điều này đang cho thấy bằng chứng mạnh mẽ chống lại tỷ lệ bằng nhau, nhưng không ủng hộ bằng chứng mạnh mẽ của một sự thay thế defintie. Có vẻ như có bằng chứng mạnh mẽ rằng tỷ lệ "ngoài khơi" khác với hai tỷ lệ còn lại, nhưng bằng chứng không thuyết phục về việc liệu tỷ lệ "trong nước" và "giữa kênh" có khác nhau hay không. Đây là những gì mà bài kiểm tra chi bình phương sẽ không nói với bạn - nó chỉ cho bạn biết rằng giả thuyết là "tào lao" chứ không phải là cách thay thế để đặt vào vị trí của nóMột


1

Dưới đây là mã để thực hiện các bài kiểm tra chi bình phương cũng như tạo ra một loạt các số liệu thống kê kiểm tra. Tuy nhiên, các kiểm tra thống kê về sự liên kết của lề bảng là vô ích ở đây; Câu trả lời là rõ ràng. Không ai làm một bài kiểm tra thống kê để xem mùa hè có nóng hơn mùa đông không.

Chompy<-matrix(c(30,10,1,31,20,10), 3, 2)
Chompy
chisq.test(Chompy)
chisq.test(Chompy, simulate.p.value = TRUE, B = 10000)
chompy2<-data.frame(matrix(c(30,10,1,31,20,10,1,2,1,2,1,2,1,2,3,1,2,3), 6,3))
chompy2
chompy2$X2<-factor(chompy2$X2) 
chompy2$X3<-factor(chompy2$X3)
summary(fit1<-glm(X1~X2+X3, data=chompy2, family=poisson))
summary(fit2<-glm(X1~X2*X3, data=chompy2, family=poisson)) #oversaturated
summary(fit3<-glm(X1~1, data=chompy2, family=poisson)) #null
anova(fit3,fit1)
library(lmtest)
waldtest(fit1)
waldtest(fit2) #oversaturated
kruskal.test(X1~X2+X3, data=chompy2)
kruskal.test(X1~X2*X3, data=chompy2)

3
Sẽ rất thú vị cho người đọc (và OP) nếu bạn có thể cung cấp chi tiết về cú pháp R khác nhau (và các bài kiểm tra cơ bản) mà bạn đã đưa ra, và đặc biệt là cách kiểm tra Kruskal-Wallis so với mô hình log-linear.
chl

Bạn có thể thấy điều này bằng cách sao chép và dán mã vào bảng điều khiển R.
Patrick McCann

1
Chắc chắn rồi. Phản hồi đến từ chính họ bằng cách chạy mã, tất nhiên.
chl

0

Tôi tin rằng bạn có thể sử dụng "khoảng tin cậy đồng thời" để thực hiện nhiều so sánh. Tài liệu tham khảo là Agresti et al. 2008 Khoảng tin cậy đồng thời để so sánh các tham số nhị thức. Sinh trắc học 64 1270-1275.

Bạn có thể tìm thấy mã R tương ứng trong http://www.stat.ufl.edu/~aa/cda/software.html

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.