Kiểm tra thống kê cho các bảng dự phòng nxm


12

Tôi có một bộ dữ liệu gồm các thành phần từ ba nhóm, hãy gọi chúng là G1, G2 và G3. Tôi đã phân tích một số đặc điểm của các yếu tố này và chia chúng thành 3 loại "hành vi" T1, T2 và T3 (Tôi đã sử dụng phân tích cụm để làm điều đó).

Vì vậy, bây giờ tôi có một bảng dự phòng 3 x 3 như thế này với số lượng phần tử trong ba nhóm được chia theo loại:

      |    T1   |    T2   |    T3   |
------+---------+---------+---------+---
  G1  |   18    |   15    |   65    | 
------+---------+---------+---------+---
  G2  |   20    |   10    |   70    |
------+---------+---------+---------+---
  G3  |   15    |   55    |   30    |

Bây giờ, tôi có thể chạy thử nghiệm Fisher trên các dữ liệu này trong R

data <- matrix(c(18, 20, 15, 15, 10, 55, 65, 70, 30), nrow=3)
fisher.test(data)

va tôi lây

   Fisher's Exact Test for Count Data

data:  data 
p-value = 9.028e-13
alternative hypothesis: two.sided     

Vì vậy, câu hỏi của tôi là:

  • Có đúng không khi sử dụng thử nghiệm Fisher theo cách này?

  • Làm thế nào để tôi biết ai khác với ai? Có một bài kiểm tra sau hoc tôi có thể sử dụng? Nhìn vào dữ liệu tôi sẽ nói lần thứ 3 nhóm có hành vi khác với hai nhóm đầu tiên, làm thế nào để tôi thể hiện điều đó theo thống kê?

  • ai đó đã chỉ cho tôi các mô hình logit: chúng có phải là một lựa chọn khả thi cho loại phân tích này không?

  • có lựa chọn nào khác để phân tích loại dữ liệu này không?

Cảm ơn bạn rất nhiều

nico

Câu trả lời:


13

Lúc đầu tôi nghĩ rằng bài kiểm tra Fisher được sử dụng đúng.

Dữ liệu đếm được xử lý tốt hơn bằng cách sử dụng các mô hình log-linear (không phải logit, để đảm bảo rằng các giá trị được trang bị giới hạn bên dưới). Trong R, bạn có thể chỉ định family=poisson(trong đó đặt lỗi = Poisson và link = log). Liên kết nhật ký đảm bảo rằng tất cả các giá trị được trang bị là dương, trong khi các lỗi Poisson tính đến thực tế là dữ liệu là số nguyên và có phương sai bằng với phương tiện của chúng. ví dụglm(y~x,poisson) và mô hình được trang bị một liên kết nhật ký và lỗi Poisson (để giải thích cho tính phi quy tắc).

Trong trường hợp có sự quá mức (độ lệch dư phải bằng với mức độ tự do còn lại, nếu giả định lỗi Poisson là phù hợp), thay vì sử dụng quasipoissonnhư họ lỗi, bạn có thể phù hợp với mô hình nhị thức âm. (Điều này liên quan đến chức năng glm.nbtừ gói MASS)

Trong trường hợp của bạn, bạn có thể điều chỉnh và so sánh các mô hình bằng các lệnh như sau:

observed <- as.vector(data)
Ts<-factor(rep(c("T1","T2","T3"),each=3))
Gs<-factor(rep(c("G1","G2","G3"),3))

model1<-glm(observed~Ts*Gs,poisson)

#or and a model without the interaction terms
model2<-glm(observed~Ts+Gs,poisson)


#you can compare the two models using anova with a chi-squared test
anova(model1,model2,test="Chi")
summary(model1)

Luôn đảm bảo rằng mô hình tối thiểu của bạn chứa tất cả các biến phiền toái.

Về việc làm thế nào để chúng ta biết ai khác với ai, có một số âm mưu có thể giúp bạn. Hàm R assocplottạo ra một biểu đồ kết hợp biểu thị độ lệch khỏi tính độc lập của các hàng và cột trong bảng dự phòng hai chiều.

Dưới đây là cùng một dữ liệu được vẽ như một âm mưu khảm

mosaicplot(data, shade = TRUE)

Cảm ơn bạn, đó chính xác là những gì tôi cần. Tôi không hoàn toàn chắc chắn về ý của bạn khi bạn nói về sự quá mức (xin lỗi, tôi không phải là một nhà thống kê, có lẽ đó là điều gì đó rất cơ bản) ... Bạn nói rằng độ lệch còn lại phải bằng với mức độ tự do còn lại ... tôi sẽ kiểm tra nó như thế nào?
nico

Nếu bạn cho summary(model1)bạn sẽ thấy một cái gì đó nhưResidual deviance: -2.7768e-28 on 0 degrees of freedom
George Dontas

4

Bạn có thể sử dụng multinom từ gói nnet để hồi quy đa cực. Các bài kiểm tra sau hoc bạn có thể sử dụng linearHypothesis từ gói xe hơi. Bạn có thể tiến hành kiểm tra tính độc lập bằng cách sử dụng linearHypothesis (kiểm tra Wald) hoặc anova (kiểm tra LR).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.