Làm cách nào để kiểm tra hiệu ứng tương tác với thử nghiệm không tham số (ví dụ: thử nghiệm hoán vị)?


10

Tôi có hai biến phân loại / danh nghĩa. Mỗi trong số chúng chỉ có thể có hai giá trị riêng biệt (vì vậy, tôi có tổng cộng 4 kết hợp).

Mỗi kết hợp các giá trị đi kèm với một tập hợp các giá trị số. Vì vậy, tôi có 4 bộ số. Để làm cho nó cụ thể hơn, chúng ta hãy nói rằng tôi có male / femaleyoung / oldlà các biến danh nghĩa và tôi có weight"đầu ra" số phụ thuộc.

Tôi biết rằng việc chuyển đổi từ malesang femalekhông làm thay đổi trọng lượng trung bình và những thay đổi này có ý nghĩa thống kê. Vì vậy, tôi có thể tính toán một genderyếu tố. Điều tương tự được áp dụng cho các agebiến. Tôi biết rằng việc chuyển đổi từ youngsang oldkhông làm thay đổi trọng lượng trung bình và tôi có thể tính được ageyếu tố tương ứng .

Bây giờ, những gì tôi thực sự muốn xem liệu dữ liệu chứng minh rằng sự chuyển đổi từ nữ trẻ sang nam già là sự kết hợp giữa các yếu tố giới tính và tuổi tác. Nói cách khác, tôi muốn biết liệu dữ liệu chứng minh rằng có "hiệu ứng 2D" hay nói cách khác, hiệu ứng tuổi tác và giới tính không độc lập. Ví dụ, có thể là việc già đi đối với nam làm tăng trọng lượng theo hệ số 1,3 và đối với nữ, hệ số tương ứng là 1,1.

Tất nhiên tôi có thể tính hai yếu tố được đề cập (yếu tố tuổi đối với nam và yếu tố tuổi đối với nữ) và chúng khác nhau. Nhưng tôi muốn tính toán ý nghĩa thống kê của sự khác biệt này. Làm thế nào thực sự là sự khác biệt này.

Tôi muốn làm một bài kiểm tra không tham số, nếu có thể. Có thể làm những gì tôi muốn làm bằng cách trộn bốn bộ, xáo trộn chúng, chia lại và tính toán một cái gì đó.


2
Một khó khăn trong việc xử lý tương tác không theo quy tắc là một phép biến đổi đơn điệu của phản hồi có thể loại bỏ sự tương tác đã có, tạo ra sự tương tác khi nó vắng mặt hoặc lật theo hướng tương tác. Điều này cho thấy, ví dụ, các cách tiếp cận dựa trên xếp hạng có thể không làm những gì bạn mong đợi.
Glen_b -Reinstate Monica

Với các thử nghiệm hoán vị trên các biến ban đầu, bạn không gặp phải vấn đề đó nhưng hóa ra không có thử nghiệm chính xác nào cho sự tương tác. Bạn có thể nhận được một số bài kiểm tra gần đúng.
Glen_b -Reinstate Monica

Câu trả lời:


5

Có các thử nghiệm không đối xứng cho sự tương tác. Nói một cách đơn giản, bạn thay thế các trọng số quan sát được bằng các cấp bậc của chúng và coi tập dữ liệu kết quả là ANOVA không đồng nhất. Hãy xem ví dụ: "Phương pháp không tham số trong thiết kế giai thừa" của Brunner và Puri (2001).

Tuy nhiên, loại tương tác không theo tỷ lệ mà bạn quan tâm không thể được thể hiện trong tính tổng quát này. Bạn đã nói:

Nói cách khác, tôi muốn biết liệu dữ liệu chứng minh rằng có "hiệu ứng 2D" hay nói cách khác, hiệu ứng tuổi tác và giới tính không độc lập. Ví dụ, có thể là việc già đi đối với nam làm tăng trọng lượng theo hệ số 1,3 và đối với nữ, hệ số tương ứng là 1,1.

Cái sau là không thể. Tương tác không tham số phải liên quan đến thay đổi dấu hiệu, tức là già đi làm tăng cân nặng của nam giới nhưng giảm trọng lượng nữ giới. Thay đổi dấu hiệu như vậy vẫn còn ngay cả khi bạn chuyển đổi trọng lượng đơn điệu. Nhưng bạn có thể chọn một phép biến đổi đơn điệu trên dữ liệu ánh xạ mức tăng trọng lượng theo hệ số 1.1 gần như bạn muốn tới 1.3. Tất nhiên, bạn sẽ không bao giờ cho thấy một sự khác biệt là đáng kể nếu nó có thể gần như bạn muốn.

Nếu bạn thực sự quan tâm đến các tương tác mà không thay đổi dấu hiệu, bạn nên tuân theo phân tích tham số thông thường. Ở đó, những biến đổi đơn điệu "nuốt sự khác biệt" không được phép. Tất nhiên, đây lại là điều cần lưu ý bằng cách lập mô hình và diễn giải số liệu thống kê của bạn.


1

Nếu bạn tin rằng các hiệu ứng về tuổi tác và giới tính không chỉ là các hiệu ứng riêng lẻ, bạn có thể xem xét mô hìnhCác hệ số ảnh chụp kích thước của hiệu ứng "2D" trong độ tuổi và giới tính. Bạn có thể kiểm tra thống kê t của để có ý tưởng sơ bộ về việc bạn quan sát trong mô hình của mình có khác biệt đáng kể so với .gamma gamma gamma gamma = 0weighti=αagei+βgenderi+γ(genderiagei).γγγγ=0

Đây là một ví dụ đồ họa rất thô sơ để hiển thị thuật ngữ nhân số bổ sung này giới .genderiagei

Trong mô hình , về cơ bản, chúng tôi cố gắng khớp một siêu phẳng đơn giản với dữ liệuresponse=x1+x2

nhập mô tả hình ảnh ở đây

Đây là mô hình là tuyến tính trong các hiệp phương sai, do đó hình dạng tuyến tính mà bạn nhìn thấy trong cốt truyện ở trên.

Mặt khác, mô hình là phi tuyến tính trong và và do đó cho phép một số mức độ congx 1 x 2response=x1+x2+x1x2x1x2

nhập mô tả hình ảnh ở đây

Không từ chối giả thuyết rằng giống như không từ chối rằng có một số độ cong của hình thức này trong mô hình.γ=0

Về mặt kiểm tra không tham số, bạn có thể thực hiện một số thứ theo những gì bạn đã đề xuất bằng cách nhận được các lỗi tiêu chuẩn bootstrap cho . Điều này có nghĩa là, nhiều lần bạn: 1) lấy mẫu dữ liệu của mình bằng thay thế, 2) tính toán lại chế độ tuyến tính, 3) lấy ước tính . Sau khi bạn có nhiều ước tính về , bạn có thể sử dụng định lượng để thiết lập khoảng tin cậy không tham số cho . Để biết thêm về điều này, google "lỗi tiêu chuẩn bootstrap".γ γ 50 ± p % 2 p % γγγ^γ^50±p%2p%γ


Làm thế nào điều này có thể là phi tuyến tính nếu x1 và x2 chỉ có thể lấy giá trị 0 hoặc 1? Làm thế nào gamma trong ví dụ của bạn giải thích bất kỳ hình thức cong?
5ayat

Nó không có vấn đề gì các tên miền là, nó vẫn còn phi tuyến tính bởi vì chức năng không thể được viết như một sự kết hợp tuyến tính của các đối số của nó (tức là ). Đối với điểm thứ hai của bạn, hãy chú ý tôi cẩn thận nói "một ví dụ đồ họa rất thô." Đây là một tương tự liên tục của trường hợp nhị phân. αR2:x1+x2+x1x2=i=12αixi
Mustafa S Eisa

Tuy nhiên, tôi sẽ thêm rằng khi miền là nhị phân (giống như các đỉnh của khối 2D), bạn có thể xử lý tuyến tính hàm này một cách tuyến tính. Nhưng hình thức chức năng là hoàn toàn phi tuyến tính.
Mustafa S Eisa

@MustafaMEisa, tôi chưa bao giờ thấy một thuật ngữ tương tác trong mô hình tuyến tính được giải thích dưới dạng "các đỉnh của khối 2D". Nó sẽ là thông tin nếu bạn có thể xây dựng.
5ayat

@ HorstGrünbusch, tôi cũng tò mò về nhận xét của bạn về câu trả lời này, vì bạn đã đưa ra một nhận xét hữu ích về câu trả lời của tôi.
5ayat

1

Như những người khác đã lưu ý, điều này có thể được mô hình hóa tuyến tính với một tương tác. Bạn đang tương tác với hai hình nộm, và không có gì phi tuyến tính về điều này. Căn cứ vào mô hình: Các 'giới tính' hiệu ứng cận biên là một phần bắt nguồn từ:

wt=α+b1age+b2gender+b3agegender+ϵ

wtgender=b2+b3age

gender=0age=0gender=1age=1gender=0age=1gender=1age=0

wt=α+b1young.male+b2old.male+b3young.female+ϵ

old.femaleb1old.femaleyoung.maleαwtold.female

Do đó, các ví dụ trên là một cách quá phức tạp để đi đến kết luận này (rằng chúng ta thực sự chỉ so sánh bốn phương tiện nhóm), nhưng để tìm hiểu về cách thức tương tác hoạt động, tôi nghĩ rằng đây là một bài tập hữu ích. Có những bài viết rất hay khác trên CV về việc tương tác một biến liên tục với một biến danh nghĩa hoặc tương tác hai biến liên tục. Mặc dù câu hỏi của bạn đã được chỉnh sửa để chỉ định các bài kiểm tra không tham số, tôi nghĩ thật hữu ích khi nghĩ về vấn đề của bạn theo cách tiếp cận thông thường hơn (nghĩa là tham số), bởi vì hầu hết các cách tiếp cận phi tham số để kiểm tra giả thuyết đều có cùng logic nhưng nói chung với ít giả định về phân phối cụ thể.

wt

old.menyoung.women

Bỏ qua các tương tác "đáng kể"

x1x2x1x2 Nhưng một lần nữa, nếu chúng ta chỉ có hai hiệp phương chỉ có thể lấy giá trị 0 hoặc 1, điều đó có nghĩa là về cơ bản chúng ta đang nhìn vào Bốn phương tiện nhóm.

Ví dụ làm việc

Hãy so sánh kết quả từ mô hình tương tác với kết quả từ thử nghiệm của Dunn. Trước tiên, hãy tạo ra một số dữ liệu trong đó (a) đàn ông nặng hơn phụ nữ, (b) đàn ông trẻ hơn cân nặng ít hơn đàn ông lớn tuổi và (c) không có sự khác biệt giữa phụ nữ trẻ và phụ nữ lớn tuổi.

set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))

wt

mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)

 model: wt ~ age * gender

 age*gender effect
       gender
age         male   female
  old   80.61897 57.70635
  young 67.78351 56.01228

Cần tính toán một lỗi tiêu chuẩn hoặc khoảng tin cậy cho hiệu ứng cận biên của bạn? Gói 'hiệu ứng' được tham chiếu ở trên có thể làm điều này cho bạn, nhưng tốt hơn nữa, Aiken và West (1991) cung cấp cho bạn các công thức, ngay cả đối với các mô hình tương tác phức tạp hơn nhiều. Bảng của họ được in thuận tiện ở đây , cùng với lời bình luận rất tốt của Matt Golder.

Bây giờ để thực hiện thử nghiệm của Dunn.

#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")

Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0


                           Comparison of x by group                            
                             (Benjamini-Hochberg)                              
Col Mean-|
Row Mean |    old.men   young.me   young.wo
---------+---------------------------------
young.me |   3.662802
         |    0.0002*
         |
young.wo |   7.185657   3.522855
         |    0.0000*    0.0003*
         |
old.wome |   6.705346   3.042544  -0.480310
         |    0.0000*    0.0014*     0.3155

Giá trị p trên kết quả kiểm tra chi bình phương Kruskal-Wallis cho thấy rằng ít nhất một trong các nhóm của chúng tôi 'đến từ một dân số khác.' Đối với các so sánh theo nhóm, số trên cùng là thống kê kiểm tra z của Dunn và số dưới cùng là giá trị p, đã được điều chỉnh cho nhiều so sánh. Vì dữ liệu mẫu của chúng tôi khá giả tạo, không có gì ngạc nhiên khi chúng tôi có rất nhiều giá trị p nhỏ. Nhưng lưu ý so sánh dưới cùng bên phải giữa phụ nữ trẻ và lớn tuổi. Thử nghiệm hỗ trợ chính xác cho giả thuyết null rằng không có sự khác biệt giữa hai nhóm này.

CẬP NHẬT: Đưa ra các câu trả lời khác, câu trả lời này đã được cập nhật để tranh luận ý tưởng rằng điều này đòi hỏi bất kỳ hình thức mô hình phi tuyến tính nào, hoặc đó là ví dụ cụ thể của OP về hai hiệp phương nhị phân, tức là bốn nhóm - phải có một thay đổi dấu hiệu để xác nhận điều này không tham số. Ví dụ, nếu tuổi tác liên tục, sẽ có nhiều cách khác để tiếp cận vấn đề này, nhưng đó không phải là ví dụ do OP đưa ra.


Bạn không sử dụng cấu trúc của hai yếu tố chéo. Bạn chỉ đơn thuần so sánh bốn nhóm. Thử nghiệm của Dunn hoàn toàn không phải về sự tương tác.
Horst Grünbusch

Đồng ý, thử nghiệm của Dunn không phải là về sự tương tác. Tuy nhiên, câu hỏi hỏi cụ thể về sự tương tác giữa hai biến nhị phân. Câu trả lời của tôi cho thấy làm thế nào điều này tương đương với việc so sánh bốn nhóm. Nếu các điều khoản tương tác là mới đối với OP, hy vọng đây là một minh họa hữu ích.
5ayat

1

Vì vậy, bạn có các biến ngẫu nhiên sau:

  • AN
  • S{male,female}
  • W]0,[

Và bạn có các hàm khối lượng / mật độ xác suất:

  • fWW
  • fW,AW,A
  • fW,SW,S
  • fW,A,SW,A,S

was

  • fW,A(w,a)fW(w)
  • fW,S(w,s)fW(w)

fW,A,S(w,a,s)fW,A(w,a)fW,S(w,s)

was

Tuy nhiên, bạn không biết các tệp PDF chung ở trên. Vì bạn muốn giới hạn bản thân trong các phương pháp không tham số, nên nhiệm vụ của bạn bây giờ là tìm các ước tính không tham số này:

  • f^W,A(w,a)
  • f^W,S(w,s)
  • f^W,A,S(w,a,s)

Và sau đó cho thấy rằng:

  • Ước tính mật độ của bạn là đủ chính xác.
  • f^W,A,S(w,a,s)f^W,A(w,a)f^W,S(w,s)
  • f^W,A,S(w,a,s)=f^W,A(w,a)=f^W,S(w,s)

0

Đó sẽ là kiểm tra hiệu ứng tương tác . Mô hình tuyến tính sẽ có thể kiểm tra những thứ như vậy nhưng nó không phải là không tham số nên tôi đoán một công cụ khác phải được sử dụng.

Làm thế nào bạn kiểm tra agegenderhiệu quả của bạn cho đến bây giờ?

EDIT: Câu trả lời này có vẻ như nó sẽ giúp bạn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.