Tại sao bài kiểm tra của Mantel được ưa thích hơn I của Moran?


37

Thử nghiệm của Mantel được sử dụng rộng rãi trong các nghiên cứu sinh học để kiểm tra mối tương quan giữa sự phân bố không gian của động vật (vị trí trong không gian), ví dụ, liên quan đến di truyền, tốc độ xâm lược của chúng hoặc một số thuộc tính khác. Rất nhiều tạp chí hay đang sử dụng nó ( PNAS, Hành vi động vật, Sinh thái học phân tử ... ).

Tôi đã chế tạo một số mẫu có thể xảy ra trong tự nhiên, nhưng thử nghiệm của Mantel dường như khá vô dụng để phát hiện ra chúng. Mặt khác, Moran's I có kết quả tốt hơn (xem giá trị p dưới mỗi ô) .

Tại sao các nhà khoa học không sử dụng I của Moran? Có một số lý do ẩn tôi không nhìn thấy? Và nếu có một số lý do, làm thế nào tôi có thể biết (làm thế nào các giả thuyết phải được xây dựng khác nhau) để sử dụng một cách thích hợp bài kiểm tra của Mantel hoặc Moran? Một ví dụ thực tế sẽ hữu ích.

Hãy tưởng tượng tình huống này: Có một vườn cây (17 x 17 cây) với một con quạ đang ngồi trên mỗi cây. Mức độ "tiếng ồn" cho mỗi con quạ có sẵn và bạn muốn biết liệu sự phân bố không gian của quạ được xác định bởi tiếng ồn mà chúng tạo ra.

Có (ít nhất) 5 khả năng:

  1. "Chim lông đổ xô lại với nhau." Những con quạ càng giống nhau, khoảng cách địa lý giữa chúng càng nhỏ (cụm đơn) .

  2. "Chim lông đổ xô lại với nhau." Một lần nữa, những con quạ càng giống nhau thì khoảng cách địa lý giữa chúng càng nhỏ, (nhiều cụm) nhưng một cụm quạ ồn ào không có kiến ​​thức về sự tồn tại của cụm thứ hai (nếu không chúng sẽ hợp nhất thành một cụm lớn).

  3. "Xu hướng đơn điệu."

  4. "Sự thu hút đối diện." Những con quạ tương tự không thể đứng lẫn nhau.

  5. "Mẫu ngẫu nhiên." Mức độ tiếng ồn không có ảnh hưởng đáng kể đến phân bố không gian.

Đối với mỗi trường hợp, tôi đã tạo ra một biểu đồ các điểm và sử dụng phép thử Mantel để tính toán một mối tương quan (không có gì ngạc nhiên khi kết quả của nó là không đáng kể, tôi sẽ không bao giờ cố gắng tìm mối liên hệ tuyến tính giữa các mẫu điểm như vậy).

nhập mô tả hình ảnh ở đây


Dữ liệu ví dụ: (nén càng tốt)

r.gen   <- seq(-100,100,5)
r.val   <- sample(r.gen, 289, replace=TRUE)
z10     <- rep(0, times=10)
z11     <- rep(0, times=11)
r5      <- c(5,15,25,15,5)
r71     <- c(5,20,40,50,40,20,5)
r72     <- c(15,40,60,75,60,40,15)
r73     <- c(25,50,75,100,75,50,25)
rbPal   <- colorRampPalette(c("blue","red"))
my.data <- data.frame(x = rep(1:17, times=17),y = rep(1:17, each=17),
             c1=c(rep(0,times=155),r5,z11,r71,z10,r72,z10,r73,z10,r72,z10,r71,
             z11,r5,rep(0, times=27)),c2 = c(rep(0,times=19),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=29),r5,z11,r71,z10,r72,
             z10,r73,z10,r72,z10,r71,z11,r5,rep(0, times=27)),c3 = c(seq(20,100,5),
             seq(15,95,5),seq(10,90,5),seq(5,85,5),seq(0,80,5),seq(-5,75,5),
             seq(-10,70,5),seq(-15,65,5),seq(-20,60,5),seq(-25,55,5),seq(-30,50,5),
             seq(-35,45,5),seq(-40,40,5),seq(-45,35,5),seq(-50,30,5),seq(-55,25,5),
             seq(-60,20,5)),c4 = rep(c(0,100), length=289),c5 = sample(r.gen, 289, 
             replace=TRUE))

# adding colors
my.data$Col1 <- rbPal(10)[as.numeric(cut(my.data$c1,breaks = 10))]
my.data$Col2 <- rbPal(10)[as.numeric(cut(my.data$c2,breaks = 10))]
my.data$Col3 <- rbPal(10)[as.numeric(cut(my.data$c3,breaks = 10))]
my.data$Col4 <- rbPal(10)[as.numeric(cut(my.data$c4,breaks = 10))]
my.data$Col5 <- rbPal(10)[as.numeric(cut(my.data$c5,breaks = 10))]

Tạo ma trận khoảng cách địa lý (đối với I của Moran là đảo ngược):

point.dists           <- dist(cbind(my.data$x, my.data$y))
point.dists.inv       <- 1/point.dists
point.dists.inv       <- as.matrix(point.dists.inv)
diag(point.dists.inv) <- 0

Tạo cốt truyện:

X11(width=12, height=6)
par(mfrow=c(2,5))
par(mar=c(1,1,1,1))

library(ape)
for (i in 3:7) {
  my.res <- mantel.test(as.matrix(dist(my.data[ ,i])), as.matrix(point.dists))
  plot(my.data$x,my.data$y,pch=20,col=my.data[ ,c(i+5)], cex=2.5, xlab="", 
       ylab="", xaxt="n", yaxt="n", ylim=c(-4.5,17))
  text(4.5, -2.25, paste("Mantel's test", "\n z.stat =", round(my.res$z.stat, 
   2), "\n p.value =", round(my.res$p, 3)))

  my.res <- Moran.I(my.data[ ,i], point.dists.inv)
  text(12.5, -2.25, paste("Moran's I", "\n observed =", round(my.res$observed, 
   3), "\n expected =",round(my.res$expected,3), "\n std.dev =", 
       round(my.res$sd,3), "\n p.value =", round(my.res$p.value, 3)))
}

par(mar=c(5,4,4,2)+0.1)

for (i in 3:7) {
  plot(dist(my.data[ ,i]), point.dists,pch = 20, xlab="geographical distance", 
       ylab="behavioural distance")
}

PS trong các ví dụ trên trang web trợ giúp thống kê của UCLA, cả hai bài kiểm tra đều được sử dụng trên cùng một dữ liệu và cùng một giả thuyết, điều này không hữu ích lắm (xem, bài kiểm tra của Mantel , I của Moran ).

Trả lời IM Bạn đã viết:

... nó [Thần chú] kiểm tra xem những con quạ yên tĩnh có nằm gần những con quạ yên tĩnh khác hay không, trong khi những con quạ ồn ào có hàng xóm ồn ào.

Tôi nghĩ rằng giả thuyết đó KHÔNG thể được kiểm tra bằng phép thử Mantel . Trên cả hai lô giả thuyết hợp lệ. Nhưng nếu bạn cho rằng một cụm những con quạ không ồn ào có thể không có kiến ​​thức về sự tồn tại của cụm thứ hai của những con quạ không ồn ào - bài kiểm tra Thần chú lại vô dụng. Việc phân tách như vậy sẽ rất có thể xảy ra trong tự nhiên (chủ yếu là khi bạn thực hiện thu thập dữ liệu ở quy mô lớn hơn).

nhập mô tả hình ảnh ở đây

Câu trả lời:


19

Kiểm tra thần chú và Moran là tôi đề cập đến hai khái niệm rất khác nhau.

Lý do sử dụng I của Moran là câu hỏi về tự tương quan không gian: mối tương quan của một biến với chính nó trong không gian. Người ta sử dụng I của Moran khi muốn biết mức độ nào xảy ra của một sự kiện trong một đơn vị khu vực khiến cho nhiều khả năng xảy ra sự kiện trong một đơn vị khu vực lân cận. Nói cách khác (sử dụng ví dụ của bạn): nếu có một con quạ ồn ào trên cây, thì có khả năng hoặc không thể có những con quạ ồn ào khác trong khu phố? Giả thuyết khống cho I của Moran không phải là sự tự tương quan không gian trong biến quan tâm.

Lý do sử dụng bài kiểm tra Mantel là câu hỏi về sự tương đồng hoặc khác biệt giữa các biến. Người ta sử dụng phép thử Mantel khi muốn biết liệu các mẫu giống nhau về các biến dự đoán (không gian) cũng có xu hướng giống nhau về biến số phụ thuộc (loài). Nói một cách đơn giản: Các mẫu gần nhau cũng có cấu tạo tương tự nhau và các mẫu nằm cách xa nhau về mặt không gian cũng có cấu trúc không giống nhau? Sử dụng ví dụ của bạn: nó kiểm tra xem những con quạ yên tĩnh có nằm gần những con quạ yên tĩnh khác hay không, trong khi những con quạ ồn ào có hàng xóm ồn ào. Giả thuyết khống là không có mối quan hệ giữa vị trí không gian và DV.
Bên cạnh đó, kiểm tra Mantel một phần cho phép so sánh hai biến trong khi kiểm soát biến thứ ba.
Ví dụ, người ta cần kiểm tra Mantel khi so sánh

  • Hai nhóm sinh vật, tạo thành cùng một tập hợp các đơn vị mẫu;
  • Cơ cấu cộng đồng trước và sau khi xáo trộn;
  • Khoảng cách di truyền / sinh thái và khoảng cách địa lý.

Dưới đây là một cuộc thảo luận tốt về bài kiểm tra Mantel và ứng dụng của nó.

(Được chỉnh sửa để đáp lại các ví dụ mới của Ladislav Nado)

Nếu tôi có thể đoán, lý do cho sự nhầm lẫn của bạn là bạn cứ nghĩ về không gian và tiếng ồn trong các ví dụ của bạn hoặc là hai biến liên tục hoặc là một ma trận khoảng cách (vị trí trong không gian) và một biến liên tục (nhiễu). Trong thực tế, để phân tích sự tương đồng giữa hai biến như vậy, người ta nên nghĩ cả hai biến đó là ma trận khoảng cách . Đó là:

  • một ma trận (ví dụ, đối với không gian) mô tả sự khác biệt cho từng cặp tọa độ địa lý. Giá trị cho 2 con quạ ngồi cạnh nhau thấp hơn giá trị cho những con quạ ngồi cách xa nhau;
  • một ma trận khác (đối với môi trường, di truyền hoặc bất kỳ cấu trúc nào khác) mô tả sự khác biệt giữa các kết quả đo được tại các điểm đã cho. Giá trị của 2 con quạ có độ ồn tương tự nhau (không có vấn đề gì nếu chúng yên tĩnh hoặc ồn ào - đó chỉ là thước đo tương tự!) Thấp hơn giá trị của một cặp quạ có mức độ nhiễu không giống nhau.

Sau đó, phép thử Mantel tính sản phẩm chéo của các giá trị tương ứng trong hai ma trận này. Hãy để tôi nhấn mạnh một lần nữa rằng thống kê Mantel là mối tương quan giữa hai ma trận khoảng cách và không tương đương với tương quan giữa các biến , được sử dụng để hình thành các ma trận đó.

Bây giờ chúng ta hãy lấy hai cấu trúc mà bạn đã thể hiện trong hình A và B.
Trong hình A, khoảng cách trong mỗi cặp quạ tương ứng với sự tương đồng về mức độ nhiễu của chúng. Những con quạ có sự khác biệt nhỏ về mức độ tiếng ồn của chúng (mỗi con quạ yên tĩnh so với một con quạ yên tĩnh khác, mỗi con quạ ồn ào so với một con quạ ồn ào khác) ở gần nhau, trong khi mỗi con quạ có sự khác biệt lớn về mức độ tiếng ồn của chúng (một con quạ yên tĩnh so với một con quạ ồn ào) tránh xa nhau. Thử nghiệm Mantel cho thấy chính xác rằng có một mối tương quan không gian giữa hai ma trận.
Trong ảnh B, tuy nhiên, khoảng cách giữa các con quạ khôngtương ứng với sự tương đồng về mức độ tiếng ồn của chúng. Trong khi tất cả những con quạ ồn ào ở lại với nhau, những con quạ yên tĩnh có thể hoặc không thể ở gần. Trong thực tế, khoảng cách trong một số cặp quạ không giống nhau (một yên lặng + một ồn ào) nhỏ hơn khoảng cách cho một số cặp quạ tương tự (khi cả hai đều im lặng).
Không có bằng chứng trong hình B rằng nếu một nhà nghiên cứu nhặt được hai con quạ tương tự một cách ngẫu nhiên, chúng sẽ là hàng xóm. Không có bằng chứng cho thấy nếu một nhà nghiên cứu nhặt được hai con quạ lân cận (hoặc không quá xa) một cách ngẫu nhiên, chúng sẽ giống nhau. Do đó, yêu cầu ban đầu On both plots the hypothesis validlà không chính xác. Cấu trúc như trong hình B cho thấy không có mối tương quan về không gian giữa hai ma trận và do đó thất bại trong bài kiểm tra Mantel.

Tất nhiên, các loại cấu trúc khác nhau (có một hoặc nhiều cụm đối tượng tương tự hoặc không có đường viền cụm rõ ràng) tồn tại trong thực tế. Và bài kiểm tra Mantel hoàn toàn có thể áp dụng và rất hữu ích để kiểm tra những gì nó kiểm tra. Nếu tôi có thể đề nghị một cách đọc tốt khác, bài viết này sử dụng dữ liệu thực và thảo luận về bài kiểm tra I, Geary's và bài kiểm tra của Mantan với các thuật ngữ khá đơn giản và dễ hiểu.

Hy vọng mọi thứ bây giờ rõ ràng hơn một chút; mặc dù vậy, tôi có thể mở rộng lời giải thích này nếu bạn cảm thấy vẫn còn thiếu thứ gì đó.


1
cảm ơn câu trả lời của bạn, nhưng tôi nghĩ rằng giả thuyết bạn viết (của giả thuyết kiểm tra Mantel ngoài đời thực) không hữu ích với dữ liệu thực tế. Tôi thêm phản hồi của tôi cho bạn ở trên, tôi sẽ rất vui mừng nếu bạn phản hồi về nó. Có lẽ tôi đã sai lầm.
Ladislav Naďo

@Ladislav Nado Tôi đã cập nhật câu trả lời. Xin đừng ngần ngại yêu cầu giải thích thêm, nếu cần.
IM

Rất cám ơn, khi tôi "nhai qua" bài viết mà bạn đề nghị cuối cùng tôi cũng hiểu.
Ladislav Naďo

1
@LadislavNado Tuyệt vời! Vinh dự khi được giup bạn.
IM
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.