ANOVA với các quan sát không độc lập


11

Xin lỗi cho nền tảng dài dòng cho câu hỏi này:

Thỉnh thoảng trong các cuộc điều tra về hành vi của động vật, một người thí nghiệm quan tâm đến lượng thời gian mà một đối tượng dành cho các khu vực được xác định trước khác nhau trong một thiết bị thử nghiệm. Tôi thường thấy loại dữ liệu này được phân tích bằng ANOVA; tuy nhiên, tôi chưa bao giờ bị thuyết phục hoàn toàn về tính hợp lệ của các phân tích như vậy, vì ANOVA cho rằng các quan sát là độc lập và chúng không bao giờ thực sự độc lập trong các phân tích này (vì nhiều thời gian hơn ở một khu vực có nghĩa là chi tiêu ít hơn ở các khu vực khác! ).

Ví dụ,

DR Smith, CD Striplin, AM Geller, RB Mailman, J. Drago, CP Lawler, M. Gallagher, Đánh giá hành vi của những con chuột thiếu thụ thể dopamine D1A , Thần kinh học, Tập 86, Số 1, ngày 21 tháng 5 năm 1998, Trang 135-146

Trong bài viết trên, họ giảm 1 bậc tự do để bù đắp cho sự không độc lập. Tuy nhiên, tôi không chắc làm thế nào một thao tác như vậy thực sự có thể cải thiện sự vi phạm các giả định ANOVA này.

Có lẽ một thủ tục chi bình phương có thể thích hợp hơn? Bạn sẽ làm gì để phân tích dữ liệu như thế này (ưu tiên cho các vùng, dựa trên thời gian ở các vùng)?

Cảm ơn!

Câu trả lời:


3

(Caveat Emptor: Tôi không phải là chuyên gia trong lĩnh vực này)

Nếu bạn chỉ muốn nói về sự khác biệt về thời gian dành cho mỗi vị trí, thì việc gửi dữ liệu "thời gian trên mỗi vị trí" dưới dạng đếm trong một mô hình hỗn hợp đa phương thức (xem gói MCMCglmm cho R), sử dụng chủ đề làm hiệu ứng ngẫu nhiên, nên làm mánh khóe

Nếu bạn muốn nói về sự khác biệt về sở thích vị trí theo thời gian, thì có thể chuyển thời gian thành các khoảng thời gian hợp lý (có thể theo độ phân giải của thiết bị đo thời gian của bạn?), Hãy phân loại từng khoảng thời gian theo vị trí của chuột tại thời điểm đó (ví dụ: nếu 3 vị trí, mỗi khoảng được gắn nhãn 1, 2 hoặc 3) và một lần nữa sử dụng mô hình hiệu ứng hỗn hợp đa phương thức với chủ đề là hiệu ứng ngẫu nhiên nhưng lần này thêm khoảng như một hiệu ứng cố định (mặc dù có thể chỉ sau khi nhân cách hóa, giảm sức mạnh nhưng sẽ giúp ích nắm bắt phi tuyến tính qua thời gian).


5

Mike,

Tôi đồng ý rằng ANOVA dựa trên tổng thời gian có lẽ không phải là cách tiếp cận chính xác ở đây. Hơn nữa, tôi không tin rằng Chi Sqaure giải quyết vấn đề của bạn. Chi vuông sẽ tôn trọng ý tưởng rằng bạn không thể ở hai địa điểm cùng một lúc, nhưng nó không giải quyết được vấn đề có khả năng phụ thuộc giữa thời gian N và thời gian N + 1. Liên quan đến vấn đề thứ hai này, tôi thấy một số điểm tương đồng giữa tình huống của bạn và những gì mọi người gặp phải với dữ liệu theo dõi mắt và chuột. Một mô hình đa cực của một số loại có thể phục vụ tốt mục đích của bạn. Thật không may, các chi tiết của loại mô hình đó nằm ngoài chuyên môn của tôi. Tôi chắc chắn rằng một số cuốn sách thống kê ở đâu đó có một đoạn trích nhỏ về chủ đề đó, nhưng ngoài đỉnh đầu tôi sẽ hướng bạn tới:

  • Barr DJ (2008) Phân tích dữ liệu quan sát 'thế giới thị giác' bằng cách sử dụng hồi quy logistic đa cấp. Tạp chí bộ nhớ và ngôn ngữ, số đặc biệt: Phân tích dữ liệu mới nổi (59) Trang 457-474
  • https://r-forge.r-project.org/projects/gmpm/ là cách tiếp cận không tham số cho cùng một vấn đề đang được Tiến sĩ Barr phát triển

Nếu bất cứ điều gì, cả hai nguồn đó nên được hoàn thành nhiều hơn bởi vì họ có được cách phân tích tiến trình thời gian của vị trí.


4

Nhìn vào các mô hình với các lỗi tương quan không gian (và các hiệp phương sai tương quan không gian). Giới thiệu ngắn gọn, với các tham chiếu đến GeoDa , có sẵn ở đây . Có rất nhiều văn bản; những cái tốt là của Noel Cressie , Robert HainedFotheringham et al (liên kết cuối cùng đi đến một bản tóm tắt, không phải là một trang sách). Một số mã R gần đây đã xuất hiện nhưng tôi không quen với nó.


3

Tôi sẽ đề xuất một câu trả lời rất khác với câu trả lời của ANOVA truyền thống. Gọi T là tổng thời gian dành cho động vật ở tất cả các khu vực. Bạn có thể định nghĩa T là tổng thời gian thức dậy hoặc một số như vậy. Giả sử bạn có vùng J. Sau đó, theo định nghĩa bạn có:

Tổng T_j = T

Bạn có thể bình thường hóa ở trên bằng cách chia lhs và rhs cho T và bạn nhận được

Tổng P_j = 1

Trong đó P_j là tỷ lệ thời gian mà động vật dành cho khu vực j.

Bây giờ câu hỏi bạn có là nếu P_j khác biệt đáng kể so với 1 / J cho tất cả j.

Bạn có thể giả sử rằng P_j tuân theo phân phối dirichlet và ước tính hai mô hình.

Mô hình Null

Đặt tham số của phân phối sao cho P_j = 1 / J. (Đặt tham số của phân phối thành 1 sẽ làm.)

Mô hình thay thế

Đặt tham số của phân phối là một hàm của hiệp phương cụ thể vùng. Sau đó bạn có thể ước tính các tham số mô hình.

Bạn sẽ chọn mô hình thay thế nếu nó vượt trội hơn mô hình null trên một số critera (ví dụ: tỷ lệ khả năng).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.