Biến đổi Box-Cox cho các số đo lặp lại ANOVA (rANOVA) trong R


7

Đề xuất của tôi về giải pháp

Thực hiện chuyển đổi Box-Cox mặc dù kiến ​​thức cho rằng sự béo phì không độc lập và sau đó sử dụng rANOVA để hệ số estiamte sử dụng kiến ​​thức mà các quan sát xuất phát từ thiết kế các biện pháp lặp đi lặp lại

ANOVA là gì?

Người ta có thể coi mô hình một chiều cơ bản (với một biến giải thích rời rạc) Phân tích mô hình phương sai (ANOVA) như một trường hợp đặc biệt của mô hình tuyến tính với một biến giải thích rời rạc.

ANOVA ước tính sự khác biệt của giá trị trung bình của biến trả lời giữa các mức của biến giải thích và trả về thống kê F (dựa trên phương sai, do đó tên) từ đó người ta có thể suy ra ý nghĩa thống kê của chênh lệch ước tính (được coi là hệ số trong mô hình tuyến tính, cho mã hóa biến phù hợp).

Tại sao chúng ta sử dụng phép biến đổi Box-Cox?

Do hình thức thống kê F, giả định tính độc lập, tính quy tắc và tính đồng nhất của phương sai của phần dư là bắt buộc. Những giả định đó thường không được thỏa mãn và người ta có thể thực hiện chuyển đổi Box-Cox , sử dụng mô hình đầy đủ, để biến đổi biến trả lời để có normalphân phối giống hơn .

Vấn đề: Các biện pháp lặp đi lặp lại

Đôi khi người ta có thể đánh vào một nghiên cứu được thiết kế cho các biện pháp lặp đi lặp lại, và sau đó Errortầng đặc biệt được yêu cầu phải tính đến tính chất bị chặn của một mô hình. Do đó, phép đo lặp lại ANOVA có thể được thực hiện (rANOVA), nhưng như thường lệ, người ta có thể gặp phải tình huống phân phối không bình thường.

Đối phó với các biện pháp lặp đi lặp lại có vẻ như là một vấn đề toán học đã được giải quyết, hơn nữa các số liệu thống kê được trang bị Box-Coxkhi chuyển đổi khi giả định quy tắc không được thực hiện nên người ta cũng có một công cụ để đối phó với tính phi quy tắc. Nhưng điều gì sẽ xảy ra nếu một thiết kế bị chặn, chúng ta gặp phải một loại biện pháp quan sát lặp lại và biến phản ứng không đến từ phân phối bình thường.

Câu hỏi

Sau đó, người ta nên thực hiện chuyển đổi Box-Cox cho các biện pháp lặp lại Phân tích phương sai (rANOVA), nhưng dường như nó không được thực hiện trong gói thống kê R.

Tôi đã thử tự mình thực hiện MASS::boxcoxchức năng ( https://github.com/cran/MASS/blob/master/R/boxcox.R ), nhưng chỉ xuất hiện một phương pháp cho tiêu chuẩn aov(phân tích phương sai ) được coi là một mô hình tuyến tính ( lmlớp). Đối với các biện pháp lặp lại ANOVA (lớp aovlist) R dưới đây ví dụ không hoạt động

> npk.aov <- aov(yield ~  N*P*K, npk)
> boxcox(npk.aov)
> npk.aovE <- aov(yield ~  N + Error(block), npk)
> boxcox(npk.aovE)
Error in boxcox.default(npk.aovE) : 
  ‘npk.aovE’ does not have both 'qr' and 'y' components
> boxcox(npk.aovE[[3]])
Error in update.default(object, y = TRUE, qr = TRUE, ...) : 
  need an object with call component
> npk.aovE[[3]]$y <- npk$yield
> boxcox(npk.aovE[[3]])
Error in qr.resid(xqr, yt) : 
  'qr' and 'y' must have the same number of rows

Beacuse của QRma trận phân rã chỉ có 18 hàng

> nrow(npk.aovE[[3]]$qr$qr)
[1] 18
> NROW(npk.aovE[[3]]$y)
[1] 24

Có ai biết làm thế nào để thực hiện alghoritm như vậy hoặc đã thấy bất kỳ gói nào có chứa thông tin Box-Cox cho các biện pháp tái sản xuất ANOVA ?? Tôi đã thấy cách tiếp cận của Friedman, tương đương với thử nghiệm Kruskal-Wallis (ANOVA không tham số) đối với các loại biện pháp quan sát lặp đi lặp lại, và thậm chí các thử nghiệm hậu hoc do Tal Galili thực hiện ( http: //www.r-statistic. com / 2010/02 / post-hoc-analy-for-Friedmans-test-r-code / ) nhưng cách tiếp cận này không đủ cho tôi vì tôi sẽ không đạt được các hệ số mô hình tuyến tính với một bài kiểm tra xếp hạng, mà bài kiểm tra của Friedman là - Tôi nhất là xen vào khi biết sự khác biệt giữa các nhóm trong biến giải thích. Có lẽ người ta có thể đề xuất một cách tiếp cận differet hơn chuyển đổi Box-Cox cho các biện pháp được xử lý lại ANOVA (rANOVA)?


Bạn nên đi theo cách hiện đại để thực hiện các phép đo lặp lại, đó là mô hình hỗn hợp tuyến tính. Dưới đây là một bài viết có liên quan: jstor.org/ sóng / 3559673? Sq = 1 # page_scan_tab_contents và một bài đăng được xác thực chéo có liên quan: stats.stackexchange.com/questions/138766/ cho đến nay (chưa được trả lời).
kjetil b halvorsen 3/2/2016

1
@kjetilbhalvorsen cảm ơn! Tôi sẽ có một cái nhìn và đi sâu hơn với điều này vào ngày mai
Marcin Kosiński

Câu trả lời:


2

Như @kjetil b halvorsen gợi ý tôi sẽ đi với các mô hình hỗn hợp tuyến tính: đây là bài báobài liên quan .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.