Thực tế mà nói, làm thế nào để mọi người xử lý ANOVA khi dữ liệu không đáp ứng được các giả định?


19

Đây không phải là một câu hỏi thống kê nghiêm ngặt - Tôi có thể đọc tất cả các sách giáo khoa về các giả định ANOVA - Tôi đang cố gắng tìm hiểu làm thế nào các nhà phân tích làm việc thực tế xử lý dữ liệu không đáp ứng được các giả định. Tôi đã trải qua rất nhiều câu hỏi trên trang web này để tìm câu trả lời và tôi tiếp tục tìm các bài đăng về việc khi nào không nên sử dụng ANOVA (trong bối cảnh toán học trừu tượng, lý tưởng hóa) hoặc cách thực hiện một số điều tôi mô tả bên dưới trong R. I Tôi thực sự đang cố gắng tìm ra những quyết định mà mọi người thực sự đưa ra và tại sao.

Tôi đang chạy phân tích dữ liệu được nhóm từ cây (cây thực tế, không phải cây thống kê) trong bốn nhóm. Tôi đã có dữ liệu cho khoảng 35 thuộc tính cho mỗi cây và tôi sẽ đi qua từng thuộc tính để xác định xem các nhóm có khác nhau đáng kể trên thuộc tính đó không. Tuy nhiên, trong một vài trường hợp, các giả định ANOVA bị vi phạm đôi chút vì phương sai không bằng nhau (theo thử nghiệm của Levene, sử dụng alpha = 0,05).

Như tôi thấy, các tùy chọn của tôi là: 1. Sức mạnh biến đổi dữ liệu và xem liệu nó có thay đổi Levene p-val không. 2. Sử dụng một bài kiểm tra không tham số như Wilcoxon (nếu vậy, cái nào?). 3. Thực hiện một số chỉnh sửa đối với kết quả ANOVA, như Bonferroni (Tôi thực sự không chắc chắn liệu có thứ gì đó như thế này tồn tại không?). Tôi đã thử hai tùy chọn đầu tiên và nhận được kết quả hơi khác nhau - trong một số trường hợp, một cách tiếp cận có ý nghĩa và phương pháp khác thì không. Tôi sợ rơi vào bẫy câu cá giá trị p, và tôi đang tìm kiếm lời khuyên sẽ giúp tôi biện minh cho cách sử dụng.

Tôi cũng đã đọc một số điều cho thấy rằng tính không đồng nhất thực sự không phải là vấn đề lớn đối với ANOVA trừ khi phương tiện và phương sai có tương quan với nhau (nghĩa là cả hai đều tăng cùng nhau), vì vậy có lẽ tôi chỉ có thể bỏ qua kết quả của Levene trừ khi tôi thấy mô hình như thế? Nếu vậy, có một thử nghiệm cho điều này?

Cuối cùng, tôi nên nói thêm rằng tôi đang thực hiện phân tích này để xuất bản trong một tạp chí được đánh giá ngang hàng, vì vậy bất kỳ cách tiếp cận nào tôi giải quyết đều phải vượt qua các nhà phê bình. Vì vậy, nếu bất cứ ai cũng có thể cung cấp các liên kết đến các ví dụ tương tự, được công bố sẽ là tuyệt vời.


3
Cho dù bạn có sử dụng hay không R, nó có thể có lợi cho bạn khi đọc câu trả lời của tôi ở đây: Các lựa chọn thay thế cho ANOVA một chiều cho dữ liệu không đồng nhất , trong đó thảo luận về một số vấn đề này.
gung - Phục hồi Monica

Câu trả lời:


18

Tôi đang cố gắng tìm hiểu làm thế nào các nhà phân tích làm việc thực tế xử lý dữ liệu không đáp ứng được các giả định.

Nó phụ thuộc vào nhu cầu của tôi, những giả định nào bị vi phạm, theo cách nào, mức độ tệ hại, mức độ ảnh hưởng đến suy luận và đôi khi trên kích thước mẫu.

Tôi đang chạy phân tích dữ liệu được nhóm lại từ các cây trong bốn nhóm. Tôi đã có dữ liệu cho khoảng 35 thuộc tính cho mỗi cây và tôi sẽ đi qua từng thuộc tính để xác định xem các nhóm có khác nhau đáng kể trên thuộc tính đó không. Tuy nhiên, trong một vài trường hợp, các giả định ANOVA bị vi phạm đôi chút vì phương sai không bằng nhau (theo thử nghiệm của Levene, sử dụng alpha = 0,05).

1) Nếu kích thước mẫu bằng nhau, bạn không gặp vấn đề gì. ANOVA khá (mức-) mạnh đối với các phương sai khác nhau nếu n bằng nhau.

2) kiểm tra sự bằng nhau của phương sai trước khi quyết định có nên cho rằng nó được khuyến nghị chống lại bởi một số nghiên cứu. Nếu bạn nghi ngờ thực sự rằng họ sẽ gần bằng nhau, tốt hơn hết là giả sử họ không bằng nhau.

Một số tài liệu tham khảo:

Zimmerman, DW (2004),
"Một lưu ý về các thử nghiệm sơ bộ về sự bình đẳng của phương sai."
Br. J. Toán. Thống kê Thần kinh. , Tháng năm ; 57 (Pt 1): 173-81.
http://www.ncbi.nlm.nih.gov/pubmed/15171807

Henrik đưa ra ba tài liệu tham khảo ở đây

3) Đó là kích thước hiệu ứng quan trọng, thay vì mẫu của bạn có đủ lớn để cho bạn biết chúng khác nhau đáng kể hay không. Vì vậy, trong các mẫu lớn, một sự khác biệt nhỏ về phương sai sẽ cho thấy rất có ý nghĩa trong thử nghiệm của Levene, nhưng về cơ bản sẽ không có hậu quả trong tác động của nó. Nếu các mẫu lớn và kích thước hiệu ứng - tỷ lệ phương sai hoặc chênh lệch phương sai - khá gần với giá trị của chúng, thì giá trị p sẽ không có kết quả. (Mặt khác, trong các mẫu nhỏ, giá trị p lớn rất dễ chịu. Dù bằng cách nào, bài kiểm tra không trả lời đúng câu hỏi.)

Lưu ý rằng có một điều chỉnh loại Welch-Satterthwaite để ước tính sai số chuẩn và df trong ANOVA, giống như trong các thử nghiệm t hai mẫu.

  1. Sử dụng một thử nghiệm không tham số như Wilcoxon (nếu vậy, cái nào?).

Nếu bạn quan tâm đến các lựa chọn thay đổi vị trí, bạn vẫn giả sử lây lan liên tục. Nếu bạn quan tâm đến các lựa chọn thay thế tổng quát hơn nhiều thì có lẽ bạn có thể xem xét nó; mẫu k tương đương với xét nghiệm Wilcoxon là xét nghiệm Kruskal-Wallis.

Thực hiện một số điều chỉnh cho kết quả ANOVA

Xem đề xuất trên của tôi về việc xem xét Welch-Satterthwaite, đó là một 'loại điều chỉnh'.

(Ngoài ra, bạn có thể sử dụng ANOVA của mình dưới dạng một tập hợp các bài kiểm tra t kiểu Welch cặp, trong trường hợp đó bạn có thể muốn xem xét một Bonferroni hoặc một cái gì đó tương tự)

Tôi cũng đã đọc một số điều cho thấy rằng tính không đồng nhất thực sự không phải là vấn đề lớn đối với ANOVA trừ khi phương tiện và phương sai có tương quan với nhau (tức là cả hai đều tăng cùng nhau)

Bạn sẽ phải trích dẫn một cái gì đó như thế. Đã xem xét một số tình huống với các bài kiểm tra t, tôi không nghĩ nó rõ ràng đúng, vì vậy tôi muốn xem tại sao họ lại nghĩ như vậy; có lẽ tình hình bị hạn chế theo một cách nào đó. Sẽ là tốt nếu đó là trường hợp bởi vì các mô hình tuyến tính khá thường được khái quát hóa có thể giúp đỡ với tình huống đó.

Cuối cùng, tôi nên nói thêm rằng tôi đang thực hiện phân tích này để xuất bản trong một tạp chí được đánh giá ngang hàng, vì vậy bất kỳ cách tiếp cận nào tôi giải quyết đều phải vượt qua các nhà phê bình.

Rất khó để dự đoán những gì có thể làm hài lòng người đánh giá của bạn. Hầu hết chúng ta không làm việc với cây.


12

Thực sự không khó để xử lý sự không đồng nhất trong các mô hình tuyến tính đơn giản (ví dụ: các mô hình giống như ANOVA một hoặc hai chiều).

Sự mạnh mẽ của ANOVA

Đầu tiên, như những người khác lưu ý, ANOVA mạnh mẽ đến mức đáng kinh ngạc so với giả định về phương sai bằng nhau, đặc biệt là nếu bạn có dữ liệu cân bằng (số lượng quan sát bằng nhau trong mỗi nhóm). Các thử nghiệm sơ bộ về phương sai bằng nhau, mặt khác, không phải (mặc dù thử nghiệm của Levene tốt hơn nhiều so với F -test thường được dạy trong sách giáo khoa). Như George Box đã nói:

Để thực hiện thử nghiệm sơ bộ về phương sai thay vì đưa ra biển trong một chiếc thuyền chèo để tìm hiểu xem điều kiện có đủ bình tĩnh để một tàu biển rời cảng không!

Mặc dù ANOVA rất mạnh mẽ, vì rất dễ tính đến tính không đồng nhất, nhưng có rất ít lý do để không làm như vậy.

Xét nghiệm không tham số

Nếu bạn thực sự quan tâm đến sự khác biệt về phương tiện , các bài kiểm tra không tham số (ví dụ: bài kiểm tra Kruskal Kiếm Wallis) thực sự không được sử dụng. Họ kiểm tra sự khác biệt giữa các nhóm, nhưng họ không kiểm tra sự khác biệt chung về phương tiện.

Dữ liệu mẫu

Chúng ta hãy tạo một ví dụ đơn giản về dữ liệu mà người ta muốn sử dụng ANOVA, nhưng giả định về phương sai bằng nhau là không đúng.

set.seed(1232)
pop = data.frame(group=c("A","B","C"),
                 mean=c(1,2,5),
                 sd=c(1,3,4))
d = do.call(rbind, rep(list(pop),13))
d$x = rnorm(nrow(d), d$mean, d$sd)

Chúng tôi có ba nhóm, với sự khác biệt (rõ ràng) về cả phương tiện và phương sai:

stripchart(x ~ group, data=d)

Stripchart hiển thị dữ liệu ví dụ.

ANOVA

Không có gì đáng ngạc nhiên, một ANOVA bình thường xử lý việc này khá tốt:

> mod.aov = aov(x ~ group, data=d)
> summary(mod.aov)
            Df Sum Sq Mean Sq F value  Pr(>F)    
group        2  199.4   99.69   13.01 5.6e-05 ***
Residuals   36  275.9    7.66                    
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Vậy, nhóm nào khác nhau? Hãy sử dụng phương pháp HSD của Tukey:

> TukeyHSD(mod.aov)
  Tukey multiple comparisons of means
    95% family-wise confidence level

Fit: aov(formula = x ~ group, data = d)

$group
        diff        lwr      upr     p adj
B-A 1.736692 -0.9173128 4.390698 0.2589215
C-A 5.422838  2.7688327 8.076843 0.0000447
C-B 3.686146  1.0321403 6.340151 0.0046867

Với giá trị P là 0,26, chúng tôi không thể yêu cầu bất kỳ sự khác biệt (về phương tiện) giữa nhóm A và B. Và ngay cả khi chúng tôi không tính đến việc chúng tôi đã thực hiện ba so sánh, chúng tôi sẽ không nhận được P thấp - giá trị ( P  = 0,12):

> summary.lm(mod.aov)
[…]
Coefficients:
            Estimate Std. Error t value  Pr(>|t|)    
(Intercept)   0.5098     0.7678   0.664     0.511    
groupB        1.7367     1.0858   1.599     0.118    
groupC        5.4228     1.0858   4.994 0.0000153 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 2.768 on 36 degrees of freedom

Tại sao vậy? Dựa trên cốt truyện, có một sự khác biệt khá rõ ràng. Lý do là ANOVA giả định phương sai bằng nhau trong mỗi nhóm và ước tính độ lệch chuẩn chung là 2,77 (được hiển thị là 'Lỗi tiêu chuẩn dư' trong summary.lmbảng hoặc bạn có thể lấy nó bằng cách lấy căn bậc hai của bình phương trung bình còn lại (7,66) trong bảng ANOVA).

Nhưng nhóm A có độ lệch chuẩn (dân số) là 1, và sự đánh giá quá cao này là 2,77 khiến cho (không cần thiết) có được kết quả có ý nghĩa thống kê, nghĩa là chúng tôi có một bài kiểm tra với (quá) công suất thấp.

"ANOVA" với phương sai không bằng nhau

Vì vậy, làm thế nào để phù hợp với một mô hình thích hợp, một mô hình có tính đến sự khác biệt về phương sai? Thật dễ dàng trong R:

> oneway.test(x ~ group, data=d, var.equal=FALSE)
    One-way analysis of means (not assuming equal variances)

data:  x and group
F = 12.7127, num df = 2.000, denom df = 19.055, p-value = 0.0003107

Vì vậy, nếu bạn muốn chạy một 'ANOVA' một chiều đơn giản trong R mà không giả sử phương sai bằng nhau, hãy sử dụng chức năng này. Về cơ bản, đây là phần mở rộng của (Welch) t.test()cho hai mẫu có phương sai không bằng nhau.

Thật không may, nó không hoạt động với TukeyHSD()(hoặc hầu hết các chức năng khác mà bạn sử dụng trên aovcác đối tượng), vì vậy ngay cả khi chúng tôi khá chắc chắn có được sự khác biệt nhóm, chúng tôi không biết nơi họ đang có.

Mô hình hóa sự không đồng nhất

Giải pháp tốt nhất là mô hình hóa các phương sai một cách rõ ràng. Và nó rất dễ dàng trong R:

> library(nlme)
> mod.gls = gls(x ~ group, data=d,
                weights=varIdent(form= ~ 1 | group))
> anova(mod.gls)
Denom. DF: 36 
            numDF  F-value p-value
(Intercept)     1 16.57316  0.0002
group           2 13.15743  0.0001

Vẫn có sự khác biệt đáng kể, tất nhiên. Nhưng giờ đây, sự khác biệt giữa nhóm A và B cũng đã trở nên có ý nghĩa tĩnh ( P  = 0,025):

> summary(mod.gls)
Generalized least squares fit by REML
  Model: x ~ group
  […]
Variance function:
 Structure: Different standard
            deviations per stratum
 Formula: ~1 | group 
 Parameter estimates:
       A        B        C 
1.000000 2.444532 3.913382 

Coefficients:
               Value Std.Error  t-value p-value
(Intercept) 0.509768 0.2816667 1.809829  0.0787
groupB      1.736692 0.7439273 2.334492  0.0253
groupC      5.422838 1.1376880 4.766542  0.0000
[…]
Residual standard error: 1.015564 
Degrees of freedom: 39 total; 36 residual

Vì vậy, sử dụng một mô hình thích hợp sẽ giúp! Cũng lưu ý rằng chúng tôi nhận được ước tính về độ lệch chuẩn (tương đối). Độ lệch chuẩn ước tính cho nhóm A có thể được tìm thấy ở dưới cùng, kết quả, 1,02. Độ lệch chuẩn ước tính của nhóm B là 2,44 lần, hoặc 2,48 và độ lệch chuẩn ước tính của nhóm C là 3,97 (loại intervals(mod.gls)để có khoảng tin cậy cho độ lệch chuẩn tương đối của nhóm B và C).

Sửa lỗi cho nhiều thử nghiệm

Tuy nhiên, chúng tôi thực sự nên sửa cho nhiều thử nghiệm. Điều này thật dễ dàng khi sử dụng thư viện 'multcomp'. Thật không may, nó không có hỗ trợ tích hợp cho các đối tượng 'gls', vì vậy trước tiên chúng ta sẽ phải thêm một số chức năng trợ giúp:

model.matrix.gls <- function(object, ...)
    model.matrix(terms(object), data = getData(object), ...)
model.frame.gls <- function(object, ...)
  model.frame(formula(object), data = getData(object), ...)
terms.gls <- function(object, ...)
  terms(model.frame(object),...)

Bây giờ hãy đi làm:

> library(multcomp)
> mod.gls.mc = glht(mod.gls, linfct = mcp(group = "Tukey"))
> summary(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate Std. Error z value Pr(>|z|)    
B - A == 0   1.7367     0.7439   2.334   0.0480 *  
C - A == 0   5.4228     1.1377   4.767   <0.001 ***
C - B == 0   3.6861     1.2996   2.836   0.0118 *  

Vẫn có sự khác biệt có ý nghĩa thống kê giữa nhóm A và nhóm B! Và chúng tôi thậm chí có thể có được khoảng tin cậy (đồng thời) cho sự khác biệt giữa các nhóm có nghĩa là:

> confint(mod.gls.mc)
[…]
Linear Hypotheses:
           Estimate lwr     upr    
B - A == 0 1.73669  0.01014 3.46324
C - A == 0 5.42284  2.78242 8.06325
C - B == 0 3.68615  0.66984 6.70245

Sử dụng một mô hình chính xác (ở đây chính xác), chúng tôi có thể tin tưởng những kết quả này!

Lưu ý rằng đối với ví dụ đơn giản này, dữ liệu cho nhóm C không thực sự thêm bất kỳ thông tin nào về sự khác biệt giữa nhóm A và B, vì chúng tôi mô hình cả phương tiện và độ lệch chuẩn cho từng nhóm. Chúng ta có thể vừa sử dụng các t- tests cặp đã sửa cho nhiều phép so sánh:

> pairwise.t.test(d$x, d$group, pool.sd=FALSE)
    Pairwise comparisons using t tests with non-pooled SD 

data:  d$x and d$group 

  A       B      
B 0.03301 -      
C 0.00098 0.02032

P value adjustment method: holm 

Tuy nhiên, đối với các mô hình phức tạp hơn, ví dụ: mô hình hai chiều hoặc mô hình tuyến tính có nhiều yếu tố dự đoán, sử dụng GLS (bình phương tối thiểu tổng quát) và mô hình hóa rõ ràng các hàm phương sai là giải pháp tốt nhất.

Và hàm phương sai không chỉ đơn giản là một hằng số khác nhau trong mỗi nhóm; chúng ta có thể áp đặt cấu trúc lên nó. Ví dụ, chúng ta có thể mô hình phương sai là công suất trung bình của mỗi nhóm (và do đó chỉ cần ước tính một tham số, số mũ) hoặc có thể là logarit của một trong các yếu tố dự đoán trong mô hình. Tất cả điều này rất dễ dàng với GLS (và gls()trong R).

Bình phương tối thiểu tổng quát là IMHO một kỹ thuật mô hình thống kê rất ít được sử dụng. Thay vì lo lắng về những sai lệch so với các giả định của mô hình , hãy mô hình hóa những sai lệch đó!


1
Cảm ơn bạn đã trả lời! Tôi không hiểu về kết quả từ oneway.test () và gls () cho phương sai không bằng nhau ANOVA (Welch ANOVA). Giá trị p của oneway.test () là p-value = 0,0003107. Nhưng giá trị p từ gls (x ~ nhóm, data = d, weights = varIdent (form = ~ 1 | group)) là 0,0001. Tại sao hai kết quả này khác nhau?
WCMC

2
Có mối quan tâm ngày càng tăng đối với việc sửa chữa cho nhiều thử nghiệm, tôi nghĩ rằng việc báo cáo các giá trị p chưa được xử lý cùng với số lượng so sánh bạn đã làm là minh bạch hơn. Đặc biệt bởi vì bạn có thể không quan tâm đến mọi so sánh theo cặp khi kiểm tra chúng trong R, do đó việc hiệu chỉnh sẽ được thực hiện bằng cách tính đến các so sánh không đáng quan tâm.
Nakx

7
  1. Thực sự có thể có một số chuyển đổi dữ liệu của bạn tạo ra phân phối bình thường chấp nhận được. Tất nhiên, bây giờ suy luận của bạn là về dữ liệu được chuyển đổi, không phải dữ liệu không được chuyển đổi.

  2. Giả sử bạn đang nói về ANOVA một chiều, thử nghiệm Kruskal-Wallis là một phép tương tự không đối xứng thích hợp với ANOVA một chiều. Kiểm tra Dunn (không phải là kiểm tra vườn nhiều cấp bậc tổng hợp) có lẽ là phổ biến thử nghiệm thích hợp phi tham nhất cho bài hoc nhiều so sánh cặp-khôn ngoan, mặc dù có những xét nghiệm khác như kiểm tra Conover-Iman (Nghiêm mạnh hơn thử nghiệm Dunn sau khi từ chối của kruskal-Wallis) và thử nghiệm Dwass-Steele-Crichtlow-Fligner.

  3. α

ANOVA dựa trên tỷ lệ trong nhóm và giữa các phương sai của nhóm. Tôi không hoàn toàn chắc chắn ý của bạn về tính không đồng nhất trong bối cảnh này, nhưng nếu bạn có nghĩa là sự khác biệt không đồng đều giữa các nhóm, thì dường như tôi sẽ phá vỡ logic của giả thuyết khống về bài kiểm tra.

Một truy vấn Google Scholar đơn giản cho "Thử nghiệm của Dunn" cùng với một thuật ngữ chung từ ngành học của bạn sẽ trả về nhiều ví dụ được xuất bản.


Tài liệu tham khảo

Conover, WJ và Iman, RL (1979). Về thủ tục so sánh nhiều . Báo cáo kỹ thuật LA-7677-MS, Phòng thí nghiệm khoa học Los Alamos.

Crichtlow, DE và Fligner, MA (1991). Trên nhiều so sánh không phân phối trong phân tích phương sai một chiều . Truyền thông trong Lý thuyết và Phương pháp thống kê , 20 (1): 127.

Dunn, OJ (1964). Nhiều so sánh sử dụng tổng xếp hạng . Technometrics , 6 (3): 241 bóng252.


2
Ok, cảm ơn vì câu trả lời này, nhưng tôi không hoàn toàn rõ ràng về những gì bạn đang nói. Theo như "tính không đồng nhất", tôi nghĩ rằng tôi đã sử dụng từ này theo nghĩa thông thường: "một tập hợp các biến ngẫu nhiên là không đồng nhất nếu có các quần thể phụ có các biến số khác nhau từ những người khác. Ở đây" biến thiên "có thể được định lượng bằng phương sai hoặc bất kỳ biện pháp phân tán thống kê nào khác. "- Wikipedia. Trong dữ liệu của tôi, phương sai của các nhóm phụ là không đồng đều (theo thử nghiệm của Levene) vì vậy tôi đã mô tả chúng là không đồng nhất. Điều này có đúng không?
Jas Max

1
Điều tôi thực sự đang cố gắng thảo luận là khoảng cách giữa số liệu thống kê trong sách giáo khoa và thế giới thực. Mọi sách giáo khoa đều nói "phương sai phải bằng ANOVA" nhưng tất nhiên chúng không bao giờ như vậy. Vì vậy, chúng ta có tự ý cắt ở một điểm cụ thể và chuyển sang một thử nghiệm khác - nếu vậy, vào thời điểm nào? Trong lĩnh vực của tôi (sinh học thực vật) hầu hết mọi người chỉ sử dụng bất kỳ bài kiểm tra nào họ được đào tạo để sử dụng mà không cần suy nghĩ nhiều. Tôi không thực sự hài lòng với điều đó. Tôi thích bất kỳ đề xuất nào cho sách / trang web thảo luận về việc sử dụng số liệu thống kê 'thực tế' - tức là nên sử dụng thử nghiệm nào khi nào và tại sao. Cảm ơn lời đề nghị của Dunn, điều đó có ích.
Jas Tối

2
Ah, giả định của phương sai bằng nhau là phương sai dân số chứ không phải phương sai mẫu . Bạn có thể suy ra rằng phương sai dân số là bằng nhau ... thông qua kiểm tra nhãn cầu, hoặc bằng cách khác, kiểm tra thống kê.
Alexis

1
Làm thế nào để bạn biết bất cứ điều gì về phương sai dân số nếu không bằng cách đánh giá phương sai mẫu? Tôi giải thích p-val thử nghiệm của Levene là "giả sử phương sai dân số là bằng nhau, tỷ lệ chênh lệch mẫu của bạn sẽ khác nhau nhiều như thế nào." Nếu tôi nhận được p-val thấp, tôi sẽ bác bỏ giả thuyết rằng phương sai dân số là bằng nhau và không thể sử dụng ANOVA. Kruskal-Wallace có vẻ như là một lựa chọn tốt, nhưng có nên chuyển đổi dữ liệu để đáp ứng các giả định ANOVA không và nếu có thì tại sao?
Jas Max

1
Ngoài ra, thử nghiệm của Levene, p <0,05 thử nghiệm thích hợp và cắt bỏ cho quyết định này? Thế còn O'Brien, Bartlett ... thì kết quả của những thử nghiệm này có thể khác nhau đáng kể và tôi thực sự không biết nên sử dụng cái nào - vì vậy tôi đi với Levene vì nó có vẻ bảo thủ nhất. Nhưng có lẽ đó là quá mức cần thiết - có thể do quá nhanh chóng từ bỏ ANOVA, tôi đang chuyển sang một thử nghiệm làm giảm sức mạnh thống kê trong phân tích của tôi một cách không cần thiết.
Jas Max

1

Nghe có vẻ như tôi đang làm việc chân và đang cố gắng hết sức nhưng lo lắng những nỗ lực của bạn sẽ không đủ tốt để đưa bài báo của bạn vượt qua những người đánh giá. Rất nhiều vấn đề trong thế giới thực. Tôi nghĩ rằng tất cả các nhà nghiên cứu đấu tranh với các phân tích dường như là ranh giới hoặc thậm chí thẳng thắn vi phạm các giả định theo thời gian. Sau tất cả, có hàng triệu bài báo đánh giá, ví dụ như hiệu quả điều trị ở 3 nhóm chuột nhỏ với khoảng 6 - 7 con chuột trong mỗi nhóm. Làm thế nào để biết nếu giả định Anova được thỏa mãn trong một bài báo như vậy!

Tôi đã xem xét một số lượng lớn các bài báo đặc biệt là trong lĩnh vực sinh lý bệnh tim mạch và thực sự không bao giờ cảm thấy chắc chắn 100% rằng tôi có thể tin tưởng vào dữ liệu hay không trong một bài báo mà tôi đọc. Nhưng đối với tôi như một nhà phê bình, tôi thực sự có xu hướng nghĩ rằng vấn đề có thể phát sinh ở rất nhiều cấp độ trong khoa học mà có lẽ ít điểm trong đào quá sâu vào số liệu thống kê - sau khi tất cả, toàn bộ dữ liệu có thể được chế tạo và tôi sẽ không bao giờ trong một triệu năm có thể nói. Theo đó, sẽ luôn có một yếu tố tin tưởng trong lĩnh vực công việc này, điều mà các nhà nghiên cứu không bao giờ phải lạm dụng.

Gợi ý trong thế giới thực nhất mà tôi sẽ đưa ra là bạn cần suy nghĩ mọi thứ thật kỹ trước khi gửi và đảm bảo bạn sẽ có thể trả lời trung thực bất kỳ câu hỏi nào của người đánh giá. Miễn là bạn đã cố gắng hết sức, ý định của bạn là trung thực và bạn ngủ ngon vào ban đêm tôi nghĩ bạn sẽ ổn thôi.


2
Tôi không chắc chắn tôi đồng ý về việc không thể phát hiện ra sự bịa đặt: tôi đã phát hiện ra như vậy trước đây.
Alexis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.