Tôi có thể làm bài kiểm tra nếu tôi có ít hoặc không có phương sai trong một nhóm không?


8

Tôi có 4 nhóm mà tôi đang so sánh với một tiêu chí. Trong một trong các nhóm của tôi, tất cả những người tham gia trả lời giống nhau trên mỗi mục, tức là không có phương sai.

Làm thế nào để tôi đối phó với điều đó trong ANOVA của tôi?

Ngoài ra, tôi làm gì trong bài kiểm tra mà tôi đang chạy so sánh nó với một tiêu chí vì tôi sẽ không có thuật ngữ lỗi? Nếu tôi bao gồm một người tham gia mà tôi không chắc là tôi bao gồm trong học sinh của mình, phương sai không hoàn toàn thống nhất với 1 quan sát khác nhau trong số 37 nhưng khi tôi chạy nó, điều đó không đáng kể vì phương sai quá nhỏ.

Tôi hiểu rằng không có gì tôi có thể làm tính toán khôn ngoan. Tôi đang hỏi làm thế nào một người xử lý nó về mặt khái niệm.

Câu trả lời:


2

Nếu bạn giả định rằng phương sai là giống nhau cho mỗi nhóm, bạn có thể lấy ước tính phương sai gộp và làm việc với nó trong việc xây dựng các kiểm tra t cho sự khác biệt theo cặp. Nhưng đó sẽ không phải là một giả định tốt trừ khi tất cả các phương sai đều nhỏ và một phương sai có tất cả các giá trị giống hệt nhau chỉ là một sự tình cờ. Nếu bạn không thể làm điều đó thì bạn không có cách nào để ước tính phương sai cho một nhóm đó và không thể phân tích phương sai hoặc bất kỳ thử nghiệm t nào liên quan đến nhóm đó là một trong các cặp được so sánh.


(+1) Nhắc nhở tôi về câu trả lời của G Jay Kerns trên trang web này cho một câu hỏi khác kết thúc bằng việc phân phối dữ liệu như OP mô tả.
Andy W

6

Dưới đây là một vài quan sát để thêm vào các câu trả lời hiện có. Tôi nghĩ rằng điều quan trọng là suy nghĩ thông qua khái niệm tại sao bạn lại có được một nhóm không có phương sai.

Hiệu ứng sàn và trần

Theo kinh nghiệm của tôi về tâm lý học, ví dụ này xuất hiện thường xuyên nhất khi có một sàn hoặc trần trên một cái cân, và bạn có một số nhóm rơi vào giữa thang đo và những nhóm khác rơi vào tình trạng cực đoan. Ví dụ: Nếu biến phụ thuộc của bạn là tỷ lệ của các mục chính xác trong số năm câu hỏi, thì bạn có thể thấy rằng nhóm "thông minh" của mình đúng 100% hoặc "nhóm lâm sàng" của bạn được đúng 0%.

Trong trường hợp này:

  • Bạn có thể muốn quay lại các bài kiểm tra không tham số thông thường nếu bạn không có phương sai trong một trong các nhóm của mình.
  • Mặc dù nó có thể không giúp ích gì cho bạn sau khi thực tế, bạn cũng có thể muốn suy nghĩ một cách khái niệm về việc liệu một biện pháp khác không có hiệu ứng sàn hoặc trần sẽ tốt hơn để sử dụng. Trong một số trường hợp nó không quan trọng. Ví dụ, điểm phân tích có thể đã chỉ ra rằng một nhóm có thể thực hiện một nhiệm vụ và một nhóm khác thì không thể. Trong các trường hợp khác, bạn có thể muốn mô hình sự khác biệt cá nhân trong tất cả các nhóm, trong trường hợp đó bạn có thể cần một thang đo không bị ảnh hưởng bởi sàn hoặc trần.

Quy mô nhóm rất nhỏ

n<5

Trong trường hợp này, bạn có thể có xu hướng đặt tình trạng thiếu phương sai xuống và tiến hành kiểm tra t tiêu chuẩn.


3

Một vài năm trước, tôi đã hoàn toàn đăng ký câu trả lời của @Michael Chernick.

Tuy nhiên, gần đây tôi nhận ra rằng một số triển khai của bài kiểm tra t cực kỳ mạnh mẽ đối với sự bất bình đẳng của phương sai. Đặc biệt, trong R hàm t.testcó một tham số mặc định var.equal=FALSE, điều đó có nghĩa là nó không chỉ đơn giản dựa vào ước tính gộp của phương sai. Thay vào đó, nó sử dụng mức độ tự do gần đúng của Welch-Satterthwaite , bù cho sự chênh lệch không đồng đều.

Hãy xem một ví dụ.

set.seed(123)
x <- rnorm(100)
y <- rnorm(100, sd=0.00001)
# x and y have 0 mean, but very different variance.
t.test(x,y)
Welch Two Sample t-test

data:  x and y 
t = 0.9904, df = 99, p-value = 0.3244
alternative hypothesis: true difference in means is not equal to 0 
95 percent confidence interval:
 -0.09071549  0.27152946 
sample estimates:
    mean of x     mean of y 
 9.040591e-02 -1.075468e-06

Bạn có thể thấy R yêu cầu thực hiện bài kiểm tra t của Welch chứ không phải bài kiểm tra t của Student . Ở đây mức độ tự do được tuyên bố là 99, mặc dù mỗi mẫu có kích thước 100, do đó, ở đây chức năng kiểm tra mẫu đầu tiên so với giá trị cố định 0.

Bạn có thể tự xác minh rằng việc triển khai này mang lại giá trị p chính xác ( tức là đồng nhất) cho hai mẫu có phương sai rất khác nhau.

Bây giờ, đây là một thử nghiệm t hai mẫu. Kinh nghiệm của riêng tôi với ANOVA là nó nhạy cảm hơn nhiều với sự bất bình đẳng của phương sai. Trong trường hợp đó, tôi hoàn toàn đồng ý với @Michael Chernick.


Nếu cách tiếp cận đó về cơ bản giống như so sánh nhóm đầu tiên với số 0 thì tại sao không trừ đi giá trị quan sát được của nhóm không có giá trị từ các giá trị khác và so sánh chúng với số không? Nói cách khác, chỉ cần thực hiện kiểm tra một mẫu bằng cách sử dụng ước tính khả dụng duy nhất có sẵn. Điều đó có vẻ đơn giản hơn về mặt khái niệm so với việc sử dụng thử nghiệm Welch-Scatterthwaite.
Michael Lew

Hoàn toàn đúng @Michael Lew. Ví dụ của tôi không phải là rất mô phạm bởi vì đây là một trường hợp cực đoan. Thử nghiệm t của Welch có trong các trường hợp đường biên, giống như khi mẫu có phương sai nhỏ hơn 4 lần. Tôi chỉ đơn giản muốn làm nổi bật rằng cách tiếp cận là nhất quán trong giới hạn.
gui11aume

3

Trong một số trường hợp nhất định, có thể tính được giới hạn trên về phương sai của dân số có thể là gì, và sau đó sử dụng phương sai đó trong một cái gì đó như kiểm tra t với phương sai không bằng nhau.

Ví dụ: nếu bạn hỏi 10 học sinh được chọn ngẫu nhiên trong một trường gồm 100 học sinh thì ngày yêu thích của họ vào tháng 3 là gì và tất cả họ đều trả lời vào ngày 15, bạn biết rằng phương sai lớn nhất bạn có thể có đối với dân số học sinh là phương sai cho 10 giá trị gồm 15, 45 giá trị của 1 và 45 giá trị của 31, là 204.6364.

Một phương sai lớn hơn sẽ làm cho việc phát hiện sự khác biệt trở nên khó khăn hơn, do đó thử nghiệm t sử dụng giới hạn trên của phương sai này sẽ được bảo thủ trong việc phát hiện sự khác biệt. Điều đó có nghĩa là bạn sẽ chắc chắn về sự khác biệt đáng kể do thử nghiệm t sử dụng giới hạn trên của phương sai, nhưng nếu bạn không tìm thấy sự khác biệt đáng kể, bạn sẽ không biết nhiều, vì sự khác biệt đáng kể vẫn phù hợp với một số phương sai nhỏ hơn có thể.

Tất nhiên có thể không có nhiều tình huống mà bạn thực sự có thể tìm ra điều này, nhưng nó có thể là có thể.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.