Cỡ mẫu nhỏ và không cân đối cho hai nhóm - phải làm gì?


10

Tôi có dữ liệu cho hai nhóm (tức là các mẫu) tôi muốn so sánh nhưng tổng kích thước mẫu là nhỏ (n = 29) và không cân bằng mạnh (n = 22 so với n = 7).

Những dữ liệu này rất khó thu thập và tốn kém về mặt logic, vì vậy trong khi 'thu thập thêm dữ liệu' vì một giải pháp rõ ràng không hữu ích trong trường hợp này.

Một số biến số khác nhau đã được đo (ngày khởi hành, ngày đến, thời gian di chuyển, v.v.) vì vậy có nhiều thử nghiệm, một số biến thể rất khác nhau (mẫu nhỏ hơn có phương sai cao hơn).

Ban đầu, một đồng nghiệp đã chạy thử nghiệm t trên các dữ liệu này và một số có ý nghĩa thống kê với P <0,001, một số khác không có ý nghĩa với P = 0,069. Một số mẫu được phân phối bình thường, một số khác thì không. Một số thử nghiệm liên quan đến khởi hành lớn từ phương sai 'bằng nhau'.

Tôi có một số câu hỏi:

  1. các bài kiểm tra t thích hợp ở đây? Nếu không, tại sao? Có phải điều này chỉ áp dụng cho các thử nghiệm trong đó các giả định về tính quy tắc và đẳng thức của phương sai được thỏa mãn?
  2. một sự thay thế phù hợp là gì? Có lẽ một bài kiểm tra hoán vị?
  3. phương sai không bằng nhau làm tăng lỗi loại I, nhưng làm thế nào? và cỡ mẫu nhỏ, không cân bằng có ảnh hưởng gì đến lỗi Loại I?

Câu trả lời:


10

Các thử nghiệm T giả định phương sai bằng nhau của hai quần thể không hợp lệ khi hai quần thể có phương sai khác nhau, và điều đó tệ hơn đối với các cỡ mẫu không bằng nhau. Nếu cỡ mẫu nhỏ nhất là cỡ có phương sai cao nhất, phép thử sẽ có lỗi Loại I tăng cao). Phiên bản Welch-Satterthwaite của bài kiểm tra t, mặt khác, không giả sử phương sai bằng nhau. Nếu bạn đang nghĩ đến thử nghiệm hoán vị Fisher-Pitman, thì nó cũng giả sử phương sai bằng nhau (nếu bạn muốn suy ra các phương tiện không bằng nhau từ giá trị p thấp).

Có một số điều khác mà bạn có thể muốn nghĩ về:

(1) Nếu phương sai rõ ràng là không bằng nhau, bạn vẫn còn quan tâm đến sự khác biệt giữa các phương tiện chứ?

(2) Ước tính hiệu ứng có thể được sử dụng nhiều hơn cho bạn so với giá trị p?

(3) Bạn có muốn xem xét tính chất đa biến của dữ liệu của mình, thay vì chỉ thực hiện một loạt các so sánh đơn biến?


Xin chào Scortchi, cảm ơn bạn đã trả lời. Tôi đã xem xét các câu hỏi bạn đặt ra:
DeanP 12/12/12

2
(1) Cả phương sai và giá trị trung bình đều có thể cung cấp thông tin cho nghiên cứu của chúng tôi (ví dụ: ngày khởi hành di chuyển có thể muộn hơn đáng kể đối với một dân số VÀ phạm vi trong ngày khởi hành có nhiều thay đổi).
DeanP

3
(1) Chỉ đề cập đến nó bởi vì mọi người thường xem các phương sai không đồng đều chỉ là một vấn đề kỹ thuật và quên nó là một sự thật thú vị theo đúng nghĩa của nó.
Scortchi - Phục hồi Monica

2
(2) Quan điểm của tôi là nhiều hơn rằng một danh sách các giá trị p thường ít hữu ích hơn một danh sách ước tính kích thước hiệu ứng (có thể là phương tiện, trung vị, phương sai hoặc bất cứ điều gì) với khoảng tin cậy. Đặc biệt với các mẫu nhỏ, khoảng tin cậy có thể cho thấy kích thước hiệu ứng có tầm quan trọng thực tế vẫn phù hợp với dữ liệu ngay cả khi giá trị p cao.
Scortchi - Phục hồi Monica

2
(3) Tôi đã nghĩ về một biến độc lập (nhóm) và một số biến phụ thuộc (thời gian di chuyển & c.): Một sự khác biệt thú vị giữa các nhóm có thể là sự thay đổi trong mối quan hệ giữa các biến phụ thuộc. Bước đầu tiên sẽ là một ma trận đẹp với các ô vuông hoặc dấu chấm so sánh từng dv giữa các nhóm dọc theo đường chéo và các biểu đồ phân tán cho từng cặp dv (một lần nữa phân biệt các nhóm) trong các ô khác. Và thành thật mà nói, đối với một phân tích thăm dò với kích thước mẫu nhỏ, đó cũng có thể là bước cuối cùng.
Scortchi - Phục hồi Monica

1

Đầu tiên, như Scortchi đã chỉ ra, thử nghiệm T không phù hợp với dữ liệu của bạn, vì các giả định của nó về phân phối dữ liệu.

Đến điểm thứ hai của bạn, tôi sẽ đề xuất một giải pháp thay thế cho bài kiểm tra T. Nếu sở thích của bạn chỉ là về thực tế, nếu phân phối của hai mẫu của bạn bằng nhau hay không, bạn cũng có thể thử sử dụng phiên bản hai mặt của bài kiểm tra tổng xếp hạng Wilcoxon. Bài kiểm tra tổng xếp hạng Wilcoxon là bài kiểm tra không tham số. Loại thử nghiệm này đặc biệt hữu ích, nếu bạn không chắc chắn về phân phối cơ bản của dữ liệu của mình.

Nó tồn tại một giải pháp chính xác của thử nghiệm cho các cỡ mẫu nhỏ cũng như cho các đoàn hệ lớn. Ngoài ra, còn tồn tại một gói R thực hiện kiểm tra tổng xếp hạng Wilcoxon.

Vì nó là một thử nghiệm miễn phí tham số và cũng xử lý các cỡ mẫu nhỏ, thử nghiệm phải phù hợp với trường hợp thử nghiệm của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.