Tôi có dữ liệu cho hai nhóm (tức là các mẫu) tôi muốn so sánh nhưng tổng kích thước mẫu là nhỏ (n = 29) và không cân bằng mạnh (n = 22 so với n = 7).
Những dữ liệu này rất khó thu thập và tốn kém về mặt logic, vì vậy trong khi 'thu thập thêm dữ liệu' vì một giải pháp rõ ràng không hữu ích trong trường hợp này.
Một số biến số khác nhau đã được đo (ngày khởi hành, ngày đến, thời gian di chuyển, v.v.) vì vậy có nhiều thử nghiệm, một số biến thể rất khác nhau (mẫu nhỏ hơn có phương sai cao hơn).
Ban đầu, một đồng nghiệp đã chạy thử nghiệm t trên các dữ liệu này và một số có ý nghĩa thống kê với P <0,001, một số khác không có ý nghĩa với P = 0,069. Một số mẫu được phân phối bình thường, một số khác thì không. Một số thử nghiệm liên quan đến khởi hành lớn từ phương sai 'bằng nhau'.
Tôi có một số câu hỏi:
- các bài kiểm tra t thích hợp ở đây? Nếu không, tại sao? Có phải điều này chỉ áp dụng cho các thử nghiệm trong đó các giả định về tính quy tắc và đẳng thức của phương sai được thỏa mãn?
- một sự thay thế phù hợp là gì? Có lẽ một bài kiểm tra hoán vị?
- phương sai không bằng nhau làm tăng lỗi loại I, nhưng làm thế nào? và cỡ mẫu nhỏ, không cân bằng có ảnh hưởng gì đến lỗi Loại I?