Tôi sẽ loại bỏ tất cả các chi tiết sinh học và thí nghiệm và chỉ trích dẫn vấn đề trong tay và những gì tôi đã làm được theo thống kê. Tôi muốn biết nếu nó đúng, và nếu không, làm thế nào để tiến hành. Nếu dữ liệu (hoặc giải thích của tôi) không đủ rõ ràng, tôi sẽ cố gắng giải thích rõ hơn bằng cách chỉnh sửa.
Giả sử tôi có hai nhóm / quan sát, X và Y, với kích thước và . Tôi muốn biết nếu phương tiện của hai quan sát này là bằng nhau. Câu hỏi đầu tiên của tôi là:
Nếu các giả định được thỏa mãn, có liên quan để sử dụng thử nghiệm t hai mẫu tham số ở đây không? Tôi hỏi điều này bởi vì theo hiểu biết của tôi, nó thường được áp dụng khi kích thước nhỏ?
Tôi đã vẽ sơ đồ biểu đồ của cả X và Y và chúng không được phân phối bình thường, một trong những giả định của thử nghiệm t hai mẫu. Sự nhầm lẫn của tôi là, tôi coi chúng là hai quần thể và đó là lý do tại sao tôi kiểm tra phân phối bình thường. Nhưng sau đó tôi chuẩn bị thực hiện bài kiểm tra hai MẪU ... Điều này có đúng không?
Từ định lý giới hạn trung tâm, tôi hiểu rằng nếu bạn thực hiện lấy mẫu (có / không lặp lại tùy thuộc vào kích thước dân số của bạn) nhiều lần và tính trung bình của các mẫu mỗi lần, thì nó sẽ được phân phối bình thường. Và, giá trị trung bình của các biến ngẫu nhiên này sẽ là một ước tính tốt về trung bình dân số. Vì vậy, tôi đã quyết định làm điều này trên cả X và Y, 1000 lần và thu được các mẫu và tôi đã chỉ định một biến ngẫu nhiên cho giá trị trung bình của từng mẫu. Cốt truyện được phân phối rất bình thường. Giá trị trung bình của X và Y là 4.2 và 15.8 (tương đương với dân số + - 0,15) và phương sai là 0,95 và 12,11.
Tôi đã thực hiện một bài kiểm tra t trên hai quan sát này (mỗi điểm 1000 dữ liệu) với phương sai không bằng nhau, vì chúng rất khác nhau (0,95 và 12,11). Và giả thuyết khống đã bị bác bỏ.
Điều này có ý nghĩa gì không? Đây là cách tiếp cận đúng / có ý nghĩa hay một bài kiểm tra z hai mẫu là đủ hay nó hoàn toàn sai?Tôi cũng đã thực hiện một thử nghiệm Wilcoxon không tham số để chắc chắn (trên X và Y gốc) và giả thuyết khống cũng bị từ chối một cách thuyết phục. Trong trường hợp phương pháp trước đây của tôi hoàn toàn sai, tôi cho rằng làm một bài kiểm tra không tham số là tốt, ngoại trừ khả năng thống kê có thể?
Trong cả hai trường hợp, các phương tiện đều khác nhau đáng kể. Tuy nhiên, tôi muốn biết liệu một trong hai hoặc cả hai cách tiếp cận đều bị lỗi / hoàn toàn sai và nếu vậy, phương án thay thế là gì?