Đánh giá về khoảng cách bình thường đối với các bài kiểm tra t


12

Tôi đang kiểm tra sự bình đẳng của các phương tiện bằng cách sử dụng kiểm tra t của Welch. Phân phối cơ bản khác xa so với bình thường (sai lệch nhiều hơn so với ví dụ trong một cuộc thảo luận liên quan ở đây ). Tôi có thể có được nhiều dữ liệu hơn nhưng muốn có một số cách xác định nguyên tắc ở mức độ nào để làm như vậy.

  1. Có một heuristic tốt để thực hiện đánh giá rằng phân phối mẫu là chấp nhận được? Những sai lệch so với tính quy phạm là quan tâm nhất?
  2. Có cách tiếp cận nào khác không - ví dụ dựa vào khoảng tin cậy của bootstrap cho thống kê mẫu - sẽ có ý nghĩa hơn?

2
Đâ là một câu hỏi tuyệt vời. Ngoài việc kiểm tra tính quy phạm "về cơ bản là vô dụng"? (đã được liên kết), hai câu hỏi liên quan khác là Làm thế nào để chọn giữa kiểm tra t hoặc kiểm tra không tham số, ví dụ Wilcoxon trong các mẫu nhỏ? T-test cho không bình thường khi N> 50? Một câu trả lời tốt cho câu hỏi này có khả năng có giá trị đối với độc giả của hai câu hỏi liên quan này.
Cá bạc

Theo như tôi biết thì không có bất kỳ cách nguyên tắc nào để xác định lượng dữ liệu bạn cần cho phân phối là "đủ bình thường". Điều này là do "đủ bình thường" rất khó xác định và sẽ phụ thuộc vào mức độ không bình thường của phân phối cơ bản, ngoài cách cụ thể mà bạn khởi hành từ quy tắc. Nếu bạn có dữ liệu không bình thường nghiêm túc, tôi chỉ sử dụng một thử nghiệm không tham số thay thế. Nhược điểm là bạn sẽ không thể có được khoảng tin cậy hữu ích hơn các thử nghiệm giả thuyết đơn độc.
DSaxton

2
Tôi đồng ý rằng "đủ bình thường" là khó xác định, nhưng mọi học viên phải đưa ra đánh giá trước khi suy luận về dữ liệu thực nghiệm, đó là lý do tại sao tôi ngạc nhiên khi tôi có thể phát hiện ra ít thảo luận (có lẽ tôi đang tìm sai chỗ) . Đối với các trường hợp sử dụng, tôi có ý định ở đây (cảm thấy đủ phổ biến) các thử nghiệm không tham số là không thỏa đáng so với việc thu thập thêm dữ liệu để đảm bảo phân phối lấy mẫu "đủ bình thường".
cohoz

Câu trả lời:


1

Vì thử nghiệm t giả định tính quy tắc và các phân phối cơ bản của bạn không bình thường, không thể có một cách xác định nguyên tắc rằng phân phối mẫu có thể chấp nhận được. Tuy nhiên, khi kích thước mẫu trở nên "lớn", Định lý giới hạn trung tâm bắt đầu và bạn có thể sử dụng phép thử z mẫu lớn, về cơ bản sẽ cho bạn câu trả lời giống như một tt tiếp cận phân phối bình thường với mẫu lớn.

Số liệu thống kê sách / khóa học thường ngụ ý rằng ở cỡ mẫu 25 hoặc 30 CLT được sử dụng theo cách hữu ích. Tuy nhiên, kinh nghiệm của tôi là ngay cả với kích thước mẫu trong hàng trăm thử nghiệm z mẫu lớn vẫn có thể khá kém (ví dụ: với dữ liệu đếm).

Theo tôi, một bài kiểm tra hoán vị rất phù hợp với vấn đề của bạn. Nó nên có sức mạnh tương đương hoặc tốt hơn so với các bài kiểm tra không tham số đóng hộp (ví dụ: Mann-Whitney) và bạn không phải lo lắng về vấn đề quy tắc. Và, họ rất vui khi viết.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.