Vì cuộc thảo luận đã kéo dài, tôi đã trả lời câu trả lời của mình. Nhưng tôi đã thay đổi thứ tự.
Các xét nghiệm hoán vị là "chính xác", chứ không phải là không có triệu chứng (ví dụ, so với các thử nghiệm tỷ lệ khả năng). Vì vậy, ví dụ, bạn có thể thực hiện kiểm tra phương tiện ngay cả khi không thể tính toán phân phối chênh lệch về phương tiện theo giá trị null; bạn thậm chí không cần chỉ định các bản phân phối liên quan. Bạn có thể thiết kế một thống kê kiểm tra có sức mạnh tốt theo một nhóm các giả định mà không nhạy cảm với chúng như một giả định tham số đầy đủ (bạn có thể sử dụng một thống kê mạnh mẽ nhưng có IS tốt).
Lưu ý rằng các định nghĩa bạn đưa ra (hoặc đúng hơn, bất cứ ai bạn trích dẫn ở đó) không phổ biến; một số người sẽ gọi U là thống kê kiểm tra hoán vị (điều làm cho kiểm tra hoán vị không phải là thống kê mà là cách bạn đánh giá giá trị p). Nhưng một khi bạn đang thực hiện kiểm tra hoán vị và bạn đã chỉ định một hướng là 'cực trị của điều này không phù hợp với H0', thì định nghĩa đó cho T ở trên về cơ bản là cách bạn thực hiện các giá trị p - đó chỉ là tỷ lệ thực tế của phân phối hoán vị ít nhất là cực trị như mẫu dưới giá trị null (định nghĩa của giá trị p).
Vì vậy, ví dụ, nếu tôi muốn thực hiện một thử nghiệm phương tiện (một đuôi, vì đơn giản) như thử nghiệm t hai mẫu, tôi có thể biến thống kê của mình thành tử số của thống kê t, hoặc chính thống kê t, hoặc tổng của mẫu đầu tiên (mỗi định nghĩa đó là đơn điệu trong các mẫu khác, có điều kiện trên mẫu kết hợp) hoặc bất kỳ phép biến đổi đơn điệu nào của chúng và có cùng một phép thử, vì chúng mang lại giá trị p giống hệt nhau. Tất cả những gì tôi cần làm là xem khoảng cách (về tỷ lệ) phân phối hoán vị của bất kỳ thống kê nào tôi chọn cách nói dối thống kê mẫu. T như được định nghĩa ở trên chỉ là một thống kê khác, tốt như bất kỳ thống kê nào khác tôi có thể chọn (T như được định nghĩa là có đơn điệu trong U).
T sẽ không chính xác, bởi vì điều đó đòi hỏi phải phân phối liên tục và T nhất thiết phải rời rạc. Bởi vì U và do đó T có thể ánh xạ nhiều hơn một hoán vị theo một thống kê nhất định, các kết quả không thể xảy ra bằng nhau, nhưng chúng có một cdf ** "giống như thống nhất", nhưng một trong đó các bước không nhất thiết phải có kích thước bằng nhau .
** ( và hoàn toàn bằng với nó ở đúng giới hạn của mỗi lần nhảy - có thể có một tên cho những gì thực sự là)F(x)≤x
Để thống kê hợp lý khi đi đến vô cùng, sự phân bố của tiếp cận tính đồng nhất. Tôi nghĩ rằng cách tốt nhất để bắt đầu hiểu họ là thực sự làm chúng trong nhiều tình huống khác nhau. nT
T (X) có nên bằng giá trị p dựa trên U (X) cho bất kỳ mẫu X nào không? Nếu tôi hiểu chính xác, tôi đã tìm thấy nó trên trang 5 của slide này.
T là giá trị p (đối với trường hợp U lớn biểu thị độ lệch so với null và U nhỏ phù hợp với nó). Lưu ý rằng phân phối là có điều kiện trên mẫu. Vì vậy, phân phối của nó không phải là 'cho bất kỳ mẫu nào'.
Vì vậy, lợi ích của việc sử dụng phép thử hoán vị là tính giá trị p của thống kê kiểm tra gốc U mà không biết phân phối X theo null? Do đó, sự phân bố của T (X) có thể không nhất thiết phải thống nhất?
Tôi đã giải thích rằng T không đồng đều.
Tôi nghĩ rằng tôi đã giải thích những gì tôi thấy là lợi ích của các bài kiểm tra hoán vị; những người khác sẽ đề xuất những lợi thế khác ( ví dụ ).
Có phải "T là giá trị p (đối với trường hợp U lớn biểu thị độ lệch so với null và U nhỏ phù hợp với nó)", có nghĩa là giá trị p cho thống kê kiểm tra U và mẫu X là T (X) không? Tại sao? Có một số tài liệu tham khảo để giải thích điều đó?
Câu bạn trích dẫn nói rõ rằng T là giá trị p và khi nào nó là. Nếu bạn có thể giải thích những gì không rõ ràng về nó có lẽ tôi có thể nói nhiều hơn. Về lý do tại sao, hãy xem định nghĩa của giá trị p (câu đầu tiên tại liên kết) - nó hoàn toàn trực tiếp theo đó
Có một cuộc thảo luận cơ bản tốt về các bài kiểm tra hoán vị ở đây .
-
Chỉnh sửa: Tôi thêm vào đây một ví dụ kiểm tra hoán vị nhỏ; mã (R) này chỉ phù hợp với các mẫu nhỏ - bạn cần các thuật toán tốt hơn để tìm các kết hợp cực đoan trong các mẫu vừa phải.
Xem xét một thử nghiệm hoán vị đối với một thay thế một đuôi:
H0:μx=μy (một số người nhấn mạnh vào *)μx≥μy
H1:μx<μy
* nhưng tôi thường tránh nó bởi vì nó đặc biệt có xu hướng gây nhầm lẫn vấn đề cho sinh viên khi cố gắng phân phối null
trên dữ liệu sau:
> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99
Có 35 cách chia 7 quan sát thành các mẫu có kích thước 3 và 4:
> choose(7,3)
[1] 35
Như đã đề cập trước đây, với 7 giá trị dữ liệu, tổng của mẫu đầu tiên là đơn điệu về sự khác biệt về phương tiện, vì vậy hãy sử dụng nó làm thống kê kiểm tra. Vì vậy, mẫu ban đầu có một thống kê kiểm tra:
> sum(x)
[1] 64.77
Bây giờ đây là phân phối hoán vị:
> sort(apply(combn(c(x,y),3),2,sum))
[1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07
(Không cần thiết phải sắp xếp chúng, tôi chỉ làm vậy để dễ dàng thấy thống kê kiểm tra là giá trị thứ hai từ cuối.)
Chúng ta có thể thấy (trong trường hợp này bằng cách kiểm tra) rằng là 2/35, hoặcp
> 2/35
[1] 0.05714286
(Lưu ý rằng chỉ trong trường hợp không có sự trùng lặp xy là giá trị p dưới 0,05 có thể có ở đây. Trong trường hợp này, sẽ là thống nhất rời rạc vì không có giá trị ràng buộc nào trong )TU
Mũi tên màu hồng biểu thị thống kê mẫu trên trục x và giá trị p trên trục y.