Lợi ích của việc sử dụng các xét nghiệm hoán vị là gì?

Khi kiểm tra một số giả thuyết không so với giải pháp thay thế bằng thống kê kiểm tra , trong đó , hãy áp dụng thử nghiệm hoán vị với tập hợp hoán vị trên và chúng ta có một thống kê $U(X)$ $X = \{ x_i, ..., x_n\}$ $G$ $X$

T (X) := \frac{# {π \in G : U (π X) \geq U (X)}}{| G |} .

$T(X) := \frac{\# \{\pi \in G: U(\pi X) \geq U(X)\}}{|G|}.$

Lợi ích của việc sử dụng thử nghiệm hoán vị so với việc không sử dụng nó là gì? Tức là nó như thế nào khi thử nghiệm hoán vị hoạt động?
Điều kiện nào để thực hiện điều đó? Chẳng hạn như một số điều kiện trên thống kê kiểm tra và / hoặc trên giả thuyết null? $U$

Ví dụ,

Có nên bằng với giá trị p dựa trên , cho mẫu ? Nếu đúng thì tại sao? (tài liệu tham khảo cũng được đánh giá cao) $T(X)$ $U(X)$ $X$

Giá trị p của được định nghĩa là . Nếu kiểm tra hoán vị là để ước tính phân phối hoán vị của , làm thế nào bằng giá trị p của tại ? Đặc biệt, có thể có nhiều hơn một bản phân phối trong null và không xem xét các bản phân phối null từng cái một và sau đó lấy và . $U(X)$
$inf_{c \in R : U (x) \geq c} sup_{F \in H} P (U (X) \geq c | X \sim F)$ $\inf_{c \in \mathbb R: U(x) \geq c} \sup_{F \in H} P(U(X) \geq c | X \sim F)$ $U(X) | X=x$ $T(X)$ $U(X)$ $X=x$ $H$ $T(X)$ $\sup_{F\in H}$ $\inf_{c: U(x) \geq c}$
Thử nghiệm hoán vị có làm cho $T(X)$ phân phối trên các giả thuyết không? Điều kiện nào sẽ làm điều đó xảy ra?
Có nên $T(X)$ được phân bố đều trên $[0,1]$ ? Điều kiện nào sẽ làm điều đó xảy ra? Lưu ý rằng khi $U(\cdot)$ là hàm hằng, $T(\cdot)$ cũng không đổi ở $1$ và phân bố của $T(X)$ không đồng đều trên $[0,1]$ .

Cảm ơn và trân trọng!

— Tim
nguồn

@Glen_b: Cảm ơn! Có nên bằng với giá trị p dựa trên , đối với bất kỳ mẫu ? Nếu tôi hiểu chính xác, tôi đã tìm thấy nó ở trang 5 của trang trình bày này. Vì vậy, lợi ích của việc sử dụng phép thử hoán vị là tính giá trị p của thống kê kiểm tra ban đầu mà không biết phân phối theo null? Do đó, sự phân bố của có thể không nhất thiết phải thống nhất?

T (X)

$T(X)$

U (X)

$U(X)$

X

$X$

U

$U$

X

$X$

T (X)

$T(X)$

— Tim

Có phải "T là giá trị p (đối với trường hợp U lớn biểu thị độ lệch so với null và U nhỏ phù hợp với nó)", có nghĩa là giá trị p cho thống kê kiểm tra và mẫu là không?

U

$U$

X

$X$

T (X)

$T(X)$

— Tim

Tại sao? Có một số tài liệu tham khảo để giải thích điều đó?

— Tim

Vì cuộc thảo luận đã kéo dài, tôi đã trả lời câu trả lời của mình. Nhưng tôi đã thay đổi thứ tự.

Các xét nghiệm hoán vị là "chính xác", chứ không phải là không có triệu chứng (ví dụ, so với các thử nghiệm tỷ lệ khả năng). Vì vậy, ví dụ, bạn có thể thực hiện kiểm tra phương tiện ngay cả khi không thể tính toán phân phối chênh lệch về phương tiện theo giá trị null; bạn thậm chí không cần chỉ định các bản phân phối liên quan. Bạn có thể thiết kế một thống kê kiểm tra có sức mạnh tốt theo một nhóm các giả định mà không nhạy cảm với chúng như một giả định tham số đầy đủ (bạn có thể sử dụng một thống kê mạnh mẽ nhưng có IS tốt).

Lưu ý rằng các định nghĩa bạn đưa ra (hoặc đúng hơn, bất cứ ai bạn trích dẫn ở đó) không phổ biến; một số người sẽ gọi U là thống kê kiểm tra hoán vị (điều làm cho kiểm tra hoán vị không phải là thống kê mà là cách bạn đánh giá giá trị p). Nhưng một khi bạn đang thực hiện kiểm tra hoán vị và bạn đã chỉ định một hướng là 'cực trị của điều này không phù hợp với H0', thì định nghĩa đó cho T ở trên về cơ bản là cách bạn thực hiện các giá trị p - đó chỉ là tỷ lệ thực tế của phân phối hoán vị ít nhất là cực trị như mẫu dưới giá trị null (định nghĩa của giá trị p).

Vì vậy, ví dụ, nếu tôi muốn thực hiện một thử nghiệm phương tiện (một đuôi, vì đơn giản) như thử nghiệm t hai mẫu, tôi có thể biến thống kê của mình thành tử số của thống kê t, hoặc chính thống kê t, hoặc tổng của mẫu đầu tiên (mỗi định nghĩa đó là đơn điệu trong các mẫu khác, có điều kiện trên mẫu kết hợp) hoặc bất kỳ phép biến đổi đơn điệu nào của chúng và có cùng một phép thử, vì chúng mang lại giá trị p giống hệt nhau. Tất cả những gì tôi cần làm là xem khoảng cách (về tỷ lệ) phân phối hoán vị của bất kỳ thống kê nào tôi chọn cách nói dối thống kê mẫu. T như được định nghĩa ở trên chỉ là một thống kê khác, tốt như bất kỳ thống kê nào khác tôi có thể chọn (T như được định nghĩa là có đơn điệu trong U).

T sẽ không chính xác, bởi vì điều đó đòi hỏi phải phân phối liên tục và T nhất thiết phải rời rạc. Bởi vì U và do đó T có thể ánh xạ nhiều hơn một hoán vị theo một thống kê nhất định, các kết quả không thể xảy ra bằng nhau, nhưng chúng có một cdf ** "giống như thống nhất", nhưng một trong đó các bước không nhất thiết phải có kích thước bằng nhau .

** ( và hoàn toàn bằng với nó ở đúng giới hạn của mỗi lần nhảy - có thể có một tên cho những gì thực sự là) $F(x)\leq x$

Để thống kê hợp lý khi đi đến vô cùng, sự phân bố của tiếp cận tính đồng nhất. Tôi nghĩ rằng cách tốt nhất để bắt đầu hiểu họ là thực sự làm chúng trong nhiều tình huống khác nhau. $n$ $T$

T (X) có nên bằng giá trị p dựa trên U (X) cho bất kỳ mẫu X nào không? Nếu tôi hiểu chính xác, tôi đã tìm thấy nó trên trang 5 của slide này.

T là giá trị p (đối với trường hợp U lớn biểu thị độ lệch so với null và U nhỏ phù hợp với nó). Lưu ý rằng phân phối là có điều kiện trên mẫu. Vì vậy, phân phối của nó không phải là 'cho bất kỳ mẫu nào'.

Vì vậy, lợi ích của việc sử dụng phép thử hoán vị là tính giá trị p của thống kê kiểm tra gốc U mà không biết phân phối X theo null? Do đó, sự phân bố của T (X) có thể không nhất thiết phải thống nhất?

Tôi đã giải thích rằng T không đồng đều.

Tôi nghĩ rằng tôi đã giải thích những gì tôi thấy là lợi ích của các bài kiểm tra hoán vị; những người khác sẽ đề xuất những lợi thế khác ( ví dụ ).

Có phải "T là giá trị p (đối với trường hợp U lớn biểu thị độ lệch so với null và U nhỏ phù hợp với nó)", có nghĩa là giá trị p cho thống kê kiểm tra U và mẫu X là T (X) không? Tại sao? Có một số tài liệu tham khảo để giải thích điều đó?

Câu bạn trích dẫn nói rõ rằng T là giá trị p và khi nào nó là. Nếu bạn có thể giải thích những gì không rõ ràng về nó có lẽ tôi có thể nói nhiều hơn. Về lý do tại sao, hãy xem định nghĩa của giá trị p (câu đầu tiên tại liên kết) - nó hoàn toàn trực tiếp theo đó

Có một cuộc thảo luận cơ bản tốt về các bài kiểm tra hoán vị ở đây .

Chỉnh sửa: Tôi thêm vào đây một ví dụ kiểm tra hoán vị nhỏ; mã (R) này chỉ phù hợp với các mẫu nhỏ - bạn cần các thuật toán tốt hơn để tìm các kết hợp cực đoan trong các mẫu vừa phải.

Xem xét một thử nghiệm hoán vị đối với một thay thế một đuôi:

$H_0: \mu_x = \mu_y$ (một số người nhấn mạnh vào *) $\mu_x \geq \mu_y$
$H_1: \mu_x < \mu_y$

* nhưng tôi thường tránh nó bởi vì nó đặc biệt có xu hướng gây nhầm lẫn vấn đề cho sinh viên khi cố gắng phân phối null

trên dữ liệu sau:

> x;y
[1] 25.17 20.57 19.03
[1] 25.88 25.20 23.75 26.99

Có 35 cách chia 7 quan sát thành các mẫu có kích thước 3 và 4:

> choose(7,3)
[1] 35

Như đã đề cập trước đây, với 7 giá trị dữ liệu, tổng của mẫu đầu tiên là đơn điệu về sự khác biệt về phương tiện, vì vậy hãy sử dụng nó làm thống kê kiểm tra. Vì vậy, mẫu ban đầu có một thống kê kiểm tra:

> sum(x)
[1] 64.77

Bây giờ đây là phân phối hoán vị:

> sort(apply(combn(c(x,y),3),2,sum))
 [1] 63.35 64.77 64.80 65.48 66.59 67.95 67.98 68.66 69.40 69.49 69.52 69.77
[13] 70.08 70.11 70.20 70.94 71.19 71.22 71.31 71.62 71.65 71.90 72.73 72.76
[25] 73.44 74.12 74.80 74.83 75.91 75.94 76.25 76.62 77.36 78.04 78.07

(Không cần thiết phải sắp xếp chúng, tôi chỉ làm vậy để dễ dàng thấy thống kê kiểm tra là giá trị thứ hai từ cuối.)

Chúng ta có thể thấy (trong trường hợp này bằng cách kiểm tra) rằng là 2/35, hoặc $p$

> 2/35
[1] 0.05714286

(Lưu ý rằng chỉ trong trường hợp không có sự trùng lặp xy là giá trị p dưới 0,05 có thể có ở đây. Trong trường hợp này, sẽ là thống nhất rời rạc vì không có giá trị ràng buộc nào trong ) $T$ $U$

phân phối hoán vị

Mũi tên màu hồng biểu thị thống kê mẫu trên trục x và giá trị p trên trục y.

— Glen_b -Reinstate Monica
nguồn

Cảm ơn! Vì vậy, về cơ bản, kiểm tra hoán vị được sử dụng để ước tính phân phối dưới phân phối null của , phải không? Vậy phụ thuộc vào phân phối null của , nhưng giá trị p là inf của tỷ lệ FP trên tất cả các phân phối null của và là giá trị p cho và ?

U (X)

$U(X)$

X

$X$

T (X)

$T(X)$

X

$X$

X

$X$

T (X)

$T(X)$

U

$U$

X

$X$

— Tim

Nó ước tính phân phối hoán vị của . Đó là thực tế rằng bạn coi tất cả các hoán vị đều có khả năng như nhau làm cho nó "dưới giá trị rỗng" (vì dưới null, các hoán vị sẽ có khả năng như nhau).

U (X) | X = x

$U(X)|X=x$

— Glen_b -Reinstate Monica

(1) Giá trị p của được định nghĩa là . Nếu kiểm tra hoán vị là để ước tính phân phối hoán vị của , làm thế nào bằng giá trị p của tại ? Đặc biệt, có thể có nhiều hơn một bản phân phối trong null và không xem xét các bản phân phối null từng cái một và sau đó lấy và . (2) có phân phối giống nhau cho tất cả các bản phân phối null hay không, tức là không có bản phân phối wrt null?

U (X)

$U(X)$

inf_{c \in R : U (x) \geq c} sup_{F \in H} P (U (X) \geq c | X \sim F)

$\inf_{c \in \mathbb R: U(x) \geq c} \sup_{F \in H} P(U(X) \geq c | X \sim F)$

U (X) | X = x

$U(X) | X=x$

T (X)

$T(X)$

U (X)

$U(X)$

X = x

$X=x$

H

$H$

T (X)

$T(X)$

sup_{F \in H}

$\sup_{F\in H}$

inf_{c : U (x) \geq c}

$\inf_{c: U(x) \geq c}$

T (X)

$T(X)$

— Tim

Đã thêm vào (1), kiểm tra hoán vị không chỉ áp dụng cho các null đơn giản mà còn cho các null tổng hợp, phải không?

— Tim

(1) Xác định ở đâu? Đó có vẻ là một định nghĩa kỳ lạ. Tại sao bạn chỉ định phân phối X? Bạn đang điều hòa trên . Sự nhầm lẫn của bạn dường như xuất phát từ định nghĩa khá kỳ lạ đó. (2) không có ý nghĩa gì với tôi cả.

X = x

$X=x$

— Glen_b -Reinstate Monica