Trực giác đằng sau các mẫu trao đổi theo giả thuyết null là gì?


15

Các thử nghiệm hoán vị (còn gọi là thử nghiệm ngẫu nhiên, thử nghiệm ngẫu nhiên lại hoặc thử nghiệm chính xác) rất hữu ích và có ích khi giả định phân phối bình thường theo yêu cầu, t-testkhông được đáp ứng và khi chuyển đổi các giá trị theo xếp hạng của kiểm tra không tham số như thế Mann-Whitney-U-testsẽ dẫn đến nhiều thông tin bị mất. Tuy nhiên, không nên bỏ qua một và một giả định khi sử dụng loại thử nghiệm này là giả định về khả năng trao đổi của các mẫu theo giả thuyết null. Điều đáng chú ý là cách tiếp cận này cũng có thể được áp dụng khi có nhiều hơn hai mẫu giống như những gì được thực hiện trong coingói R.

Bạn có thể vui lòng sử dụng một số ngôn ngữ tượng hình hoặc trực giác khái niệm bằng tiếng Anh đơn giản để minh họa cho giả định này? Điều này sẽ rất hữu ích để làm rõ vấn đề bị bỏ qua này trong số những người không thống kê như tôi.

Lưu ý:
Sẽ rất hữu ích khi đề cập đến trường hợp áp dụng thử nghiệm hoán vị không giữ hoặc không hợp lệ theo cùng một giả định.

Cập nhật:
Supppose rằng tôi có 50 đối tượng được thu thập từ phòng khám địa phương trong quận của tôi một cách ngẫu nhiên. Họ được chỉ định ngẫu nhiên để nhận thuốc hoặc giả dược theo tỷ lệ 1: 1. Tất cả đều được đo cho tham số 1 Par1ở mức V1 (đường cơ sở), V2 (3 tháng sau) và V3 (1 năm sau). Tất cả 50 đối tượng có thể được phân nhóm thành 2 nhóm dựa trên tính năng A; A positive = 20 và A neg = 30. Họ cũng có thể được phân nhóm thành 2 nhóm khác dựa trên tính năng B; B positive = 15 và B neg = 35.
Bây giờ, tôi có các giá trị Par1từ tất cả các đối tượng tại tất cả các lượt truy cập. Theo giả định về khả năng trao đổi, tôi có thể so sánh giữa các cấp độ Par1sử dụng thử nghiệm hoán vị nếu tôi muốn:
- So sánh đối tượng với thuốc với những người dùng giả dược ở V2?
- So sánh các đối tượng với tính năng A với những đối tượng có tính năng B ở V2?
- So sánh các đối tượng có tính năng A ở V2 với những đối tượng có tính năng A nhưng ở V3?
- Trong trường hợp nào sự so sánh này sẽ không hợp lệ và sẽ vi phạm giả định về khả năng trao đổi?

hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

4
Giả sử tôi có từng quan sát trên một tờ giấy rời và khi tôi đưa cho bạn chồng, tôi trượt, và các tờ giấy bay ra theo mọi hướng khi chúng nằm xuống sàn. Sẽ là một sự xấu hổ nếu điều đó phá hủy tính hợp lệ của bài kiểm tra mà bạn đang hy vọng thực hiện trên những dữ liệu đó. Nếu các quan sát của bạn có thể trao đổi và bạn đang áp dụng một bài kiểm tra dựa trên điều đó, bạn sẽ an ủi tôi và bảo tôi đừng lo lắng trong khi giúp tôi thu thập các giấy tờ trên sàn. Nếu không, và việc thu thập dữ liệu đặc biệt tốn kém, tôi có thể cần phải chạy cho cuộc sống của mình.
Đức hồng y

2
Mặt khác, thứ tự không thành vấn đề đối với những thứ như dữ liệu chuỗi thời gian (nói chung) và các thử nghiệm thường phải tôn trọng thứ tự này theo một cách thích hợp.
Đức hồng y

@cardinal, trong khi câu chuyện trực quan của bạn đã vẽ ra một bức tranh sống động về giả định này trông như thế nào, nhưng tôi vẫn bối rối khi đánh giá xem các giấy tờ có giá trị có thể trao đổi được hay không. Bạn có thể chạy cho một bình luận khác nếu có thể!
tiến sĩ

Câu trả lời:


7

fXYZ(x= =1,y= =3,z= =2)= =fXYZ(x= =3,y= =2,z= =1), Vân vân). Nếu đây không phải là trường hợp thì đếm hoán vị không phải là một cách hợp lệ để kiểm tra giả thuyết null, vì mỗi hoán vị sẽ có trọng số (xác suất / mật độ) khác nhau. Kiểm tra hoán vị phụ thuộc vào mỗi lần gán của một tập hợp nhất định các giá trị số đã cho cho các biến của bạn có cùng mật độ / xác suất.

f(x1= =1,x2= =2,X3= =3 ...XN= =N)f(x1= =N,x2= =N-1,X3= =N-2 ...XN= =1)


+1, mặc dù khả năng trao đổi được giải thích tốt nhưng tôi vẫn bị vấp ngã khi cố gắng áp dụng phép ẩn dụ trong lọ trong nghiên cứu. (vui lòng xem cập nhật của câu hỏi). Dựa vào thời lượng truy cập và phân nhóm dựa trên các tính năng, làm cách nào tôi có thể đánh giá liệu việc so sánh các giá trị này có thể trao đổi được hay không?
tiến sĩ

@doctorate: có vẻ như bạn đang phân tầng các nhóm của mình theo các yếu tố có liên quan đến kết quả của Par1, đúng không? Miễn là bạn đang sử dụng hoán vị trong một góc phần tư A / B cụ thể, thì tôi sẽ cho rằng các đối tượng của bạn có thể trao đổi. Thử nghiệm đầu tiên của bạn, sẽ cắt ngang các tính năng, sẽ cần được xử lý thêm trước khi bạn có thể sử dụng thử nghiệm dựa trên khả năng trao đổi. cụ thể, bạn cần định lượng hiệu quả của việc điều trị và khắc phục các tác động gây nhiễu của các tính năng A và B - nếu không, kích thước goup sẽ ảnh hưởng đến kết quả chung (nghịch lý của simpson)

1
@doctorate: Tôi nhận ra rằng nhận xét trên của tôi có thể là loại xiên viết những gì bạn muốn: các lọ trong trường hợp của bạn sẽ là các cặp tính năng, tức là (A +, B +), (A-, B +), (A +, B -), (B-, A-) cho tổng số 4 "lọ". Điều đó có giúp làm cho nó cụ thể hơn?

Tks, nhưng điều gây nhầm lẫn cho những người không thống kê như tôi, là làm thế nào người ta có thể đánh giá liệu giả định này có được đáp ứng hay không? thường có các bài kiểm tra để kiểm tra các giả định, ví dụ, đối với tính quy tắc có bài kiểm tra Shapiro-Wilk. Nhưng tôi tự hỏi những gì kiểm tra sẽ kiểm tra khả năng trao đổi? nếu không, nó sẽ rất khó hoặc định nghĩa mơ hồ và hai nhà thống kê có thể không đồng ý về điều này hoặc phân nhóm đó. Như bạn đã đề cập, trong góc phần tư A / B không có vấn đề gì, nhưng trong Thuốc / Bảng giả dược, bạn đã cho thấy một số lo ngại. Vì vậy, có bất kỳ thử nghiệm axit cho giả định này?
tiến sĩ

2
Về khả năng trao đổi, không có "thử nghiệm" nào về khả năng trao đổi. Không giống như tính độc lập (có thể kiểm chứng), khả năng trao đổi giống như một giả định mô hình hóa mà bạn đã lấy các mẫu lặp đi lặp lại giống như mẫu bạn đã lấy, bạn sẽ thấy rằng mỗi hoán vị xảy ra chính xác cùng một phần thời gian. Bạn chỉ có 1 mẫu, vì vậy bạn không thể "kiểm tra" nó.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.