Cách so sánh giá trị trung bình của hai mẫu có dữ liệu phù hợp với phân bố mũ


10

Tôi có hai mẫu dữ liệu, mẫu cơ sở và mẫu điều trị.

Giả thuyết là mẫu điều trị có giá trị trung bình cao hơn mẫu cơ sở.

Cả hai mẫu đều có hình mũ. Vì dữ liệu khá lớn, tôi chỉ có giá trị trung bình và số lượng phần tử cho mỗi mẫu tại thời điểm tôi sẽ chạy thử nghiệm.

Làm thế nào tôi có thể kiểm tra giả thuyết đó? Tôi đoán rằng nó cực dễ, và tôi đã bắt gặp một số tài liệu tham khảo để sử dụng F-Test, nhưng tôi không chắc bản đồ tham số như thế nào.


2
Tại sao bạn không có dữ liệu? Nếu các mẫu thực sự lớn, các thử nghiệm không tham số sẽ hoạt động tốt, nhưng có vẻ như bạn đang cố gắng chạy thử nghiệm từ các thống kê tóm tắt. Có đúng không?
Bắt chước

Là các giá trị cơ bản và điều trị từ cùng một nhóm bệnh nhân hoặc hai nhóm độc lập?
Michael M

1
@Mimshot, dữ liệu đang phát trực tuyến, nhưng bạn đúng là tôi đang cố chạy thử nghiệm từ các thống kê tóm tắt. Nó hoạt động khá tốt với thử nghiệm Z cho dữ liệu thông thường
Jonathan Dobbie

1
Trong những trường hợp này, một bài kiểm tra z gần đúng có thể là điều tốt nhất bạn có thể làm. Tuy nhiên, tôi sẽ quan tâm nhiều hơn về hiệu quả điều trị thực sự lớn như thế nào, chứ không phải về ý nghĩa thống kê. Hãy nhớ rằng, với các mẫu đủ lớn, bất kỳ hiệu ứng thực sự nhỏ bé nào cũng sẽ dẫn đến một giá trị p nhỏ.
Michael M

1
@jan nóng - mặc dù, nếu kích thước mẫu của anh ta đủ lớn, bởi CLT, chúng sẽ rất gần với phân phối bình thường. Theo giả thuyết khống, các phương sai sẽ giống nhau (như phương tiện là vậy), vì vậy, với cỡ mẫu đủ lớn, phép thử t sẽ hoạt động tốt; nó sẽ không tốt như bạn có thể làm với tất cả dữ liệu, nhưng vẫn ổn. , ví dụ, sẽ khá tốt. n1=n2=100
jbowman

Câu trả lời:


14

Bạn có thể kiểm tra sự bằng nhau của các tham số trung bình so với thay thế rằng các tham số trung bình không bằng với kiểm tra tỷ lệ khả năng (kiểm tra LR). (Tuy nhiên, nếu các tham số trung bình khác nhau và phân phối theo cấp số nhân, thì đây là sự thay đổi tỷ lệ, không phải là thay đổi vị trí.)

Đối với thử nghiệm một đầu (nhưng chỉ không có triệu chứng trong trường hợp hai đuôi), tôi tin rằng thử nghiệm LR xuất hiện tương đương với thử nghiệm sau (để chứng minh rằng trên thực tế giống như thử nghiệm LR cho thử nghiệm một đầu trường hợp người ta sẽ cần hiển thị thống kê LR là đơn điệu trong ):x¯/y¯

Giả sử chúng ta tham số hóa quan sát thứ theo cấp số nhân đầu tiên là có pdf và quan sát thứ trong mẫu thứ hai là có pdf (trên các miền rõ ràng cho các quan sát và tham số). (Để rõ ràng, chúng tôi đang làm việc ở dạng trung bình chứ không phải dạng lãi suất ở đây; điều này sẽ không ảnh hưởng đến kết quả tính toán.)i1/μxexp(xi/μx)j1/μyexp(yj/μy)

Vì phân phối của là trường hợp đặc biệt của gamma, , nên phân phối tổng của , được phân phối ; tương tự như với tổng của s, là .XiΓ(1,μx)XSxΓ(nx,μx)YSyΓ(ny,μy)

Do mối quan hệ giữa phân phối gamma và phân phối chi bình phương, hóa ra được phân phối . Tỷ lệ của hai bình phương trên bậc tự do của chúng là F. Do đó tỷ lệ, .2/μxSxχ2nx2μyμxSx/nxSy/nyF2nx,2ny

Theo giả thuyết null về sự bình đẳng của phương tiện, sau đó, và theo phương án hai mặt, các giá trị có thể có xu hướng nhỏ hơn hoặc lớn hơn giá trị từ null phân phối, vì vậy bạn cần một bài kiểm tra hai đuôi.x¯/y¯F2nx,2ny


Mô phỏng để kiểm tra xem chúng tôi đã không mắc một số lỗi đơn giản trong đại số:

Ở đây tôi đã mô phỏng 1000 mẫu có kích thước 30 cho và 20 cho từ phân bố theo cấp số nhân với cùng một giá trị trung bình và tính toán thống kê tỷ lệ trung bình ở trên.XY

Dưới đây là biểu đồ phân phối kết quả cũng như đường cong hiển thị phân phối mà chúng tôi đã tính theo null:F

ví dụ mô phỏng phân phối thống kê tỷ lệ theo null


Ví dụ, với thảo luận về tính toán của các giá trị p hai đuôi :

Để minh họa tính toán, đây là hai mẫu nhỏ từ các phân phối theo cấp số nhân. Mẫu X có 14 quan sát từ một quần thể có trung bình 10, mẫu Y có 17 quan sát từ một quần thể có trung bình 15:

x: 12.173  3.148 33.873  0.160  3.054 11.579 13.491  7.048 48.836 
   16.478  3.323  3.520  7.113  5.358

y:  7.635  1.508 29.987 13.636  8.709 13.132 12.141  5.280 23.447 
   18.687 13.055 47.747  0.334  7.745 26.287 34.390  9.596

Các phương tiện mẫu là 12.082 và 16.077 tương ứng. Tỷ lệ phương tiện là 0,7515

Khu vực bên trái là đơn giản, vì nó ở đuôi thấp hơn (calc in R):

 > pf(r,28,34) 
 [1] 0.2210767

Chúng ta cần xác suất cho cái đuôi khác. Nếu phân phối là đối xứng trong nghịch đảo, nó sẽ đơn giản để làm điều này.

Một quy ước chung với tỷ lệ phương sai F-test (tương tự hai đuôi) chỉ đơn giản là nhân đôi giá trị p một đầu ( ví dụ như những gì đang diễn ra ở đây ; ); trong trường hợp này, nó cho giá trị p là 0,44.

Tuy nhiên, nếu bạn thực hiện với quy tắc từ chối chính thức, bằng cách đặt một vùng vào mỗi đuôi, bạn sẽ nhận được các giá trị quan trọng như được mô tả ở đây . Giá trị p sau đó là lớn nhất sẽ dẫn đến sự từ chối, tương đương với việc thêm giá trị p một đuôi ở trên vào giá trị p một đuôi ở đuôi khác để mức độ tự do thay thế. Trong ví dụ trên cho giá trị p là 0,43.α/2α


Tôi đoán đây chỉ là tôi dày, nhưng 0,7515 đến từ đâu?
Jonathan Dobbie

r = mean (x) / mean (y) = 0,7515 - nghĩa là "Tỷ lệ của phương tiện"
Glen_b -Reinstate Monica

Được rồi, tuyệt vời. Tôi đã nhận được 0,67, nhưng đó có lẽ chỉ là do lỗi nhập dữ liệu.
Jonathan Dobbie

1
Tôi đã phân biệt giữa phương tiện dân số và mẫu kết quả có nghĩa rõ ràng hơn
Glen_b -Reinstate Monica

(+1) Nhưng mặc dù nó tiếp tuyến, tôi không hiểu đoạn cuối. Làm thế nào để nhân đôi giá trị p một đầu không tương đương với việc tìm lớn nhất , với diện tích trong mỗi đuôi, điều đó sẽ dẫn đến sự từ chối? Tại sao bạn lại trao đổi mức độ tự do? αα2
Scortchi - Phục hồi Monica

3

Là một phụ lục cho câu trả lời của @ Glen_b, tỷ lệ khả năng là mà bạn có thể sắp xếp lại thành trong đó . Có một mức tối thiểu duy nhất tại , do đó, thử nghiệm F thực sự là thử nghiệm tỷ lệ khả năng đối với các lựa chọn thay thế một phía so với giả thuyết khống về các phân phối giống hệt nhau.

nxlognxxi+nylognyyj(nx+ny)lognx+nyxi+yj
r= ˉ x
nxlog(nxny+1r)+nylog(nynx+r)+nxlognynx+ny+nylognxnx+ny
r=1r=x¯y¯r=1

Để thực hiện kiểm tra tỷ lệ khả năng phù hợp cho phương án hai mặt, bạn vẫn có thể sử dụng phân phối F; bạn chỉ cần tìm giá trị khác của tỷ lệ mẫu có nghĩa là mà tỷ lệ khả năng bằng với tỷ lệ quan sát được , và sau đó . Trong ví dụ này , & , đưa ra giá trị p tổng thể là , (khá gần với giá trị thu được bằng xấp xỉ chi bình phương phân phối gấp đôi tỷ lệ khả năng đăng nhập, ).rELRrobsPr(R>rELR)rELR=1.3272Pr(R>rELR)=0.21420.43520.4315

nhập mô tả hình ảnh ở đây

Nhưng nhân đôi giá trị p một đầu có lẽ là cách phổ biến nhất để có được giá trị p hai đuôi: tương đương với việc tìm giá trị của tỷ lệ mẫu có nghĩa là mà xác suất đuôi bằng với , và sau đó tìm . Giải thích như vậy, có vẻ như việc đặt xe ngựa trước ngựa để xác suất đuôi xác định tính cực đoan của thống kê kiểm tra, nhưng có thể được chứng minh là có hiệu lực trong hai thử nghiệm một đầu (mỗi LRT) với nhiều so sánh chỉnh sửa và mọi người thường quan tâm đến việc tuyên bố rằng hoặcrETPPr(R>rETP)Pr(R<robs)Pr(R>rETP)μx>μyμx<μyμx>μy hoặc . Nó cũng ít ồn ào hơn, và ngay cả đối với các cỡ mẫu khá nhỏ, cũng cho câu trả lời tương tự như LRT hai đuôi.μx<μy

nhập mô tả hình ảnh ở đây

Mã R theo sau:

x <- c(12.173, 3.148, 33.873, 0.160, 3.054, 11.579, 13.491, 7.048, 48.836,
       16.478, 3.323, 3.520, 7.113, 5.358)

y <- c(7.635, 1.508, 29.987, 13.636, 8.709, 13.132, 12.141, 5.280, 23.447, 
       18.687, 13.055, 47.747, 0.334,7.745, 26.287, 34.390, 9.596)

# observed ratio of sample means
r.obs <- mean(x)/mean(y)

# sample sizes
n.x <- length(x)
n.y <- length(y)

# define log likelihood ratio function
calc.llr <- function(r,n.x,n.y){
  n.x * log(n.x/n.y + 1/r) + n.y*log(n.y/n.x + r) + n.x*log(n.y/(n.x+n.y)) + n.y*log(n.x/(n.x+n.y))
}

# observed log likelihood ratio
calc.llr(r.obs,n.x, n.y) -> llr.obs

# p-value in lower tail
pf(r.obs,2*n.x,2*n.y) -> p.lo

# find the other ratio of sample means giving an LLR equal to that observed
uniroot(function(x) calc.llr(x,n.x,n.y)-llr.obs, lower=1.2, upper=1.4, tol=1e-6)$root -> r.hi

#p.value in upper tail
p.hi <- 1-pf(r.hi,2*n.x,2*n.y)

# overall p.value
p.value <- p.lo + p.hi

#approximate p.value
1-pchisq(2*llr.obs, 1)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.