Tìm kiếm sức mạnh chống lại sự thay thế quy mô theo cấp số nhân là khá đơn giản.
Tuy nhiên, tôi không biết rằng bạn nên sử dụng các giá trị được tính toán từ dữ liệu của mình để tìm ra sức mạnh có thể có. Đó là loại tính toán sức mạnh bài hoc có xu hướng dẫn đến kết luận phản trực giác (và có lẽ sai lệch).
Quyền lực, giống như mức ý nghĩa, là một hiện tượng bạn đối phó trước thực tế; bạn sẽ sử dụng một sự hiểu biết tiên nghiệm (bao gồm cả lý thuyết, lý luận hoặc bất kỳ nghiên cứu nào trước đây) để quyết định một tập hợp thay thế hợp lý để xem xét và kích thước hiệu quả mong muốn
Bạn cũng có thể xem xét một loạt các lựa chọn thay thế khác (ví dụ: bạn có thể nhúng số mũ trong một họ gamma để xem xét tác động của các trường hợp nghiêng nhiều hay ít).
Các câu hỏi thông thường người ta có thể cố gắng trả lời bằng phân tích sức mạnh là:
1) sức mạnh, đối với một cỡ mẫu nhất định, ở một số kích thước hiệu ứng hoặc tập hợp các kích thước hiệu ứng *?
2) với kích thước mẫu và công suất, có thể phát hiện được hiệu ứng lớn đến mức nào?
3) Với công suất mong muốn cho một kích thước hiệu ứng cụ thể, cỡ mẫu nào sẽ được yêu cầu?
* (trong đó 'kích thước hiệu ứng' được dự định một cách khái quát và có thể là ví dụ, một tỷ lệ cụ thể của phương tiện hoặc sự khác biệt của phương tiện, không nhất thiết phải được tiêu chuẩn hóa).
Rõ ràng bạn đã có cỡ mẫu, vì vậy bạn không ở trong trường hợp (3). Bạn có thể cân nhắc hợp lý trường hợp (2) hoặc trường hợp (1).
Tôi đề nghị trường hợp (1) (cũng đưa ra cách giải quyết vụ án (2)).
Để minh họa một cách tiếp cận trường hợp (1) và xem nó liên quan đến trường hợp (2) như thế nào, hãy xem xét một ví dụ cụ thể, với:
Do kích thước mẫu là khác nhau, chúng tôi phải xem xét trường hợp độ chênh lệch tương đối trong một trong các mẫu vừa nhỏ hơn vừa lớn hơn 1 (nếu chúng có cùng kích thước, các cân nhắc đối xứng có thể xem xét chỉ một bên). Tuy nhiên, vì chúng khá gần với cùng kích thước, nên hiệu ứng rất nhỏ. Trong mọi trường hợp, sửa tham số cho một trong các mẫu và thay đổi mẫu khác.
Vì vậy, những gì một người làm là:
Tới trước:
choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1
Để làm các phép tính:
for each possible scale multiplier, kappa
repeat nsim times
generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
perform the test
compute the rejection rate across nsim tests at this kappa
Trong R, tôi đã làm điều này:
alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s) # also below and at 1
rr = array(NA,length(s)) # to hold rejection rates
for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
)
plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last
abline(h=alpha,col=8,lty=2) # draw in alpha
cung cấp cho "đường cong" sức mạnh sau đây
Trục x nằm trên thang đo log, trục y là tốc độ loại bỏ.
Thật khó để nói ở đây, nhưng các điểm đen ở bên trái cao hơn một chút so với bên phải (nghĩa là có sức mạnh hơn một phần khi mẫu lớn hơn có tỷ lệ nhỏ hơn).
Sử dụng cdf bình thường nghịch đảo để chuyển đổi tỷ lệ loại bỏ, chúng ta có thể tạo mối quan hệ giữa tốc độ từ chối được chuyển đổi và log kappa (kappa s
trong biểu đồ, nhưng trục x được chia tỷ lệ) gần như tuyến tính (ngoại trừ gần 0 ) và số lượng mô phỏng đủ cao để độ nhiễu rất thấp - chúng ta có thể bỏ qua nó cho các mục đích hiện tại.
Vì vậy, chúng ta chỉ có thể sử dụng nội suy tuyến tính. Dưới đây là các kích thước hiệu ứng gần đúng cho công suất 50% và 80% ở các cỡ mẫu của bạn:
Mặt khác, kích thước hiệu ứng (nhóm lớn hơn có tỷ lệ nhỏ hơn) chỉ thay đổi một chút so với kích thước đó (có thể thu được kích thước hiệu ứng nhỏ hơn một chút), nhưng nó có chút khác biệt, vì vậy tôi sẽ không chuyển điểm.
Vì vậy, bài kiểm tra sẽ nhận được một sự khác biệt đáng kể (từ tỷ lệ 1), nhưng không phải là nhỏ.
Bây giờ đối với một số ý kiến: Tôi không nghĩ các bài kiểm tra giả thuyết có liên quan đặc biệt đến câu hỏi quan tâm cơ bản ( chúng có khá giống nhau không? ), Và do đó, các tính toán sức mạnh này không cho chúng tôi biết bất cứ điều gì liên quan trực tiếp đến câu hỏi đó.
Tôi nghĩ rằng bạn giải quyết câu hỏi hữu ích hơn bằng cách chỉ định những gì bạn nghĩ "về cơ bản giống nhau" thực sự có nghĩa là, hoạt động. Điều đó - theo đuổi hợp lý một hoạt động thống kê - sẽ dẫn đến phân tích dữ liệu có ý nghĩa.