Bạn có thể tính sức mạnh của một bài kiểm tra Kolmogorov-Smirnov trong R không?


10

Có thể thực hiện phân tích công suất cho thử nghiệm Kolmogorov Smirnov 2 mặt trong R không?

Tôi đang kiểm tra xem hai phân phối theo kinh nghiệm có khác nhau khi sử dụng ks.test () hay không và đang tìm cách thêm phân tích công suất.

Tôi chưa thể tìm thấy bất kỳ phân tích sức mạnh tích hợp nào cho các bài kiểm tra KS trong R. Có đề xuất nào không?

Chỉnh sửa : Đây là các bản phân phối được tạo ngẫu nhiên gần đúng với dữ liệu của tôi (với kích thước mẫu thực và tỷ lệ phân rã ước tính cho phân phối theo cấp số nhân)

set.seed(100)
x <- rexp(64, rate=0.34)
y <- rexp(54,rate=0.37)

#K-S test: Do x and y come from same distribution?
ks.test(x,y)

Những dữ liệu này là thước đo kích thước cơ thể trong hai nhóm khác nhau. Tôi muốn chỉ ra rằng hai nhóm về cơ bản có cùng phân phối, nhưng được cộng tác viên hỏi liệu tôi có quyền nói điều đó dựa trên kích thước mẫu hay không. Tôi đã rút ngẫu nhiên từ một phân phối theo cấp số nhân ở đây, nhưng chúng gần với dữ liệu thực.

Cho đến nay, tôi đã nói rằng không có sự khác biệt đáng kể trong các phân phối này dựa trên thử nghiệm KS hai mặt. Tôi cũng đã vẽ hai bản phân phối. Làm thế nào tôi có thể chỉ ra rằng tôi có quyền đưa ra tuyên bố như vậy, với các cỡ mẫu và tốc độ phân rã cho x và y?


4
Sức mạnh sẽ phụ thuộc vào nhiều thứ, đó là lý do tại sao sẽ không có tích hợp cho hai bài kiểm tra mẫu. Bạn có thể mô phỏng cho các tình huống nhất định. Vậy: Quyền lực đưa ra giả định gì về tình hình? Chống lại những gì thay thế hoặc trình tự thay thế? Ví dụ: bạn có thể tính toán (mô phỏng) đường cong công suất cho dữ liệu phân tán theo cấp số nhân, dựa trên tập hợp các phương án thay đổi tỷ lệ. Hoặc bạn có thể tính toán năng lượng bình thường theo sự thay đổi vị trí. Hoặc bạn có thể tính toán sức mạnh trong Weibull khi bạn thay đổi tham số hình dạng. Bạn có một số chi tiết bổ sung?
Glen_b -Reinstate Monica

Để thực sự tính toán sức mạnh, bạn cũng cần kích thước mẫu. Nếu bạn đang cố gắng xác định kích thước mẫu được cung cấp sức mạnh được chỉ định dựa trên một phương án cụ thể, điều đó có thể được thực hiện thông qua tìm kiếm gốc, nhưng thường bạn có thể tìm thấy điểm bằng các phương pháp đơn giản (thử một vài kích thước mẫu thường là đủ để tiến gần ).
Glen_b -Reinstate Monica

Biến nào đang được đo? Có phải những lúc này?
Glen_b -Reinstate Monica

@Glen_b Đây không phải là lần. Chúng là thước đo kích thước cơ thể trong hai nhóm khác nhau. Tôi muốn chỉ ra rằng hai nhóm về cơ bản có cùng phân phối, nhưng được hỏi liệu tôi có quyền nói điều đó dựa trên kích thước mẫu hay không.
Sarah

1
Ah! Đó là hai phần bối cảnh hữu ích có thể giúp có trong câu hỏi của bạn. Vì vậy, ý tưởng là nếu bạn cho thấy sức mạnh để xác định một số khác biệt khiêm tốn về mặt ý nghĩa là hợp lý, người ta có thể không từ chối vì một dấu hiệu cho thấy sự khác biệt là nhỏ. Vâng, một phân tích sức mạnh trước có thể giúp đưa ra lập luận đó. Sau thực tế có lẽ tôi sẽ tập trung nhiều hơn vào một cái gì đó như ước tính (và khoảng tin cậy có lẽ) về sự thay đổi tỷ lệ như một dấu hiệu cho thấy sự khác biệt thực sự có kích thước nhỏ, cũng như một âm mưu của hai cdf mẫu.
Glen_b -Reinstate Monica

Câu trả lời:


16

Tìm kiếm sức mạnh chống lại sự thay thế quy mô theo cấp số nhân là khá đơn giản.

Tuy nhiên, tôi không biết rằng bạn nên sử dụng các giá trị được tính toán từ dữ liệu của mình để tìm ra sức mạnh có thể có. Đó là loại tính toán sức mạnh bài hoc có xu hướng dẫn đến kết luận phản trực giác (và có lẽ sai lệch).

Quyền lực, giống như mức ý nghĩa, là một hiện tượng bạn đối phó trước thực tế; bạn sẽ sử dụng một sự hiểu biết tiên nghiệm (bao gồm cả lý thuyết, lý luận hoặc bất kỳ nghiên cứu nào trước đây) để quyết định một tập hợp thay thế hợp lý để xem xét và kích thước hiệu quả mong muốn

Bạn cũng có thể xem xét một loạt các lựa chọn thay thế khác (ví dụ: bạn có thể nhúng số mũ trong một họ gamma để xem xét tác động của các trường hợp nghiêng nhiều hay ít).

Các câu hỏi thông thường người ta có thể cố gắng trả lời bằng phân tích sức mạnh là:

1) sức mạnh, đối với một cỡ mẫu nhất định, ở một số kích thước hiệu ứng hoặc tập hợp các kích thước hiệu ứng *?

2) với kích thước mẫu và công suất, có thể phát hiện được hiệu ứng lớn đến mức nào?

3) Với công suất mong muốn cho một kích thước hiệu ứng cụ thể, cỡ mẫu nào sẽ được yêu cầu?

* (trong đó 'kích thước hiệu ứng' được dự định một cách khái quát và có thể là ví dụ, một tỷ lệ cụ thể của phương tiện hoặc sự khác biệt của phương tiện, không nhất thiết phải được tiêu chuẩn hóa).

Rõ ràng bạn đã có cỡ mẫu, vì vậy bạn không ở trong trường hợp (3). Bạn có thể cân nhắc hợp lý trường hợp (2) hoặc trường hợp (1).

Tôi đề nghị trường hợp (1) (cũng đưa ra cách giải quyết vụ án (2)).

Để minh họa một cách tiếp cận trường hợp (1) và xem nó liên quan đến trường hợp (2) như thế nào, hãy xem xét một ví dụ cụ thể, với:

  • thay thế quy mô

  • quần thể theo cấp số nhân

  • cỡ mẫu trong hai mẫu 64 và 54

Do kích thước mẫu là khác nhau, chúng tôi phải xem xét trường hợp độ chênh lệch tương đối trong một trong các mẫu vừa nhỏ hơn vừa lớn hơn 1 (nếu chúng có cùng kích thước, các cân nhắc đối xứng có thể xem xét chỉ một bên). Tuy nhiên, vì chúng khá gần với cùng kích thước, nên hiệu ứng rất nhỏ. Trong mọi trường hợp, sửa tham số cho một trong các mẫu và thay đổi mẫu khác.

Vì vậy, những gì một người làm là:

Tới trước:

choose a set of scale multipliers representing different alternatives
select an nsim (say 1000)
set mu1=1

Để làm các phép tính:

for each possible scale multiplier, kappa 
  repeat nsim times
    generate a sample of size n1 from Exp(mu1) and n2 from Exp(kappa*mu1)
    perform the test
  compute the rejection rate across nsim tests at this kappa

Trong R, tôi đã làm điều này:

alpha = 0.05
n1 = 54
n2 = 64
nsim = 10000
s = c(1.1,1.2,1.5,2,2.5,3) # set up grid for kappa
s = c(1/rev(s),1,s)        #  also below and at 1
rr = array(NA,length(s))   # to hold rejection rates

for(i in seq_along(s)) rr[i]=mean(replicate(nsim,
                                    ks.test(rexp(n1,1),rexp(n2,s[i]))$p.value)<alpha
                                 )

plot(rr~s,log="x",ylim=c(0,1),type="n") #set up plot
points(rr~rev(s),col=3) # plot the reversed case to show the (tiny) asymmetry+noise
points(rr~s,col=1) # plot the "real" case last 
abline(h=alpha,col=8,lty=2) # draw in alpha

cung cấp cho "đường cong" sức mạnh sau đây

nhập mô tả hình ảnh ở đây

Trục x nằm trên thang đo log, trục y là tốc độ loại bỏ.

Thật khó để nói ở đây, nhưng các điểm đen ở bên trái cao hơn một chút so với bên phải (nghĩa là có sức mạnh hơn một phần khi mẫu lớn hơn có tỷ lệ nhỏ hơn).

Sử dụng cdf bình thường nghịch đảo để chuyển đổi tỷ lệ loại bỏ, chúng ta có thể tạo mối quan hệ giữa tốc độ từ chối được chuyển đổi và log kappa (kappa strong biểu đồ, nhưng trục x được chia tỷ lệ) gần như tuyến tính (ngoại trừ gần 0 ) và số lượng mô phỏng đủ cao để độ nhiễu rất thấp - chúng ta có thể bỏ qua nó cho các mục đích hiện tại.

Vì vậy, chúng ta chỉ có thể sử dụng nội suy tuyến tính. Dưới đây là các kích thước hiệu ứng gần đúng cho công suất 50% và 80% ở các cỡ mẫu của bạn:

nhập mô tả hình ảnh ở đây

Mặt khác, kích thước hiệu ứng (nhóm lớn hơn có tỷ lệ nhỏ hơn) chỉ thay đổi một chút so với kích thước đó (có thể thu được kích thước hiệu ứng nhỏ hơn một chút), nhưng nó có chút khác biệt, vì vậy tôi sẽ không chuyển điểm.

Vì vậy, bài kiểm tra sẽ nhận được một sự khác biệt đáng kể (từ tỷ lệ 1), nhưng không phải là nhỏ.


Bây giờ đối với một số ý kiến: Tôi không nghĩ các bài kiểm tra giả thuyết có liên quan đặc biệt đến câu hỏi quan tâm cơ bản ( chúng có khá giống nhau không? ), Và do đó, các tính toán sức mạnh này không cho chúng tôi biết bất cứ điều gì liên quan trực tiếp đến câu hỏi đó.

Tôi nghĩ rằng bạn giải quyết câu hỏi hữu ích hơn bằng cách chỉ định những gì bạn nghĩ "về cơ bản giống nhau" thực sự có nghĩa là, hoạt động. Điều đó - theo đuổi hợp lý một hoạt động thống kê - sẽ dẫn đến phân tích dữ liệu có ý nghĩa.


Cảm ơn bạn rất nhiều! Điều này thực sự hữu ích, nhiều đánh giá cao.
Sarah

0

Do Kolmogorov-Smirnov là không tham số nên theo định nghĩa, không thể có phân tích công suất áp dụng. Để có một số loại ước tính, bạn cần giả sử một mô hình nền (và do đó chuyển hướng từ thế giới không tham số ...) và sử dụng nó để tính toán một trong các cách sau: cỡ mẫu, MDE hoặc sức mạnh (nghĩa là bạn sửa / chọn hai và tính thứ ba).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.