Có phiên bản kiểm tra tương đương đơn giản của bài kiểm tra Kolmogorov hạ Smirnov không?


13

Có hai thử nghiệm một phía cho tính tương đương (TOST) đã được đóng khung cho thử nghiệm KolmogorovTHER Smirnov để kiểm tra giả thuyết null tiêu cực rằng hai phân phối khác nhau ít nhất ở một số cấp độ nhà nghiên cứu?

Nếu không phải TOST, thì một số hình thức kiểm tra tương đương khác?

Nick Stauner đã chỉ ra một cách khôn ngoan rằng (tôi nên biết;) rằng có các thử nghiệm tương đương TOST không đối xứng khác cho các giả thuyết null cho tính tương đương ngẫu nhiên, và, với các giả định hạn chế hơn, cho tính tương đương trung bình.


Câu trả lời:


9

Ok, đây là nỗ lực đầu tiên của tôi. Xem xét kỹ lưỡng và ý kiến ​​đánh giá cao!

Các giả thuyết hai mẫu
Nếu chúng ta có thể đóng khung các thử nghiệm giả thuyết Kolmogorov-Smirnov hai mặt một mẫu , với các giả thuyết không và thay thế dọc theo các dòng này:

H 0F Y ( t )F X ( t ) , và0FY(t)FX(t)

H AF Y ( t ) < F X ( t ) , trong ít nhất một t , trong đó:AFY(t)<FX(t)t

  • 0F Y ( t )F X ( t )D=|mint(FY(t)FX(t))|0FY(t)FX(t)

  • thống kê kiểm tra tương ứng với H ; và0F Y ( t )F X ( t )D+=|maxt(FY(t)FX(t))|0FY(t)FX(t)

  • F X ( t ) Y XFY(t) & là các CDF theo kinh nghiệm của các mẫu và ,FX(t)YX

sau đó nên hợp lý để tạo ra một giả thuyết khoảng thời gian chung cho một phép thử tương đương dọc theo các dòng này (giả sử rằng khoảng tương đương là đối xứng cho thời điểm này):

H và0|FY(t)FX(t)|Δ

H , trong ít nhất một .tA|FY(t)FX(t)|<Δt

Điều này sẽ chuyển sang hai giả thuyết null "tiêu cực" cụ thể để kiểm tra tính tương đương (hai giả thuyết này có dạng giống nhau, vì cả và đều hoàn toàn không âm): D -D+D

H , hoặc01D+Δ

H .02DΔ

Từ chối cả H H sẽ khiến người ta kết luận rằng . Tất nhiên, khoảng tương đương không cần phải đối xứng và và có thể được thay thế bằng (thấp hơn) và (trên) cho các giả thuyết null một phía tương ứng.- 02 -Δ<FY(t)-FX(t)<Δ-ΔΔΔ2Δ101 02Δ<FY(t)FX(t)<ΔΔΔΔ2Δ1

Thống kê kiểm tra (Đã cập nhật: Delta nằm ngoài dấu giá trị tuyệt đối)
Thống kê kiểm tra và (để ẩn và ) tương ứng với H và H , và là: D - 2 n Y n X - 01 - 02D1+D2nYnX0102

D1+=ΔD+=Δ|maxt[(FY(t)FX(t))]|

D2=ΔD=Δ|mint[(FY(t)FX(t))]|

Các tương đương / Relevance Threshold
Khoảng -Hoặc , nếu sử dụng một tính tương đương không đối xứng khoảng-được thể hiện trong các đơn vị của và hoặc độ lớn của các xác suất khác nhau. Khi và tiếp cận vô hạn, CDF của hoặc cho tiếp cận cho và cho :[ Δ 2 , Δ 1 ] D + D - n Y n X D + D - n Y , n X 0 t < 0 t 0[Δ,Δ][Δ2,Δ1]D+DnYnXD+DnY,nX0t<0t0

limnY,nXp+=P(nYnXnY+nXD+t)=1e2t2

CDF của $ D ^ {+} $ (hoặc $ D ^ {-} $)

Vì vậy, đối với tôi, PDF đối với kích thước mẫu (hoặc tỷ lệ kích thước mẫu ) phải là đối với và đối với : D - 0 t < 0 t 0D+D0t<0t0

f(t)=1e2t2ddt=4te2t2

PDF của $ D ^ {+} $ (hoặc $ D ^ {-} $)

Glen_b chỉ ra rằng đây là bản phân phối Rayleigh với . Vì vậy, hàm lượng tử mẫu lớn cho kích thước mẫu và là: D+D-σ=12D+D

CDF1=Q(p)=ln(1p)2

và một lựa chọn tự do của có thể là giá trị tới hạn và một lựa chọn khắt khe hơn là giá trị tới hạn .Q α + σ / 2 = Q α + 1Δ Qα+σ/4=Qα+1Qα+σ/2=Qα+14Qα+σ/4=Qα+18


1
Trong dòng mà bạn chuyển từ cdf sang pdf, tôi nghĩ bạn đã sai. Đặt , vì vậy (lạm dụng ký hiệu), trong giới hạn . Sau đó (lưu ý sau ). (cũng lưu ý một dấu hiệu bị thiếu trong số mũ trong dòng phía trên việc lấy đạo hàm. Ngoài ra tôi không chắc tại sao bạn có một biểu tượng tách rời ở đó, nhưng có lẽ tôi đã hiểu nhầm điều gì đó.)P(K,t)=1-e-2t2eK(t)=dKnY,nX=nYnXnY+nXD+P(K,t)=1e2t2fK(t)=ddt1e2t2=4te2t24t4
Glen_b -Reinstate Monica

2
@stochazesthai và là hai thống kê kiểm tra một phía. Mỗi TOST bạn cần từ chối cả hai giả thuyết null mà các thống kê kiểm tra này áp dụng. là một giá trị quan trọng từ CDF trên dòng trên và nơi bạn muốn đăng ký trong cho (ví dụ: ). Lựa chọn phụ thuộc vào khoảng cách (giá trị từ chối quan trọng đối với nhà thực chứng cũ đơn giản ) mà bạn cần đi, trước khi bạn kết luận sự khác biệt có liên quan (ví dụ: 'tương đương' tự do là D 2 Q α - 1 1 - α p Q α = D1D2Qα11αpQα=ln(1(1α))2ΔQαH014 σ ngoài ). Qα
Alexis

2
@stochazesthai (Tiếp tục) Vì vậy, nếu cả và , thì bạn từ chối . D1ΔD2ΔH0
Alexis

2
@stochazesthai Rất tiếc! Tôi nên đặt các trích dẫn xung quanh từ tự do hơn là tương đương hai bình luận trở lại. :)
Alexis

2
@stochazesthai Nếu , sau đó từ chối , nếu , thì không thể từ chối . Nếu , sau đó từ chối , nếu , thì không thể từ chối . Nếu từ chối cả và , thì từ chối , nếu không thì từ chối . D1ΔH01D1<ΔH01D2ΔH02D2<ΔH02H01H02H0H0
Alexis

6

Một thay thế cho TOST trong thử nghiệm tương đương dựa trên cách tiếp cận khoảng tin cậy:

Đặt biểu thị lề tương đương được chỉ định trước và khoảng cách Kolmogorov - Smirnov giữa các hàm phân phối cơ bản chưa biết.Δ

θ:=supt|FX(t)FY(t)|

Bây giờ, nếu khoảng tin cậy 90% cho hoàn toàn nằm trong , thì chúng tôi có thể chắc chắn 95% rằng đủ gần 0 để nói về "tương đương".θ[Δ,Δ]θ

Mà không biết phân phối cơ bản, nó có vẻ là vô vọng để lấy được một khoảng tin cậy phân tích gần đúng, vì vậy chúng tôi có thể cần phải dựa vào (bias chỉnh) khoảng tin cậy bootstrap dựa trên resampling từ cặp và . (Tôi không muốn tìm điều kiện cho tính hợp lệ của chúng trong ứng dụng cụ thể này ...)XY


Thông minh. Bạn có trích dẫn cho bất kỳ ai thực hiện CI của (bootstrap hay cách khác) không? Dn1,n2
Alexis

1
Điểm hay ... Tomswebpage.net/images/K-S_test.doc ngắn đề cập đến "Sổ tay về các thủ tục thống kê tham số và không tham số, ấn bản thứ năm của David J.Sheskin (27 tháng 4 năm 2011)." để cung cấp một cấu trúc trường hợp hai mẫu cho D. Nhưng hiện tại, tôi không có quyền truy cập vào cuốn sách này.
Michael M
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.