Liệu nó có ý nghĩa để thực hiện một thử nghiệm Kolmogorov-Smirnov một đuôi?


15

Có ý nghĩa và có thể thực hiện kiểm tra KS một đầu không? Giả thuyết khống về bài kiểm tra như vậy sẽ là gì? Hoặc là xét nghiệm KS vốn đã là một thử nghiệm hai đuôi?

Tôi sẽ được hưởng lợi từ một câu trả lời giúp tôi hiểu được sự phân phối của D (Tôi đang làm việc qua bài báo năm 1951 của Massey và tìm thấy mô tả đầy thách thức, ví dụ là D+D tối cao và tối thiểu về sự khác biệt của giá trị không tuyệt đối sự khác biệt trong CDF theo kinh nghiệm?).

Câu hỏi tiếp theo: giá trị p cho D+D thu được như thế nào? Vì vậy, nhiều ấn phẩm tôi gặp phải đang trình bày các giá trị theo bảng, thay vì CDF của Dn , D+D .

Cập nhật: Tôi vừa phát hiện ra câu hỏi liên quan Giả thuyết khống trong bài kiểm tra Kolmogorov-Smirnov một phía là gì? , mà tôi đã bỏ lỡ trong lần quét đầu tiên trước khi viết bài này.

Câu trả lời:


20

Có ý nghĩa và có thể thực hiện kiểm tra KS một đầu không?

Chắc chắn rồi.

kiểm tra KS vốn dĩ là một thử nghiệm hai đuôi?

Không có gì.

Giả thuyết khống về bài kiểm tra như vậy sẽ là gì?

Bạn không nói rõ liệu bạn đang nói về bài kiểm tra một mẫu hay hai mẫu. Câu trả lời của tôi ở đây bao gồm cả hai - nếu bạn coi là đại diện cho cdf của dân số mà từ đó một mẫu X được rút ra, thì đó là hai mẫu, trong khi bạn lấy một trường hợp mẫu bằng cách coi F X là một phân phối giả định ( F 0 , nếu bạn thích).FXXFXF0

Trong một số trường hợp, bạn có thể viết null thành một đẳng thức (ví dụ: nếu nó không được xem là có thể đi theo cách khác), nhưng nếu bạn muốn viết một null null cho một thay thế một đuôi, bạn có thể viết một cái gì đó như thế này :

H0:FY(t)FX(t)

H1:FY(t)<FX(t), cho ít nhất một t

(hoặc ngược lại với đuôi khác, một cách tự nhiên)

Nếu chúng ta thêm một giả định khi chúng ta sử dụng thử nghiệm rằng chúng bằng nhau hoặc sẽ nhỏ hơn, thì từ chối hàm null (thứ tự đầu tiên) thứ tự ngẫu nhiên / thống trị ngẫu nhiên theo thứ tự đầu tiên . Trong các mẫu đủ lớn, F có thể vượt qua - thậm chí nhiều lần và vẫn từ chối thử nghiệm một phía, do đó, giả định rất cần thiết cho sự thống trị ngẫu nhiên để giữ vững.FY

Lỏng lẻo nếu với sự bất bình đẳng nghiêm ngặt đối với ít nhất một số t sau đó Y 'có xu hướng lớn hơn' hơn X .FY(t)FX(t)tYX

Thêm các giả định như thế này không có gì lạ; đó là tiêu chuẩn. Nó không đặc biệt khác với giả định (giả sử trong ANOVA) rằng sự khác biệt về phương tiện là do sự thay đổi của toàn bộ phân phối (chứ không phải là sự thay đổi về độ lệch, trong đó một số phân phối dịch chuyển xuống và một số thay đổi, nhưng trong đó cách mà giá trị trung bình đã thay đổi).


Vì vậy, hãy xem xét, ví dụ, một sự thay đổi có nghĩa là bình thường:

nhập mô tả hình ảnh ở đây

Thực tế là phân phối cho bị dịch chuyển sang phải một số lượng từ đó cho X ngụ ý rằng FYX là thấp hơn so với F X . Thử nghiệm Kolmogorov-Smirnov một phía sẽ có xu hướng từ chối trong tình huống này.FYFX

Tương tự, hãy xem xét sự thay đổi quy mô trong một gamma:

nhập mô tả hình ảnh ở đây

Một lần nữa, việc chuyển sang quy mô lớn hơn tạo ra F. thấp hơn Một lần nữa, thử nghiệm Kolmogorov-Smirnov một phía sẽ có xu hướng từ chối trong tình huống này.

Có rất nhiều tình huống trong đó một bài kiểm tra như vậy có thể hữu ích.


Vậy là gì vàD+ gì?D

Trong thử nghiệm một mẫu, là độ lệch dương tối đa của cdf mẫu so với đường cong giả định (đó là khoảng cách lớn nhất mà ECDF vượt quá F 0 , trong khi D - là độ lệch âm tối đa - khoảng cách lớn nhất mà ECDF là dưới F 0 ). Cả D +D - đều là các đại lượng dương:D+F0DF0D+D

nhập mô tả hình ảnh ở đây

D+D

H0:FY(t)F0(t)

H1:FY(t)<F0(t), cho ít nhất một t

YFF0DFY(t)<F0(t)D


D+D-

Đó không phải là một điều đơn giản. Có nhiều cách tiếp cận đã được sử dụng.

Nếu tôi nhớ lại một cách chính xác một trong những cách phân phối thu được thông qua việc sử dụng các quy trình cầu Brownian ( tài liệu này dường như hỗ trợ hồi ức đó ).

Tôi tin rằng bài báo này , và bài báo của Marsaglia et al ở đây đều bao gồm một số nền tảng và đưa ra các thuật toán tính toán với rất nhiều tài liệu tham khảo.

Giữa những điều đó, bạn sẽ nhận được rất nhiều lịch sử và các cách tiếp cận khác nhau đã được sử dụng. Nếu họ không bao gồm những gì bạn cần, có lẽ bạn sẽ cần phải hỏi điều này như một câu hỏi mới.

DnD+D

Đó không phải là một điều ngạc nhiên. Nếu tôi nhớ đúng, ngay cả phân phối tiệm cận cũng thu được dưới dạng một chuỗi (hồi ức này cũng sẽ sai), và trong các mẫu hữu hạn, nó rời rạc và không ở dạng đơn giản. Trong cả hai trường hợp và không có cách thuận tiện để trình bày thông tin ngoại trừ biểu đồ hoặc bảng.


2
"Trong các mẫu đủ lớn, F có thể vượt qua - thậm chí nhiều lần và vẫn từ chối thử nghiệm một phía" - lưu ý rằng điều này có nghĩa là bạn có thể từ chối thử nghiệm một phía theo cả hai hướng cho cùng một dữ liệu!
Hao Ye

2
@HaoYe Vâng, điều đó là có thể. Nó sẽ là một dấu hiệu rõ ràng rằng sự thống trị ngẫu nhiên sẽ không thể đo lường được.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.