Thủ thuật này với việc thêm 1 ở đây là gì?


11

Tôi đã xem trang này về việc thực hiện Monte Carlo thử nghiệm của Lillefors. Tôi không hiểu câu này:

Có lỗi ngẫu nhiên trong tính toán này từ mô phỏng. Tuy nhiên, do mẹo thêm 1 vào tử số và mẫu số trong tính toán giá trị P, nó có thể được sử dụng thẳng mà không cần quan tâm đến tính ngẫu nhiên.

Ý nghĩa của việc thêm 1 vào tử số và mẫu số là gì?

Đoạn mã có liên quan ở đây:

n <- length(x)
nsim <- 4999
d.star <- double(nsim)
for (i in 1:nsim) {
    x.star <- rnorm(n)
    d.star[i] <- fred(x.star)
}
hist(d.star)
abline(v = d.hat, lty = 2)
## simulation-derived P-value
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)

Bạn có thể thêm bối cảnh liên quan ở đây?
gung - Tái lập Monica

4
Có vẻ như Laplace làm mịn cho công cụ ước tính Monte Carlo về xác suất, thu nhỏ nó xuống còn 1/2; Hiệu quả chính có lẽ là để tránh nhận được giá trị p bằng 0, như @Tim lưu ý (mặc dù không có rủi ro chia cho 0 như ông nói trừ khi bạn thực hiện 0 mô phỏng). Tôi thực sự không thấy lý do tại sao điều này cho phép bạn sử dụng nó "mà không quan tâm đến tính ngẫu nhiên", mặc dù.
Dougal

2
Bạn đã viết Geyer trực tiếp để hỏi câu đó có nghĩa là gì chưa?
Alexis

@Alexis, không, nhưng đó là một ý tưởng tốt.
Aksakal

@Dougal, vâng, nó trông giống như làm mịn Laplace. Không rõ tại sao anh ta áp dụng nó ở đây.
Aksakal

Câu trả lời:


6

Giải thích trên trang được tham khảo là

Theo giả thuyết xác suất được chính xác k / n simPr(Pk/nsim)k/nsim khi cả hai tính ngẫu nhiên trong các dữ liệu và tính ngẫu nhiên trong mô phỏng được đưa vào tính toán.

Để hiểu điều này, chúng ta phải xem mã, trong đó các dòng chính (viết tắt đáng kể) là

fred <- function(x) {ks.test(...)$statistic}  # Apply a statistical test to an array
d.hat <- fred(x)                              # Apply the test to the data
d.star <- apply(matrix(rnorm(n*nsim), n, nsim),
                2, fred)                      # Apply the test to nsim simulated datasets
pval <- (sum(d.star > d.hat) + 1) / (nsim + 1)# Estimate a simulation p-value

Vấn đề nổi bật là mã không khớp với báo giá. Làm thế nào chúng ta có thể hòa giải chúng? Một nỗ lực bắt đầu với nửa cuối của trích dẫn. Chúng tôi có thể giải thích quy trình bao gồm các bước sau:

  1. Dữ liệu thu thập một cách độc lập và hệt phân phối theo một số luật xác xuất G . Áp dụng quy trình thử nghiệm t (được thực hiện trong mã dưới dạng ) để tạo ra số T 0 = t ( X 1 , , X n ) .X1,X2,,XnGtfredT0=t(X1,,Xn)

  2. Tạo thông qua máy tính bộ dữ liệu có thể so sánh, mỗi kích thước n , theo một giả thuyết định của pháp luật xác xuất F . Áp dụng t cho mỗi bộ dữ liệu như vậy để tạo ra N số T 1 , T 2 , ... , T N .N=nsimnFtNT1,T2,,TN

  3. Tính

    P=(i=1NI(Ti>T0)+1)/(N+1).

    Id.star > d.hatT0Ti

F=Gα0<α<1N+11Pαα(N+1)α1TiT0T0(N+1)αN+1T0TiF(N+1)α

Pr(Pα)=(N+1)αN+1α
(N+1)αkα=k/(N+1)

[0,1]N+1αk/(N+1)=k/(nsim+1)Phộp thoại tôi đã đăng về chủ đề giá trị p. )

nsim+1nsim


5

Tôi tin rằng ở đây, 1 được thêm vào cả hai vì thống kê quan sát được bao gồm trong phân phối tham chiếu; nếu đây là trường hợp, thì đó là do phần "ít nhất là lớn" trong định nghĩa của giá trị p.

Tôi không biết chắc chắn vì văn bản dường như đang nói điều gì đó khác biệt, nhưng đó sẽ là lý do tại sao tôi làm điều đó.


1
@whuber Tôi không thấy làm thế nào tôi có thể đồng ý. Không phải tất cả các bài kiểm tra là khả năng kiểm tra tỷ lệ; khi họ không phải là LRT, sự liên quan nào có thể diễn giải nó theo tỷ lệ khả năng có?
Glen_b -Reinstate Monica

1
@whuber Nó chắc chắn có thể làm được. Nhưng hãy xem xét, ví dụ, một Wilcoxon-Mann-Whitney (hoặc thực sự, thử nghiệm hoán vị rộng rãi hơn). Có bất kỳ số lượng thử nghiệm hoàn toàn hợp lý nào được sử dụng rộng rãi mà không phải là thử nghiệm Lilliefors hay thử nghiệm tỷ lệ khả năng. Khi có một sự thay thế rõ ràng dựa trên sức mạnh nào được mong muốn, thường có thể xây dựng một thống kê kiểm tra có ý nghĩa trong đó thứ tự trên không gian mẫu được đưa ra bởi thống kê kiểm tra có ý nghĩa hoàn hảo và có các tính chất hợp lý trong một loạt các lựa chọn thay thế.
Glen_b -Reinstate Monica

1
Chắc chắn khi đưa ra một thống kê kiểm tra tương ứng với (theo nghĩa là lấy các giá trị cực đoan hơn, dù lớn hơn, nhỏ hơn hoặc cả hai), loại thay thế được quan tâm, một loại hấp dẫn là "loại thay thế được quan tâm "- nhưng ngay cả khi người ta đang sử dụng một thử nghiệm không thể chấp nhận được (thực sự, ngay cả một thử nghiệm vô dụng), nguyên tắc tôi nêu trong câu trả lời của tôi về việc bao gồm mẫu quan sát trong kết quả mô phỏng vẫn sẽ được áp dụng. Khi bạn đã đặt hàng, ngay cả khi đó không phải là đơn hàng tốt nhất, khi tính giá trị p, trường hợp quan sát vẫn sẽ thuộc về số lượng.
Glen_b -Reinstate Monica

2
@whuber chúng ta có thể không quá xa nhau bây giờ. Trong việc lựa chọn một thống kê kiểm tra hợp lý, chúng tôi chắc chắn sẽ muốn thu hút một cái gì đó . Nhưng một khi chúng tôi có một thống kê kiểm tra (như chúng tôi phải có vào thời điểm chúng tôi mô phỏng theo null), chúng tôi đã thực hiện điều đó. Và một khi chúng ta có, lý do tại sao chúng ta sẽ bao gồm trường hợp quan sát được trong tính toán giá trị p của chúng ta là vì giá trị p là gì.
Glen_b -Reinstate Monica

1
Tôi không nghĩ chúng ta có bất kỳ sự khác biệt nào cả. . rộng." Tôi thấy cụm từ đó hiểu sai ở rất nhiều nơi trên trang web này (và các nơi khác) mà tôi muốn lưu ý người đọc với những gì nó phải thực sự có ý nghĩa.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.