Tại sao người ta sẽ sử dụng khoảng tin cậy hoặc ngẫu nhiên 'ngẫu nhiên'?


16

Gần đây tôi đã đọc một bài báo kết hợp sự ngẫu nhiên trong sự tự tin và khoảng tin cậy của nó, và tôi đã tự hỏi liệu đây có phải là tiêu chuẩn không (và nếu vậy, tại sao nó là một điều hợp lý để làm). Để đặt ký hiệu, giả sử rằng dữ liệu của chúng tôi là và chúng tôi quan tâm đến việc tạo các khoảng cho một tham số . Tôi đã quen với các khoảng tin cậy / độ tin cậy được xây dựng bằng cách xây dựng một hàm:q qxXθΘ

fx:Θ{0,1}

và để cho khoảng thời gian của chúng tôi được .I={θΘ:fx(θ)=1}

Điều này là ngẫu nhiên theo nghĩa là nó phụ thuộc vào dữ liệu, nhưng có điều kiện trên dữ liệu đó chỉ là một khoảng. Giấy này thay vì định nghĩa

gx:Θ[0,1]

và cũng là một bộ sưu tập của các biến ngẫu nhiên thống nhất iid trên [ 0 , 1 ] . Nó định nghĩa khoảng thời gian có liên quan là tôi = { q q{Uθ}θΘ[0,1] . Lưu ý rằng điều này phụ thuộc rất nhiều vào tính ngẫu nhiên phụ trợ, ngoài bất cứ điều gì đến từ dữ liệu.I={θΘ:fx(θ)Uθ}

Tôi rất tò mò về lý do tại sao một người sẽ làm điều này. Tôi nghĩ rằng 'thư giãn' khái niệm một khoảng từ các hàm như đến các hàm như g x có ý nghĩa gì đó; nó là một số loại khoảng tin cậy có trọng số. Tôi không biết bất kỳ tài liệu tham khảo nào cho nó (và sẽ đánh giá cao bất kỳ con trỏ nào), nhưng nó có vẻ khá tự nhiên. Tuy nhiên, tôi không thể nghĩ ra bất kỳ lý do nào để thêm tính ngẫu nhiên phụ trợ.fxgx

Bất kỳ con trỏ đến các tài liệu / lý do để làm điều này sẽ được đánh giá cao!


5
(+1) Đây được gọi là thủ tục ngẫu nhiên. Chúng là một phần tiêu chuẩn của khung kiểm tra và ước lượng thống kê, vì vậy bạn có thể dựa vào bất kỳ sách giáo khoa nghiêm ngặt nào để đưa ra giải thích. Động lực bổ sung cho việc sử dụng của họ có thể được tìm thấy trong các tài liệu lý thuyết trò chơi.
whuber

Cảm ơn vì sự trả lời. Tôi nhận ra sau khi đọc bình luận này, ví dụ bootstrapping phù hợp với khung này, nhưng trong tình huống đó, lý do ngẫu nhiên là rõ ràng (bạn không có quyền truy cập vào f, chỉ g). Trong trường hợp của tôi, các tác giả tính toán rõ ràng , và THEN nhìn vào g x . Mặc dù tôi có nhiều sách giáo khoa thống kê, tôi không thấy điều này ở bất cứ đâu ... bạn có một văn bản được đề xuất không? fxgx
QQQ

3
Trên thực tế, bootstrapping không phải là một thủ tục ngẫu nhiên. Đây là một quy trình xác địnhtính toán gần đúng được thực hiện bằng phương pháp lấy mẫu ngẫu nhiên.
whuber

Câu trả lời:


4

Thủ tục ngẫu nhiên đôi khi được sử dụng trong lý thuyết vì nó đơn giản hóa lý thuyết. Trong các vấn đề thống kê điển hình, nó không có ý nghĩa trong thực tế, trong khi trong các thiết lập lý thuyết trò chơi, nó có thể có ý nghĩa.

Lý do duy nhất tôi có thể thấy để sử dụng nó trong thực tế, là nếu nó bằng cách nào đó đơn giản hóa các tính toán.

Về mặt lý thuyết, người ta có thể lập luận rằng nó không nên được sử dụng, từ nguyên tắc đầy đủ : kết luận thống kê chỉ nên dựa trên tóm tắt đầy đủ của dữ liệu và ngẫu nhiên đưa ra sự phụ thuộc của ngẫu nhiên không phải là một phần của bản tóm tắt đầy đủ của dữ liệu.U

UPDATE  

Để trả lời các ý kiến ​​của người dưới đây, được trích dẫn ở đây: "Tại sao các quy trình ngẫu nhiên" không có ý nghĩa trong thực tế "? Như những người khác đã lưu ý, các nhà thí nghiệm hoàn toàn sẵn sàng sử dụng ngẫu nhiên trong việc xây dựng dữ liệu thử nghiệm của họ, chẳng hạn như chỉ định điều trị và kiểm soát ngẫu nhiên , vậy có gì khác biệt (và không thực tế hoặc phản cảm) về việc sử dụng ngẫu nhiên trong phân tích dữ liệu tiếp theo? "

Vâng, ngẫu nhiên của thí nghiệm để có được dữ liệu được thực hiện cho một mục đích, chủ yếu là để phá vỡ chuỗi nhân quả. Nếu và khi đó là hiệu quả là một cuộc thảo luận khác. Điều gì có thể là mục đích để sử dụng ngẫu nhiên như là một phần của phân tích? Lý do duy nhất tôi từng thấy là nó làm cho lý thuyết toán học hoàn thiện hơn! Đó là OK miễn là nó đi. Trong bối cảnh lý thuyết trò chơi, khi có một đối thủ thực sự, ngẫu nhiên tôi giúp tôi nhầm lẫn. Trong bối cảnh quyết định thực sự (bán, hoặc không bán?), Một quyết định phải được đưa ra, và nếu không có bằng chứng trong dữ liệu, có thể người ta chỉ cần ném một đồng xu. Nhưng trong bối cảnh khoa học, câu hỏi là nơi chúng ta có thể họctừ dữ liệu, ngẫu nhiên dường như không đúng chỗ. Tôi không thể thấy bất kỳ lợi thế thực sự từ nó! Nếu bạn không đồng ý, bạn có tranh luận có thể thuyết phục một nhà sinh vật học hay nhà hóa học không? (Và ở đây tôi không nghĩ về mô phỏng như là một phần của bootstrap hoặc MCMC.)


1
Tại sao các thủ tục ngẫu nhiên "không có ý nghĩa trong thực tế"? Như những người khác đã lưu ý, các nhà thí nghiệm hoàn toàn sẵn sàng sử dụng ngẫu nhiên trong việc xây dựng dữ liệu thử nghiệm của họ, chẳng hạn như chỉ định điều trị và kiểm soát ngẫu nhiên, vì vậy có gì khác biệt (và không thực tế hoặc phản đối) về việc sử dụng ngẫu nhiên trong phân tích dữ liệu tiếp theo ?
whuber

1
@kjetil Tôi nghĩ rằng bạn có thể chưa hoàn thành tuyên bố của mình về nguyên tắc đầy đủ, có vẻ như nó đã bị cắt giữa câu ("kết luận thống kê nên ...").
Cá bạc

1
U

1
@whuber: Một lập luận rõ ràng, có nguyên tắc rằng ngẫu nhiên trong việc lấy dữ liệu có thể là lợi thế. (Nó phá vỡ chuỗi nhân quả). Đối số nguyên tắc đó để sử dụng ngẫu nhiên là một phần của phân tích là gì?
kjetil b halvorsen 18/2/2015

1
Kjetil: Nó cho phép bạn đạt được chức năng rủi ro dự định, thay vì chấp nhận chức năng rủi ro (thường ở dạng kích thước danh nghĩa và sức mạnh) không phải là điều bạn muốn. Hơn nữa, nếu một thủ tục "về mặt lý thuyết" hữu ích thì chắc chắn không thể phản đối việc sử dụng nó trong thực tế, ngoại trừ tính không khả thi (thường không phải là trường hợp với các thủ tục ngẫu nhiên). Do đó, câu hỏi của bạn nên được đặt lên đầu: gánh nặng là ở bạn để chứng minh rằng có điều gì đó không ổn khi sử dụng các thủ tục ngẫu nhiên. Làm thế nào để bạn thực hiện điều đó mà không mâu thuẫn với chính mình?
whuber

3

Ý tưởng đề cập đến thử nghiệm, nhưng theo quan điểm về tính hai mặt của khoảng thời gian thử nghiệm và độ tin cậy, logic tương tự áp dụng cho các TCTD.

Về cơ bản, các thử nghiệm ngẫu nhiên đảm bảo rằng có thể thu được một kích thước nhất định của thử nghiệm đối với các thử nghiệm có giá trị rời rạc.

α=0.05pH0:p=0.5H1:p<0.5n=10

H0k=2ppbinom(2,10,.5)k=1H0

k=2


α

Chà, điều đó tôi đoán đưa chúng ta trở lại lịch sử thống kê, khi RA Fisher có phần tùy tiện quyết định làm việc với mức ý nghĩa 5% để quyết định xem một số bằng chứng ban đầu có đảm bảo nghiên cứu thêm hay không. Như chúng ta đã biết, 5% kể từ đó đã biến thành một loại tiêu chuẩn vàng trong nhiều lĩnh vực, mặc dù thiếu nền tảng lý thuyết quyết định tốt.
Christoph Hanck
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.