Điều gì xảy ra nếu xác suất không bằng nhau trong Quy tắc .632?


11

Câu hỏi này được rút ra từ câu hỏi này về "Quy tắc .632." Tôi đang viết với tham chiếu cụ thể đến câu trả lời / ký hiệu của user603 trong phạm vi nó đơn giản hóa vấn đề.

Câu trả lời đó bắt đầu với một mẫu kích thước n, với thay thế, từ n vật khác nhau trong bộ sưu tập (gọi) nó N. Xác suất mà các ith mẫu si là khác nhau từ một yếu tố đặc biệt m của N là sau đó (11/n).

Trong câu trả lời đó, tất cả các yếu tố của N đều có cơ hội được rút ngẫu nhiên như nhau.

Câu hỏi của tôi là thế này: giả sử thay vào đó trong câu hỏi trên, các mục được rút ra sao cho chúng được phân phối bình thường. Đó là, chúng tôi chia đường cong thông thường tiêu chuẩn từ Z=4 đến Z=4 thành (khoảng) 100 khoảng thời gian con bằng nhau. Mỗi trong số 100 vật phẩm trong N có xác suất được vẽ bằng với diện tích được phụ thuộc bởi đường cong trong khoảng tương ứng của nó.

Suy nghĩ của tôi như sau:

Tôi nghĩ lý do tương tự như trong câu trả lời được liên kết. Xác suất mà sim , với m là một phần tử của N, là P(sim)=(1Fi) trong đó Fi là xác suất vẽ si.

Xác suất mà một phần tử cụ thể m có trong mẫu S có kích thước n là

= 1 - n 1 ( 1 - F i ) .

P(mS)=1P(mS)=11nP(sim)
=11n(1Fi).

Một phép tính dường như chỉ ra rằng khi độ dài của các khoảng con trở nên nhỏ, câu trả lời sẽ hội tụ đến cùng một số như trong trường hợp đầu tiên (xác suất của đều bằng nhau).si

Điều này có vẻ trái ngược (với tôi) bởi vì việc xây dựng dường như ném vào các yếu tố của N rất hiếm, vì vậy tôi sẽ mong đợi một số nhỏ hơn .632.

Ngoài ra, nếu điều này là chính xác, tôi đoán chúng ta sẽ có

limn1n(1Fi)=lim(11/n)n=1/e,

mà tôi không biết là đúng hay sai.

Chỉnh sửa: Nếu nó đúng, nó có thể sẽ khái quát một số.

Cảm ơn cho bất kỳ hiểu biết.


Tôi chỉ hỏi về phương trình cuối cùng về Toán học SE (câu 791114) bởi vì tôi cũng quan tâm đến cách nó khái quát hóa, nếu có.
daniel

... Và câu trả lời ngắn gọn là sự bình đẳng cuối cùng là chính xác đối với các tệp PDF hoạt động tốt, vì vậy câu trả lời cho câu hỏi là quy tắc .632 giữ cho nhiều phân phối cơ bản.
daniel

Tôi có thể nâng câu trả lời của người khác từ một trang web khác và đăng nó ở đây như của tôi không? Đó là lý do tại sao tôi đăng bình luận ngắn gọn. Có lẽ có một cách được chấp nhận để làm điều này, nếu vậy tôi có thể chấp nhận được.
daniel

tất nhiên là bạn có thể, chỉ cần đề cập đến nguồn tại một số điểm :)
Fireorms

@Fireorms: bạn có thể chỉ ra một trường hợp nơi điều này được thực hiện để tôi có thể thấy ý của bạn không? Cảm ơn.
daniel

Câu trả lời:


2

Câu hỏi hỏi về hành vi giới hạn của

(1)=1i=1n(1Fi)

nFi Fi

Theo định nghĩa, sản phẩm này là số mũ của logarit của nó:

i=1n(1Fi)=exp(i=1nlog(1Fi)).

log

log(1Fi)=Fi12ϕi2Fi12Fi2

ϕi[0,Fi]Fi 1/2Fi2nFiϵ>0Finϵ>Fi=1

i=1nFi2i=1nϵ2<i=1n(1n)2=1n.

hậu quả là

1=i=1nFii=1nlog(1Fi)i=1nFi121n=112n

1expi=1n(1Fi)exp(1)

limn(1i=1n(1Fi))=1exp(1)0.632,

QED .


(exp((n/2)max(Fi2))1)exp(1).
n=40044Fi0exp(1/2)/500.012(1)0.0110.001041Rfi1
f <- diff(pnorm(seq(-4, 4, length.out=401))) # The normal "slices".
f <- f / sum(f)                              # Make them sum to unity.
exp(-1) - prod(1 - f)                        # Compute the error.

1 - prod(1-f)0.63316151exp(1)0.6321206


2
Phân tích lỗi là một khía cạnh rất hữu ích của câu trả lời này.
daniel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.