Tại sao hiệu chỉnh liên tục (giả sử, xấp xỉ bình thường với phân phối nhị thức) hoạt động?


24

Tôi muốn hiểu rõ hơn về cách hiệu chỉnh liên tục đối với phân phối nhị thức cho phép tính gần đúng bình thường.

Phương pháp nào đã được sử dụng để quyết định chúng ta nên thêm 1/2 (tại sao không phải là số khác?). Bất kỳ lời giải thích nào (hoặc một liên kết đến việc đọc được đề xuất, ngoài điều này , sẽ được đánh giá cao).

Câu trả lời:


29
  1. Trong thực tế, nó không phải lúc nào cũng "hoạt động" (theo nghĩa là luôn luôn cải thiện xấp xỉ của cdf nhị thức theo bình thường ở bất kỳ ). Nếu nhị thức là 0,5 tôi nghĩ nó luôn có ích, ngoại trừ phần đuôi cực đoan nhất. Nếu không quá 0,5, đối với khá lớn, nó thường hoạt động rất tốt ngoại trừ ở đuôi xa, nhưng nếu gần 0 hoặc 1 thì có thể không giúp ích gì cả (xem điểm 6. bên dưới)p p n pxppnp

  2. Một điều cần lưu ý (mặc dù hình minh họa hầu như luôn luôn liên quan đến pmfs và pdf) là thứ chúng tôi đang cố gắng ước tính là cdf. Nó có thể hữu ích để suy nghĩ về những gì đang xảy ra với cdf của nhị thức và bình thường gần đúng (ví dụ: đây là ):n= =20,p= =0,5

    nhập mô tả hình ảnh ở đây

    Trong giới hạn, cdf của nhị thức chuẩn sẽ chuyển sang chuẩn bình thường (lưu ý rằng tiêu chuẩn hóa ảnh hưởng đến tỷ lệ trên trục x chứ không phải trục y); dọc theo con đường để ngày càng lớn nhảy CDF nhị thức của xu hướng đồng đều hơn straddle các lũy bình thường.n

    Hãy phóng to và xem xét điều này trong ví dụ đơn giản ở trên:

    nhập mô tả hình ảnh ở đây

    Lưu ý rằng vì các đường chuẩn gần đúng gần với các bước nhảy thẳng đứng *, trong khi trong giới hạn, cdf bình thường là xấp xỉ tuyến tính và (như là sự tiến triển của cdf nhị thức ở đầu mỗi bước nhảy); kết quả là cdf có xu hướng vượt qua các bước ngang gần . Nếu bạn muốn tính gần đúng giá trị của cdf nhị thức, tại số nguyên , cdf bình thường đạt đến độ cao đó gần với . F(x)xx+1x+12F(x)xx+12

    * Nếu chúng tôi áp dụng Berry-Esseen cho các biến Bernoulli đã được sửa, nghĩa là giới hạn Berry-Esseen cho phép rất ít phòng ngọ nguậy khi gần và gần - cdf bình thường phải vượt qua gần giữa nhảy ở đó bởi vì nếu không sự khác biệt tuyệt đối trong cdf sẽ vượt quá Berry-Essen tốt nhất bị ràng buộc ở bên này hay bên kia. Điều này lần lượt liên quan đến khoảng cách từ , cdf bình thường có thể vượt qua phần nằm ngang của hàm bước của nhị thức cdf.1p xμx+112xμx+12

  3. Mở rộng dựa trên động lực mà trong 1. hãy xem xét cách chúng tôi sử dụng xấp xỉ bình thường cho cdf nhị thức để tìm ra . Ví dụ (xem sơ đồ thứ hai ở trên). Vì vậy, bình thường của chúng tôi có cùng giá trị trung bình và sd là . Lưu ý rằng chúng tôi sẽ ước tính mức tăng của cdf ở mức 9 bằng cách thay đổi cdf bình thường trong khoảng 8,5 đến 9,5.n = 20 , p = 0,5 , k = 9 N ( 10 , ( P(X= =k)n= =20,p= =0,5,k= =9N(10,(5)2)

nhập mô tả hình ảnh ở đây

  1. Làm điều tương tự dưới động lực sách giáo khoa ít trang trọng hơn nhưng "thông thường" hơn (có lẽ trực quan hơn, đặc biệt là đối với học sinh mới bắt đầu), chúng tôi đang cố gắng ước chừng một biến rời rạc bằng một biến liên tục. Chúng ta có thể tạo một phiên bản nhị thức liên tục bằng cách thay thế từng đỉnh xác suất của chiều cao bằng một hình chữ nhật có chiều rộng 1 tập trung tại , tạo cho nó chiều cao (xem hình chữ nhật màu xanh bên dưới; hãy tưởng tượng một cho mỗi x- giá trị) và sau đó xấp xỉ bằng mật độ bình thường với cùng giá trị trung bình và sd như nhị thức ban đầu:x p ( x )p(x)xp(x)

    ! [nhập mô tả hình ảnh ở đây

    Vùng bên dưới hộp được xấp xỉ bằng mức bình thường giữa và ; hai phần gần như hình tam giác nằm phía trên và bên dưới bước ngang nằm sát nhau trong khu vực. Một số tổng xác suất nhị thức trong một khoảng sẽ giảm xuống một tập hợp các xấp xỉ này. (Vẽ một sơ đồ như thế này thường rất hữu ích nếu nó không rõ ràng ngay lập tức cho dù bạn cần tăng hay giảm 0,5 cho một phép tính cụ thể ... hãy tìm ra giá trị nhị thức nào bạn muốn trong phép tính của mình và đi bên cạnh cho mỗi cái.)x-12x+1212

    Người ta có thể thúc đẩy cách tiếp cận này một cách đại số bằng cách sử dụng đạo hàm [dọc theo dòng của De Moivre - ví dụ ở đây hoặc ở đây ] để lấy ra xấp xỉ bình thường (mặc dù nó có thể được thực hiện trực tiếp hơn so với cách tiếp cận của De Moivre).

    Điều đó về cơ bản tiến hành thông qua một số xấp xỉ, bao gồm sử dụng xấp xỉ của Stirling trên thuật ngữ và sử dụng để có được điều đó(nx)đăng nhập(1+x)x-x2/2

    P(X= =x)12πnp(1-p)điểm kinh nghiệm(-(x-np)22np(1-p))

    có nghĩa là mật độ của một bình thường với trung bình và phương sai tại xấp xỉ chiều cao của nhị phân nhị phân tại . Đây thực chất là nơi De Moivre đã đến.μ= =npσ2= =np(1-p)xx

    Vì vậy, bây giờ hãy xem xét rằng chúng ta có một xấp xỉ quy tắc trung điểm cho các khu vực bình thường về độ cao nhị thức ... nghĩa là đối với , quy tắc trung điểm nói rằng và chúng tôi có từ De Moivre rằng . Lật nó về, .Y~N(np,np(1-p))F(y+12)-F(y-12)= =y-12y+12fY(bạn)dbạnfY(y)fY(x)P(X= =x)P(X= =x)F(x+12)-F(x-12)

    [Một phép tính gần đúng kiểu "quy tắc trung điểm" tương tự có thể được sử dụng để thúc đẩy các xấp xỉ khác của các pmfs liên tục bằng mật độ sử dụng hiệu chỉnh liên tục, nhưng người ta phải luôn luôn chú ý đến nơi có ý nghĩa để gọi phép gần đúng đó]

  2. Ghi chú lịch sử: sự điều chỉnh liên tục dường như bắt nguồn từ Augustus de Morgan vào năm 1838 như là một sự cải tiến của xấp xỉ De Moivre. Xem, ví dụ Hald (2007) [1]. Từ mô tả của Hald, lý luận của ông nằm dọc theo dòng của mục 4. ở trên (nghĩa là về mặt cố gắng xấp xỉ pmf bằng cách thay thế xác suất tăng vọt bằng "khối" chiều rộng 1 tập trung ở giá trị x).

  3. Một minh họa về một tình huống trong đó việc điều chỉnh liên tục không giúp ích gì:

    nhập mô tả hình ảnh ở đây

    Trong ô bên trái (trong đó như trước đây, là nhị thức, là xấp xỉ bình thường), và do đó . Trong ô bên phải (cùng nhị thức nhưng xa hơn về phần đuôi), và vì vậy - đó là để nói rằng bỏ qua việc điều chỉnh liên tục tốt hơn là sử dụng nó trong khu vực này.XYFX(x)FY(x+12)p(x)FY(x+12)-FY(x-12)FX(x)FY(x)p(x)FY(x)-FY(x-1)

    [1]: Hald, Anders (2007),
    "Lịch sử suy luận thống kê tham số từ Bernoulli đến Fisher, 1713-1935",
    Nguồn và nghiên cứu về lịch sử toán học và khoa học vật lý,
    Springer-Verlag New York


1

Tôi tin rằng yếu tố phát sinh từ thực tế là chúng ta đang so sánh một phân phối liên tục với một phân tách rời rạc. Do đó, chúng ta cần dịch nghĩa của từng giá trị rời rạc trong phân phối liên tục. Chúng ta có thể chọn một giá trị khác, tuy nhiên giá trị này sẽ không cân bằng về một số nguyên cho trước. (tức là bạn sẽ cân nhắc xác suất ở mức 6 nhiều hơn 7 so với 5.)

Tôi tìm thấy một liên kết hữu ích ở đây: liên kết

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.