Làm thế nào chúng ta có thể có được phân phối bình thường là


12

Giả sử chúng ta có một biến ngẫu nhiên với một phạm vi các giá trị được giới hạn bởi ab , trong đó a là giá trị tối thiểu và b là giá trị tối đa.

Tôi được nghe kể rằng khi n , nơi n là cỡ mẫu của chúng tôi, sự phân bố lấy mẫu phương tiện mẫu của chúng tôi phân phối chuẩn. Đó là, khi chúng ta tăng n chúng ta đến gần và gần gũi hơn với một phân phối chuẩn, nhưng giới hạn thực tế như ntương đương với phân phối chuẩn.

Tuy nhiên, không phải là một phần của định nghĩa của sự phân bố bình thường mà nó có để mở rộng từ đến ?

Nếu tối đa của phạm vi của chúng tôi là b , thì giá trị trung bình của mẫu tối đa (không kể kích thước mẫu) sẽ bằng b và trung bình mẫu tối thiểu bằng a .

Vì vậy, dường như ngay cả khi chúng ta đạt giới hạn khi tiến đến vô cùng, phân phối của chúng ta không phải là phân phối bình thường thực sự, bởi vì nó bị giới hạn bởi ab .nab

Tôi đang thiếu gì?

Câu trả lời:


15

Đây là những gì bạn đang thiếu. Sự phân bố tiệm cận không phải là của (mẫu trung bình), nhưng tất X¯n, nơiθlà giá trị trung bình củaX.n(X¯nθ)θX

Hãy để được iid biến ngẫu nhiên mà một < X i < bX i có nghĩa là θ và phương sai σ 2 . Do đó X i đã hỗ trợ giới hạn. Các CLT nói rằng X1,X2,a<Xi<bXiθσ2Xi

n(X¯nθ)dN(0,σ2),

Trong đó là giá trị trung bình mẫu. Hiện nayX¯n

a<Xi<ba<X¯n<baθ<X¯nθ<bθn(aθ)<n(X¯nθ)<n(bθ).

Như , thấp hơn bị ràng buộc và phía trên ràng buộc có xu hướng - tương ứng, và do đó là n sự hỗ trợ của nnlà chính xác toàn bộ dòng sản.n(X¯nθ)

Bất cứ khi nào chúng ta sử dụng CLT trong thực tế, chúng ta nói , và điều này sẽ luôn là một xấp xỉ.X¯nN(θ,σ2/n)


EDIT: Tôi nghĩ rằng một phần của sự nhầm lẫn là từ việc giải thích sai về Định lý giới hạn trung tâm. Bạn là chính xác rằng phân phối mẫu của trung bình mẫu là

X¯nN(θ,σ2/n).

Tuy nhiên, phân phối mẫu là một thuộc tính mẫu hữu hạn. Như bạn nói, chúng tôi muốn cho ; một khi chúng ta làm điều đó các dấu hiệu sẽ là một kết quả chính xác. Tuy nhiên, nếu chúng ta để cho n , chúng tôi không còn có thể có một n ở phía bên tay phải (vì n bây giờ là ). Vì vậy, các tuyên bố sau đây là không chính xác ˉ X n d N ( θ , σ 2 / n )  như  n .nnnn

X¯ndN(θ,σ2/n) as n.

[Ở đây là viết tắt của sự hội tụ về mặt phân phối]. Chúng tôi muốn viết kết quả chính xác, vì vậy n không ở phía bên tay phải. Bây giờ chúng ta sử dụng các thuộc tính của các biến ngẫu nhiên để có đượcdn

n(X¯nθ)dN(0,σ2)

Để xem đại số hoạt động ra sao, hãy xem câu trả lời ở đây .


Cảm ơn bạn. Tôi hiểu đại số bất đẳng thức của bạn nhưng tôi vẫn có một số nhầm lẫn về đoạn đầu tiên của bạn: "Phân phối tiệm cận không phải là (mẫu trung bình), nhưng tấtX¯n. ... "Tôi nghĩ rằng CLT nói rằng sự phân bố lấy mẫu của các phương tiện mẫu tiếp cận một phân phối chuẩn nhưn, và tôi nghĩ ˉ X nlà RV mà mất trên tất cả các giá trị có thể các mẫu kích thướcn. Trường hợp nào thìn(X¯nθ)nX¯nnđến từ đâu? Tại sao chúng ta quan tâm đến phân phối đó mà không phải phân phối ˉ X n? n(X¯nθ)X¯n
jercliff radcliff

(tiếp theo) Đây có phải là về việc bình thường hóa việc phân phối các phương tiện mẫu? Đây có phải là nơi căn bậc hai đến từ? Nó có phải làm với điểm không? Z
jercliff radcliff

@jeremyradcliff Tôi đã chỉnh sửa câu trả lời của mình và bao gồm một liên kết giải thích một số chi tiết. Hy vọng điều này có ý nghĩa hơn bây giờ.
Greenparker

1
n

7

Nếu bạn đang đề cập đến một định lý giới hạn trung tâm, lưu ý rằng một cách thích hợp để viết nó ra là

(x¯μσ)ndN(0,1)

under normal conditions (μ,σ being the mean and standard deviation of xi).

With this formal definition, you can see right away that the left hand side can take on values for any finite range given a large enough n.

To help connect to the for informal idea that "a mean approaches a normal distribution for large n", we need to realize that "approaches a normal distribution" means that the CDF's get arbitrarily close to a normal distribution as n gets large. But as n gets large, the standard deviation of this approximate distribution shrinks, so the probability of an extreme tail of the approximating normal also goes to 0.

For example, suppose XiBern(p=0.5). Then you could use the informal approximation to say that

X¯˙N(p,p(1p)n)

So while it is true that for any finite n,

P(N(p,p(1p)n)<0)>0

(implying the approximation is clearly never perfect), as n,

P(N(p,p(1p)n)<0)0

So that discrepancy between the actual distribution and approximate distribution is disappearing, as is supposed to happen with approximations.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.