Các tuyên bố cổ điển của Trung Định lý giới hạn (CLT) xem xét một chuỗi các độc lập, biến phân phối hệt ngẫu nhiên với phân phối chung F . Trình tự này mô hình hóa tình huống chúng ta gặp phải khi thiết kế chương trình lấy mẫu hoặc thử nghiệm: nếu chúng ta có thể thu được n quan sát độc lập của cùng một hiện tượng cơ bản, thì bộ sưu tập hữu hạn X 1 , X 2 , Lỗi , X nX1, X2, Lọ , Xn, ...FnX1, X2, ... ,Xnmô hình dữ liệu dự đoán. Cho phép chuỗi là vô hạn là một cách thuận tiện để xem xét các cỡ mẫu lớn tùy ý.
Luật khác nhau của số lượng lớn khẳng định rằng giá trị trung bình
m ( X1,X2, ... ,Xn) = = 1n(X1+X2+ ⋯ +Xn)
sẽ tiếp cận chặt chẽ sự mong đợi của , μ ( F ) , với xác suất cao, cung cấp F thực sự có một kỳ vọng. (Không phải tất cả các bản phân phối làm.) Điều này ngụ ý độ lệch m ( X 1 , X 2 , ... , X n ) - μ ( F ) (trong đó, như một chức năng của những n ngẫu nhiên biến, cũng là một biến ngẫu nhiên) sẽ có xu hướng nhỏ hơn nFμ ( F)Fm ( X1,X2, ... ,Xn) - μ ( F)nntăng. Các CLT thêm vào này một cách nhiều cụ thể hơn: nó khẳng định (theo một số điều kiện, mà tôi sẽ thảo luận dưới đây) rằng nếu chúng ta rescale lệch này bằng cách , nó sẽ có hàm phân phốiFntiếp cậnmộtsố hàm phân phối chuẩn trung bình bằng 0 khinphát triển lớn. (Câu trả lời của tôi tạihttps://stats.stackexchange.com/a/3904cố gắng để giải thích tại sao điều này là lý do tại sao và các yếu tố của √n--√Fnn là cái đúng để sử dụng.)n--√
Đây không phải là một tuyên bố tiêu chuẩn của CLT. Hãy kết nối nó với thông thường. Việc phân phối bình thường giới hạn bằng 0 sẽ được xác định hoàn toàn bởi tham số thứ hai, thường được chọn là thước đo độ lây lan của nó (một cách tự nhiên!), Như phương sai hoặc độ lệch chuẩn. Đặt là phương sai của nó. Chắc chắn nó phải có một số mối quan hệ với một tài sản tương tự F . Để khám phá điều này có thể là gì, hãy để F có phương sai τ 2 - nhân tiện có thể là vô hạn. Bất kể, vì X i là độc lập, chúng tôi dễ dàng tính toán phương sai của phương tiện:σ2FFτ2XTôi
Biến ( m ( X ( X1, X2, Lọ , Xn) )= Var ( 1n( X1+ X2+ ⋯ + Xn) )= ( 1n)2( Var ( X1) + Var ( X2) + ⋯ + Var ( Xn) )= ( 1n)2( τ2+ τ2+ ⋯ + τ2)= τ2n.
Do đó, phương sai của các số dư chuẩn bằng :nó là hằng số. Phương sai của phân phối chuẩn giới hạn, sau đó, phải làτ2chính nó. (Điều này ngay lập tức cho thấy định lý chỉ có thể giữ khiτ2là hữu hạn: đó là giả định bổ sung mà tôi đã đề cập trước đó.)τ2/ n×( n--√)2= τ2τ2τ2
(Nếu chúng ta đã lựa chọn bất kỳ biện pháp khác lây lan của chúng ta vẫn có thể thành công trong việc kết nối nó với σ 2 , nhưng chúng ta sẽ không phát hiện ra rằng các biện pháp tương ứng của lây lan của độ lệch trung bình chuẩn là hằng số cho tất cả n , mà là một đẹp - mặc dù không cần thiết - đơn giản hóa.)Fσ2n
Nếu chúng ta muốn, chúng ta có thể chuẩn độ lệch trung bình tất cả cùng bằng cách chia chúng bằng cũng như nhân chúng bằng √τ . Điều đó sẽ đảm bảo phân phối giới hạn làChuẩnthông thường, với phương sai đơn vị. Cho dù bạn chọn tiêu chuẩn hóa bằngτtheo cách này hay không thực sự là vấn đề của hương vị: đó là cùng một định lý và kết luận giống nhau cuối cùng. Điều quan trọng là các nhân bởi √n--√τ .n--√
Lưu ý rằng bạn có thể nhân sai lệch bởi một số yếu tố khác hơn . Bạn có thể sử dụng √n--√, hoặcn 1 / 2 + 1 / n , hoặc bất cứ điều gì khác mà tiệm hoạt động giống như √n--√+ điểm kinh nghiệm( - n )n1 / 2 + 1 / n . Bất kỳ hình thức tiệm cận khác sẽ, trong hạn mức, giảmσ2đến0hoặc thổi nó lên đến∞. Quan sát này cho thấy sự đánh giá cao của chúng tôi về CLT bằng cách cho thấy mức độ linh hoạt của nó liên quan đến cách tiêu chuẩn hóa được thực hiện. Chúng tôi có thể muốn nêu CLT, theo cách sau.n--√σ20∞
Cung cấp độ lệch giữa giá trị trung bình của một chuỗi các biến IID (với phân phối chung ) và sự mong đợi cơ bản được thu nhỏ tiệm bởi √F , độ lệch quy mô này sẽ có một số không-bình phân phối giới hạn bình thường có đúng là củaF.n--√F
Fn--√