Có giải thích trực quan nào cho định lý giới hạn trung tâm?


144

Trong một số bối cảnh khác nhau, chúng tôi gọi định lý giới hạn trung tâm để biện minh cho bất kỳ phương pháp thống kê nào chúng tôi muốn áp dụng (ví dụ: xấp xỉ phân phối nhị thức theo phân phối chuẩn). Tôi hiểu các chi tiết kỹ thuật về lý do tại sao định lý là đúng nhưng điều này xảy ra với tôi rằng tôi không thực sự hiểu được trực giác đằng sau định lý giới hạn trung tâm.

Vậy, trực giác đằng sau định lý giới hạn trung tâm là gì?

Giải thích cư sĩ sẽ là lý tưởng. Nếu cần một số chi tiết kỹ thuật, vui lòng giả sử rằng tôi hiểu các khái niệm về pdf, cdf, biến ngẫu nhiên, v.v. nhưng không có kiến ​​thức về các khái niệm hội tụ, các hàm đặc trưng hoặc bất cứ điều gì liên quan đến lý thuyết đo lường.


8
Câu hỏi hay, mặc dù phản ứng tức thời của tôi, được hỗ trợ bởi kinh nghiệm hạn chế của tôi trong việc giảng dạy điều này, là CLT ban đầu hoàn toàn không trực quan với hầu hết mọi người. Nếu bất cứ điều gì, nó phản trực giác!
vào

2
@onestop NGAY! nhìn chằm chằm vào phân phối nhị thức với p = 1/2 khi n tăng không cho thấy CLT đang ẩn nấp - nhưng trực giác về nó luôn thoát khỏi tôi.
ronaf

2
Câu hỏi tương tự với một số ý tưởng tốt đẹp: stats.stackexchange.com/questions/643/...

1
Không phải là một lời giải thích nhưng mô phỏng này có thể hữu ích để hiểu nó.
David Lane

Câu trả lời:


119

Tôi xin lỗi trước về độ dài của bài đăng này: với một chút lo lắng rằng tôi đã để nó ở nơi công cộng, bởi vì nó cần một chút thời gian và sự chú ý để đọc qua và chắc chắn có lỗi đánh máy và lỗi lưu trữ. Nhưng ở đây, nó dành cho những người quan tâm đến chủ đề hấp dẫn này, với hy vọng rằng nó sẽ khuyến khích bạn xác định một hoặc nhiều trong số nhiều phần của CLT để giải thích thêm về phản hồi của chính bạn.


Hầu hết các nỗ lực "giải thích" CLT là hình minh họa hoặc chỉ là sự phục hồi khẳng định nó là sự thật. Một lời giải thích thực sự xuyên thấu, chính xác sẽ phải giải thích rất nhiều điều.

Trước khi xem xét điều này hơn nữa, hãy rõ ràng về những gì CLT nói. Như bạn đã biết, có những phiên bản khác nhau về tính tổng quát của chúng. Bối cảnh chung là một chuỗi các biến ngẫu nhiên, là một số loại hàm nhất định trên một không gian xác suất chung. Đối với các giải thích trực quan giữ chặt chẽ, tôi thấy thật hữu ích khi nghĩ về một không gian xác suất như một hộp với các đối tượng có thể phân biệt. Không quan trọng những vật thể đó là gì nhưng tôi sẽ gọi chúng là "vé". Chúng tôi thực hiện một "quan sát" của một hộp bằng cách trộn kỹ các vé và rút ra; vé đó tạo thành sự quan sát. Sau khi ghi lại để phân tích sau, chúng tôi trả lại vé vào hộp để nội dung của nó không thay đổi. Một "biến ngẫu nhiên" về cơ bản là một số được ghi trên mỗi vé.

Vào năm 1733, Abraham de Moivre đã xem xét trường hợp của một hộp duy nhất trong đó các số trên vé chỉ là số không và số ("các thử nghiệm Bernoulli"), với một số của mỗi số hiện diện. Anh ta tưởng tượng thực hiện quan sát độc lập về mặt vật lý , thu được một chuỗi các giá trị , tất cả đều bằng 0 hoặc một. Các tổng của những giá trị, , là ngẫu nhiên vì các điều khoản trong tổng là. Do đó, nếu chúng ta có thể lặp lại quy trình này nhiều lần, các khoản tiền khác nhau (toàn bộ số từ đến ) sẽ xuất hiện với các tần số khác nhau - tỷ lệ của tổng số. (Xem biểu đồ bên dưới.)x 1 , x 2 , ... , x n y n = x 1 + x 2 + ... + x n 0 nnx1,x2,,xnyn=x1+x2++xn0n

Bây giờ người ta sẽ mong đợi - và đó là sự thật - rằng với các giá trị rất lớn của , tất cả các tần số sẽ khá nhỏ. Nếu chúng ta quá táo bạo (hoặc dại dột) khi cố gắng "vượt quá giới hạn" hoặc "để đi đến ", chúng ta sẽ kết luận chính xác rằng tất cả các tần số giảm xuống . Nhưng nếu chúng ta chỉ đơn giản vẽ biểu đồ tần số, mà không chú ý đến cách các trục của nó được dán nhãn, chúng ta sẽ thấy rằng biểu đồ cho lớn bắt đầu trông giống nhau: theo một nghĩa nào đó, các biểu đồ này đạt đến giới hạn mặc dù tần số tất cả đều đi về không.n 0 nnn0n

Biểu đồ

Các biểu đồ này mô tả kết quả của việc lặp lại quy trình lấy nhiều lần. là "số lượng thử nghiệm" trong các tiêu đề. nynn

Cái nhìn sâu sắc ở đây là vẽ biểu đồ trước và dán nhãn trục của nó sau . Với lớn , biểu đồ bao gồm một phạm vi lớn các giá trị tập trung quanh (trên trục hoành) và một khoảng nhỏ của các giá trị (trên trục tung), bởi vì các tần số riêng lẻ phát triển khá nhỏ. Do đó, việc lắp đường cong này vào vùng vẽ cần có cả sự dịch chuyểnthay đổi kích thước của biểu đồ. Mô tả toán học này là với mỗi chúng ta có thể chọn một số giá trị trung tâm (không nhất thiết là duy nhất!) Để định vị biểu đồ và một số giá trị tỷ lện / 2 n m n s n y n z n = ( y n - m n ) / s nnn/2nmnsn(không nhất thiết phải là duy nhất!) để làm cho nó phù hợp với các trục. Điều này có thể được thực hiện bằng toán học bằng cách thay đổi thành .ynzn=(ynmn)/sn

Hãy nhớ rằng biểu đồ thể hiện tần số theo các khu vực giữa nó và trục hoành. Do đó, sự ổn định cuối cùng của các biểu đồ cho các giá trị lớn của do đó nên được nêu trong điều khoản của khu vực. n a b > a n z n ( a , b ] Vì vậy, hãy chọn bất kỳ khoảng nào của các giá trị bạn thích, giả sử từ đến và, khi tăng, theo dõi khu vực của một phần của biểu đồ của kéo dài theo chiều ngang . CLT khẳng định một số nhiều thứ:ab>anzn(a,b]

  1. Bất kể và là gì,b ab nếu chúng ta chọn các chuỗi và một cách thích hợp (theo cách hoàn toàn không phụ thuộc vào hoặc ), khu vực này thực sự đạt đến giới hạn khi trở nên lớn.s n a b nmnsnabn

  2. Các chuỗi và có thể được chọn theo cách chỉ phụ thuộc vào , trung bình của các giá trị trong hộp và một số thước đo mức độ lây lan của các giá trị đó - nhưng không có gì khác - sao cho không có gì trong hộp , giới hạn luôn luôn giống nhau. (Tài sản phổ quát này là tuyệt vời.)s n nmnsnn

  3. Cụ thể, khu vực giới hạn đó là khu vực dưới đường cong giữa và : đây là công thức của biểu đồ giới hạn phổ quát đó. aby=exp(z2/2)/2πab

    Tổng quát hóa đầu tiên của CLT cho biết thêm,

  4. Khi hộp có thể chứa các số ngoài số 0 và số không, chính xác cùng một kết luận (với điều kiện là tỷ lệ của số cực lớn hoặc nhỏ trong hộp không "quá lớn", một tiêu chí có tuyên bố định lượng chính xác và đơn giản) .

    Sự khái quát hóa tiếp theo, và có lẽ là điều tuyệt vời nhất, thay thế hộp vé duy nhất này bằng một dãy hộp dài vô tận được đặt hàng với vé. Mỗi hộp có thể có số lượng khác nhau trên vé của nó theo tỷ lệ khác nhau. Quan sát được thực hiện bằng cách vẽ một vé từ hộp đầu tiên, đến từ hộp thứ hai, v.v.x 2x1x2

  5. Chính xác các kết luận giống nhau được cung cấp với nội dung của các hộp là "không quá khác biệt" (có một số đặc điểm chính xác, nhưng khác nhau, về số lượng "không quá khác biệt" có nghĩa là gì, chúng cho phép một lượng vĩ độ đáng kinh ngạc).

Năm khẳng định này, ở mức tối thiểu, cần giải thích. Còn nữa. Một số khía cạnh hấp dẫn của thiết lập được ẩn trong tất cả các báo cáo. Ví dụ,

  • Tổng số có gì đặc biệt ? Tại sao chúng ta không có các định lý giới hạn trung tâm cho các tổ hợp toán học khác của các số như sản phẩm của chúng hoặc tối đa của chúng? (Hóa ra chúng tôi làm, nhưng chúng không hoàn toàn chung chung và cũng không phải lúc nào cũng có một kết luận đơn giản, sạch sẽ trừ khi chúng có thể được rút gọn thành CLT.) Trình tự của và không phải là duy nhất nhưng chúng gần như là duy nhất theo nghĩa là cuối cùng họ phải tính gần đúng kỳ vọng của tổng số vé và độ lệch chuẩn của tổng, tương ứng (trong hai câu lệnh đầu tiên của CLT, bằng lần độ lệch chuẩn của cái hộp). s n n mnsnnn

    Độ lệch chuẩn là một thước đo cho sự lan truyền của các giá trị, nhưng nó không phải là duy nhất cũng không phải là "tự nhiên" nhất, trong lịch sử hoặc cho nhiều ứng dụng. ( Ví dụ, nhiều người sẽ chọn một cái gì đó giống như độ lệch tuyệt đối trung vị so với trung vị .)

  • Tại sao SD xuất hiện một cách thiết yếu như vậy?

  • Hãy xem xét công thức cho biểu đồ giới hạn: ai có thể mong đợi nó có dạng như vậy? Nó nói logarit của mật độ xác suất là một hàm bậc hai . Tại sao? Có một số giải thích trực quan hoặc rõ ràng, thuyết phục cho điều này?


Tôi thú nhận rằng tôi không thể đạt được mục tiêu cuối cùng là cung cấp các câu trả lời đủ đơn giản để đáp ứng các tiêu chí thách thức của Srikant về tính trực giác và đơn giản, nhưng tôi đã phác thảo nền tảng này với hy vọng rằng những người khác có thể được truyền cảm hứng để lấp đầy một số khoảng trống. Tôi nghĩ rằng một minh chứng tốt cuối cùng sẽ phải dựa vào phân tích cơ bản về cách các giá trị giữa và có thể phát sinh khi tạo tổng . Quay trở lại phiên bản hộp đơn của CLT, trường hợp phân phối đối xứng đơn giản hơn để xử lý: trung vị của nó bằng với giá trị trung bình của nó, do đó, có 50% khả năng sẽ nhỏ hơn giá trị trung bình của hộp và 50% cơ hộiβ n = b s n + m n x 1 + x 2 + ... + x n x i x i nαn=asn+mnβn=bsn+mnx1+x2++xnxixisẽ lớn hơn ý nghĩa của nó. Hơn nữa, khi đủ lớn, độ lệch dương so với giá trị trung bình phải bù cho độ lệch âm trong giá trị trung bình. (Điều này đòi hỏi một số biện minh cẩn thận, không chỉ vẫy tay.) Vì vậy, chúng tôi chủ yếu phải quan tâm đến việc đếm số lượng độ lệch dương và âm và chỉ có mối quan tâm thứ cấp về kích thước của chúng .n (Trong tất cả những điều tôi đã viết ở đây, điều này có thể hữu ích nhất trong việc cung cấp một số trực giác về lý do tại sao CLT hoạt động. Thật vậy, các giả định kỹ thuật cần thiết để đưa ra những khái quát về CLT đúng là những cách khác nhau để loại trừ khả năng độ lệch lớn hiếm gặp sẽ làm đảo lộn sự cân bằng đủ để ngăn chặn biểu đồ giới hạn phát sinh.)

Điều này cho thấy, ở một mức độ nào đó, tại sao việc khái quát hóa đầu tiên của CLT không thực sự phát hiện ra bất cứ điều gì không có trong phiên bản dùng thử Bernoulli ban đầu của de Moivre.

Tại thời điểm này, có vẻ như không có gì cho nó ngoài việc làm một phép toán nhỏ: chúng ta cần đếm số cách khác nhau trong đó số độ lệch dương so với giá trị trung bình có thể khác với số độ lệch âm theo bất kỳ giá trị định trước , trong đó hiển nhiên là một trong . Nhưng vì các lỗi nhỏ biến mất sẽ biến mất trong giới hạn, chúng tôi không phải đếm chính xác; chúng ta chỉ cần tính gần đúng số lượng. Cuối cùng, điều đó đủ để biết rằngk - n , - n + 2 , ... , n - 2 , nkkn,n+2,,n2,n

The number of ways to obtain k positive and nk negative values out of n

equals nk+1k

times the number of ways to get k1 positive and nk+1 negative values.

(Đó là một kết quả hoàn hảo cơ bản vì vậy tôi sẽ không bận tâm viết ra lời biện minh.) Bây giờ chúng tôi ước tính bán buôn. Tần số tối đa xảy ra khi càng gần càng tốt (cũng là sơ cấp). Hãy viết . Sau đó, liên quan đến tần số tối đa, tần số của độ lệch dương ( ) được ước tính bởi sản phẩmn / 2 m = n / 2 m + j + 1 j 0kn/2m=n/2m+j+1j0

m+1m+1mm+2mj+1m+j+1

=11/(m+1)1+1/(m+1)12/(m+1)1+2/(m+1)1j/(m+1)1+j/(m+1).

135 năm trước khi de Moivre viết, John Napier đã phát minh ra logarit để đơn giản hóa phép nhân, vì vậy hãy tận dụng điều này. Sử dụng xấp xỉ

log(1x1+x)2x,

chúng tôi thấy rằng nhật ký của tần số tương đối là khoảng

2/(m+1)4/(m+1)2j/(m+1)=j(j+1)m+1j2m.

Vì lỗi tích lũy tỷ lệ thuận với , nên điều này phải hoạt động tốt với điều kiện là nhỏ so với . Điều đó bao gồm một phạm vi giá trị lớn hơn mức cần thiết. (Nó đủ cho phép tính gần đúng chỉ hoạt động cho theo thứ tự mà không có triệu chứng nhỏ hơn nhiều so với .)j4/m3j4m3jjmm3/4


Rõ ràng cần phân tích nhiều hơn về loại này để chứng minh cho các xác nhận khác trong CLT, nhưng tôi sắp hết thời gian, không gian và năng lượng và có lẽ tôi đã mất 90% những người bắt đầu đọc nó. Tuy nhiên, phép tính gần đúng đơn giản này cho thấy ban đầu de Moivre có thể nghi ngờ rằng có phân phối giới hạn phổ quát như thế nào , logarit của nó là một hàm bậc hai và hệ số tỷ lệ thích hợp phải tỷ lệ thuận với (vì (vì ).snnj2/m=2j2/n=2(j/n)2 Thật khó để tưởng tượng làm thế nào mối quan hệ định lượng quan trọng này có thể được giải thích mà không cần gọi một số loại thông tin và lý luận toán học; bất cứ điều gì ít hơn sẽ để lại hình dạng chính xác của đường cong giới hạn là một bí ẩn hoàn toàn.


5
+1 Tôi sẽ mất một chút thời gian để tiêu hóa câu trả lời của bạn. Tôi thừa nhận rằng việc yêu cầu một trực giác cho CLT trong các ràng buộc mà tôi áp đặt có thể gần như không thể.

2
Cảm ơn bạn đã dành thời gian để viết bài này, đây là giải trình hữu ích nhất về CLT mà tôi đã thấy cũng rất dễ tiếp cận về mặt toán học.
jercliff radcliff

1
Vâng, khá dày đặc .... rất nhiều câu hỏi. Làm thế nào để biểu đồ đầu tiên có 2 thanh (chỉ có 1 thử nghiệm!); Tôi có thể bỏ qua điều đó? Và quy ước thường là để tránh các khoảng cách ngang giữa các thanh của biểu đồ, phải không? (bởi vì, như bạn nói, diện tích rất quan trọng và cuối cùng diện tích sẽ được tính trên một miền liên tục (tức là không có khoảng trống)? Vì vậy, tôi cũng sẽ bỏ qua những khoảng trống ...? Ngay cả tôi cũng có những khoảng trống khi lần đầu tiên cố gắng hiểu nó :)
The Red Pea

1
@TheRed Cảm ơn bạn cho câu hỏi của bạn. Tôi đã chỉnh sửa phần đầu tiên của bài đăng này để làm cho những điểm này rõ ràng hơn một chút.
whuber

4
À, vâng, tôi đã nhầm lẫn "số lần thử = =" quan sát "" với "số lần (toàn bộ quy trình này) được lặp lại". Vì vậy, nếu một vé chỉ có thể có giá trị của hai giá trị 0 hoặc 1 và bạn chỉ quan sát một vé, tổng giá trị của các vé đó chỉ có thể là một trong hai điều: 0 hoặc 1 . Do đó biểu đồ đầu tiên của bạn có hai thanh. Hơn nữa, các thanh này có chiều cao gần bằng nhau vì chúng tôi hy vọng 0 và 1 xảy ra theo tỷ lệ bằng nhau. n
Hạt đậu đỏ

27

Hoạt hình đẹp nhất mà tôi biết: http://www.ms.uky.edu/~mai/java/stat/GaltonMachine.html

8 lớp ngang của các chân cách đều nhau, mỗi lớp được đặt so le, dẫn đến chướng ngại vật kiểu "pachinko / pinball" cho các quả bóng rơi qua các chân này.  Mỗi quả bóng rơi ở dưới cùng, và khi các quả bóng xếp chồng lên nhau, chiều cao của chúng đạt tới đường viền của đường cong Gaussian.  Điều này minh họa rằng tổng của nhiều sự kiện ngẫu nhiên độc lập (các lớp), sẽ dẫn đến phân phối kết quả Gaussian (chiều cao bóng xếp chồng lên nhau)

Những từ đơn giản nhất tôi đã đọc: http://elonen.iki.fi/articles/centrallimit/index.en.html

Nếu bạn tổng hợp kết quả của mười lần ném này, những gì bạn nhận được có khả năng gần với 30-40 hơn mức tối đa, 60 (tất cả sáu lần) hoặc mặt khác, tối thiểu, 10 (tất cả các lần).

Lý do cho điều này là bạn có thể nhận được các giá trị trung bình theo nhiều cách khác nhau hơn các thái cực. Ví dụ: khi ném hai con xúc xắc: 1 + 6 = 2 + 5 = 3 + 4 = 7, nhưng chỉ có 1 + 1 = 2 và chỉ có 6 + 6 = 12.

Đó là: mặc dù bạn nhận được bất kỳ số nào trong sáu số có khả năng như nhau khi ném một con chết, các cực trị có thể xảy ra ít hơn so với các giá trị trung bình trong tổng của một vài con xúc xắc.


20

Trực giác là một điều khó khăn. Nó thậm chí còn phức tạp hơn với lý thuyết trong tay chúng ta bị trói sau lưng.

CLT là tất cả về tổng của những xáo trộn nhỏ, độc lập. "Tổng" theo nghĩa của mẫu có nghĩa là "nhỏ" theo nghĩa phương sai hữu hạn (của dân số) và "nhiễu" theo nghĩa cộng / trừ xung quanh giá trị trung tâm (dân số).

Đối với tôi, thiết bị thu hút trực tiếp nhất là trực giác là quincunx, hay 'hộp Galton', xem Wikipedia (cho 'máy đậu'?) Ý tưởng là lăn một quả bóng nhỏ xíu xuống mặt một tấm bảng được trang trí bởi một mạng tinh thể của các chân cách đều nhau. Trên đường đi xuống, bóng chuyển hướng sang phải và trái (... ngẫu nhiên, độc lập) và thu thập ở phía dưới. Theo thời gian, chúng ta thấy một hình dạng gò hình chuông đẹp ngay trước mắt chúng ta.

CLT nói điều tương tự. Đây là một mô tả toán học của hiện tượng này (chính xác hơn, quincunx là bằng chứng vật lý cho sự gần đúng bình thường đối với phân phối nhị thức). Nói một cách lỏng lẻo, CLT nói rằng miễn là dân số của chúng ta không bị xử lý sai quá mức (nghĩa là, nếu các đuôi của PDF đủ mỏng), thì mẫu có nghĩa là (được chia tỷ lệ chính xác) hoạt động giống như quả bóng nhỏ nảy xuống trên mặt của quincunx: đôi khi nó rơi sang bên trái, đôi khi nó rơi sang bên phải, nhưng hầu hết thời gian nó rơi xuống ngay giữa, trong một hình chuông đẹp.

Sự vĩ đại của CLT (với tôi) là hình dạng của dân số cơ bản là không liên quan. Hình dạng chỉ đóng một vai trò trong chừng mực vì nó ủy thác khoảng thời gian chúng ta cần chờ đợi (theo nghĩa kích thước mẫu).


17

Một quan sát liên quan đến CLT có thể là như sau. Khi bạn có tổng của rất nhiều thành phần ngẫu nhiên, nếu một thành phần "nhỏ hơn bình thường" thì điều này chủ yếu được bù bởi một số thành phần khác "lớn hơn bình thường". Nói cách khác, độ lệch âm và độ lệch dương từ thành phần có nghĩa là triệt tiêu lẫn nhau trong tổng kết. Cá nhân, tôi không có trực giác rõ ràng tại sao chính xác các sai lệch còn lại tạo thành một phân phối trông càng ngày càng bình thường, bạn càng có nhiều thuật ngữ.

S=X1+X2++Xn

Có nhiều phiên bản của CLT, một số phiên bản mạnh hơn các phiên bản khác, một số có điều kiện thoải mái như sự phụ thuộc vừa phải giữa các điều khoản và / hoặc phân phối không giống nhau cho các điều khoản. Trong đơn giản nhất-to-chứng minh phiên bản của CLT, bằng chứng là thường dựa trên các chức năng khoảnh khắc tạo (hoặc Laplace-Stieltjes chuyển đổi hoặc chuyển đổi một số khác thích hợp của mật độ) của tổng . Viết điều này như một bản mở rộng Taylor và chỉ giữ thuật ngữ chi phối nhất cung cấp cho bạn chức năng tạo thời điểm của phân phối bình thường. Vì vậy, đối với cá nhân tôi, tính quy tắc là một cái gì đó xuất phát từ một loạt các phương trình và tôi không thể cung cấp bất kỳ trực giác nào hơn thế.S

Tuy nhiên, cần lưu ý rằng phân phối của tổng, không bao giờ thực sự được phân phối bình thường, CLT cũng không tuyên bố rằng nó sẽ như vậy. Nếu là hữu hạn, vẫn còn một khoảng cách đến phân phối chuẩn và nếu cả giá trị trung bình và phương sai cũng là vô hạn. Trong trường hợp sau, bạn có thể lấy giá trị trung bình của tổng vô hạn, nhưng sau đó bạn nhận được một số xác định mà không có bất kỳ phương sai nào, điều này khó có thể được gắn nhãn là "phân phối bình thường".nn=

Điều này có thể đặt ra vấn đề với các ứng dụng thực tế của CLT. Thông thường, nếu bạn quan tâm đến việc phân phối gần trung tâm của nó, CLT hoạt động tốt. Tuy nhiên, sự hội tụ đến mức bình thường không đồng nhất ở mọi nơi và bạn càng rời xa trung tâm, bạn càng cần nhiều điều khoản để có một xấp xỉ hợp lý.S/n

Với tất cả "sự tôn nghiêm" của Định lý giới hạn trung tâm trong thống kê, các hạn chế của nó thường bị bỏ qua quá dễ dàng. Dưới đây tôi đưa ra hai slide từ khóa học của mình, đưa ra quan điểm rằng CLT hoàn toàn thất bại ở đuôi, trong mọi trường hợp sử dụng thực tế. Thật không may, rất nhiều người đặc biệt sử dụng CLT để ước tính xác suất đuôi, cố ý hay cách khác.

nhập mô tả hình ảnh ở đây nhập mô tả hình ảnh ở đây


5
Đây là tài liệu tuyệt vời và lời khuyên khôn ngoan. Thật không may, tôi không thể đánh giá cao nó, bởi vì những lời khẳng định trong "Tính quy phạm này là một tạo tác toán học và tôi nghĩ rằng nó không hữu ích để tìm kiếm bất kỳ sự thật hay trực giác sâu hơn đằng sau nó" là rất khó khăn. Họ dường như gợi ý rằng (1) chúng ta không nên dựa vào toán học để giúp chúng ta về mặt lý thuyết và (2) không có điểm nào để hiểu toán học ngay từ đầu. Tôi hy vọng rằng các bài viết khác trong chủ đề này đã đi một chặng đường dài hướng tới việc từ chối khẳng định thứ hai. Đầu tiên là rất không phù hợp, nó hầu như không chịu phân tích thêm.
whuber

2
@whuber. Bạn nói đúng, tôi ra khỏi giải đấu của tôi có lẽ. Tôi sẽ chỉnh sửa.
StijnDeVuyst 22/03/2015

3
Cảm ơn bạn đã xem xét lại phần có vấn đề và +1 lớn cho phần còn lại.
whuber

7

Câu trả lời này hy vọng sẽ đưa ra một ý nghĩa trực quan của định lý giới hạn trung tâm, sử dụng các kỹ thuật tính toán đơn giản (Taylor mở rộng bậc 3). Đây là phác thảo:

  1. CLT nói gì
  2. Một bằng chứng trực quan về CLT bằng phép tính đơn giản
  3. Tại sao phân phối bình thường?

Chúng tôi sẽ đề cập đến phân phối bình thường vào cuối; bởi vì thực tế là sự phân phối bình thường cuối cùng xuất hiện không mang nhiều trực giác.

1. Định lý giới hạn trung tâm nói gì? Một số phiên bản của CLT

xX1,,Xn

P(X1++Xnnx)n+xet2/22πdt.
X1.,,XnZ1,,Zn
E[f(X1++Xnn)]E[f(Z1++Znn)]n+0
fx
f(t)={1 if t<x0 if tx.
X1,,XnZ1,,Zn

Một số phiên bản khác của CLT có đề cập đến lớp các hàm của Lipschtiz được giới hạn bởi 1; một số phiên bản khác của CLT đề cập đến lớp các hàm trơn tru với đạo hàm giới hạn của thứ tự . Hãy xem xét hai chuỗi và như trên và đối với một số hàm , kết quả hội tụ (CONV)kX1,,XnZ1,,Znf

(CONV)E[f(X1++Xnn)]E[f(Z1++Znn)]n+0

Có thể thiết lập sự tương đương ("nếu và chỉ khi") giữa các câu lệnh sau:

  1. (CONV) ở trên giữ cho mọi hàm chỉ số có dạng với và đối với đối với một số thực cố định .ff(t)=1t<xf(t)=0txx
  2. (CONV) giữ cho mỗi bị chặn chức năng Lipschitz .f:RR
  3. (CONV) giữ cho mọi chức năng trơn tru (nghĩa là ) với sự hỗ trợ nhỏ gọn.C
  4. (CONV) giữ cho mọi chức năng ba lần liên tục khác nhau với .fsupxR|f(x)|1

Mỗi điểm trong 4 điểm trên nói rằng sự hội tụ giữ cho một lớp lớn các hàm. Bằng một lập luận gần đúng về mặt kỹ thuật, người ta có thể chỉ ra rằng bốn điểm trên là tương đương nhau, chúng tôi giới thiệu người đọc đến Chương 7, trang 77 của cuốn sách David Pollard Hướng dẫn sử dụng để đo lường xác suất lý thuyết mà từ đó câu trả lời này được truyền cảm hứng cao.

Giả định của chúng tôi cho phần còn lại của câu trả lời này ...

Chúng tôi sẽ giả sử rằng cho một số hằng số , tương ứng với điểm 4 ở trên. Chúng tôi cũng sẽ giả sử rằng các biến ngẫu nhiên có hữu hạn, giới hạn thứ ba: và là hữu hạn.supxR|f(x)|CC>0E[|Xi|3]E[|Zi|3]

2. Giá trị của là phổ biến: nó không phụ thuộc vào phân phối củaE[f(X1++Xnn)]X1,...,Xn

Hãy để chúng tôi chỉ ra rằng đại lượng này là phổ quát (tối đa một thuật ngữ lỗi nhỏ), theo nghĩa là nó không phụ thuộc vào bộ sưu tập các biến ngẫu nhiên độc lập nào được cung cấp. Lấy và hai chuỗi biến ngẫu nhiên độc lập, mỗi chuỗi có giá trị trung bình 0 và phương sai 1 và giây thứ ba hữu hạn.X1,,XnZ1,,Zn

Ý tưởng là lặp lại thay thế bằng theo một trong số lượng và kiểm soát sự khác biệt bằng phép tính cơ bản (ý tưởng, tôi tin rằng, là do Lindeberg). Bằng cách mở rộng Taylor, nếu và thì trong đó vàXiZiW=Z1++Zn1h(x)=f(x/n)

h(Z1++Zn1+Xn)=h(W)+Xnh(W)+Xn2h(W)2+Xn3/h(Mn)6h(Z1++Zn1+Zn)=h(W)+Znh(W)+Zn2h(W)2+Zn3h(Mn)6
MnMnlà trung điểm được cho bởi định lý giá trị trung bình. Lấy kỳ vọng trên cả hai dòng, thuật ngữ thứ tự zeroth là như nhau, các điều khoản thứ tự đầu tiên là bằng nhau vì kỳ vọng của và , và tương tự cho dòng thứ hai. Một lần nữa bởi sự độc lập, các điều khoản thứ hai là giống nhau trong kỳ vọng. Các thuật ngữ duy nhất còn lại là thứ tự thứ ba, và trong kỳ vọng, sự khác biệt giữa hai dòng nhiều nhất là Ở đây là giới hạn trên của đạo hàm thứ ba của . Mẫu số xuất hiện vìXnWE[Xnh(W)]=E[Xn]E[h(W)]=0

(C/6)E[|Xn|3+|Zn|3](n)3.
Cf(n)3h(t)=f(t/n)/(n)3 . Nếu độc lập, sự đóng góp của trong tổng là vô nghĩa vì nó có thể được thay thế bằng mà không phát sinh lỗi lớn hơn màn hình trên!XnZn

Bây giờ chúng tôi nhắc lại để thay thế bằng . Nếu thì Bằng sự độc lập của và và bởi sự độc lập của vàXn1Zn1W~=Z1+Z2++Zn2+Xn

h(Z1++Zn2+Xn1+Xn)=h(W~)+Xn1h(W~)+Xn12h(W~)2+Xn13/h(M~n)6h(Z1++Zn2+Zn1+Xn)=h(W~)+Zn1h(W~)+Zn12h(W~)2+Zn13/h(M~n)6.
Zn1W~Xn1W~, một lần nữa zeroth, các điều khoản thứ tự đầu tiên và thứ hai là bằng nhau trong kỳ vọng cho cả hai dòng. Sự khác biệt về kỳ vọng giữa hai dòng một lần nữa nhiều nhất là Chúng tôi tiếp tục lặp đi lặp lại cho đến khi chúng tôi thay thế tất cả bằng . Bằng cách thêm các lỗi được thực hiện ở mỗi bước, chúng ta sẽ có được như

(C/6)E[|Xn1|3+|Zn1|3](n)3.
ZiXin
|E[f(X1++Xnn)]E[f(Z1++Znn)]|n(C/6)maxi=1,,nE[|Xi|3+|Zi|3](n)3.
ntăng, phía bên tay phải trở nên nhỏ tùy ý nếu khoảnh khắc thứ ba hoặc các biến ngẫu nhiên là hữu hạn (giả sử đó là trường hợp). Điều này có nghĩa là các kỳ vọng ở bên trái trở nên gần nhau tùy ý, bất kể phân phối của xa so với . Bằng tính độc lập, đóng góp của mỗi trong tổng là vô nghĩa vì nó có thể được thay thế bằng mà không phát sinh lỗi lớn hơn . Và thay thế tất cả bằng không thay đổi số lượng nhiều hơn .X1,,XnZ1,,ZnXiZiO(1/(n)3)XiZiO(1/n)

Kỳ vọng vì thế là phổ biến, nó không phụ thuộc vào phân phối của . Mặt khác, tính độc lập và có tầm quan trọng tối đa đối với các giới hạn trên.E[f(X1++Xnn)]X1,,XnE[Xi]=E[Zi]=0,E[Zi2]=E[Xi2]=1

3. Tại sao phân phối bình thường?

Chúng tôi đã thấy rằng kỳ vọng sẽ giống nhau cho dù phân phối của là gì, cho đến khi lỗi nhỏ của đơn hàng .E[f(X1++Xnn)]XiO(1/n)

Nhưng đối với các ứng dụng, sẽ rất hữu ích khi tính toán số lượng như vậy. Cũng rất hữu ích khi có được biểu thức đơn giản hơn cho đại lượng này .E[f(X1++Xnn)]

Vì số lượng này là giống nhau cho mọi bộ sưu tập , chúng tôi chỉ cần chọn một bộ sưu tập cụ thể sao cho phân phối dễ tính toán hoặc dễ nhớ.X1,,Xn(X1++Xn)/n

Đối với phân phối chuẩn , số lượng này trở nên thực sự đơn giản. Thật vậy, nếu là iid thì cũng có phân phối và nó không phụ thuộc vào ! Do đó, nếu , thì và theo đối số trên, đối với mọi tập hợp các biến ngẫu nhiên độc lập với , sau đóN(0,1)Z1,,ZnN(0,1)Z1++ZnnN(0,1)nZN(0,1)

E[f(Z1++Znn)]=E[f(Z)],
X1,,XnE[Xi]=0,E[Xi2]=1

|E[f(X1++Xnn)]E[f(Z)|supxR|f(x)|maxi=1,,nE[|Xi|3+|Z|3]6n.

Bạn dường như đang khẳng định một luật về số lượng lớn hơn là CLT.
whuber

1
Tôi không chắc tại sao bạn lại nói điều này, @whuber. Ở trên đưa ra một bằng chứng trực quan rằng hội tụ đến trong đó cho một lớp lớn các hàm . Đây là CLT. E[f(Z)]E[f((X1+...+Xn)/n)]E[f(Z)]fZN(0,1)f
jlewk

2
Tôi hiểu ý bạn là gì. Điều khiến tôi tạm dừng là khẳng định của bạn chỉ liên quan đến kỳ vọng và không phân phối, trong khi CLT đưa ra kết luận về phân phối giới hạn. Sự tương đương giữa hai có thể không rõ ràng ngay lập tức đối với nhiều người. Sau đó, tôi có thể đề nghị rằng bạn cung cấp một kết nối rõ ràng giữa tuyên bố của bạn và các tuyên bố thông thường của CLT về mặt giới hạn phân phối không? (+1 bằng cách này: cảm ơn bạn đã xây dựng lập luận này.)
whuber

1

Tôi đã từ bỏ việc cố gắng đưa ra một phiên bản trực quan và đưa ra một số mô phỏng. Tôi có một bản trình bày mô phỏng Quincunx và một số thứ khác làm những việc như thể hiện cách phân phối thời gian phản ứng thô bị lệch sẽ trở nên bình thường nếu bạn thu thập đủ RT cho mỗi đối tượng. Tôi nghĩ họ giúp nhưng họ mới vào lớp tôi năm nay và tôi chưa chấm bài kiểm tra đầu tiên.

Một điều mà tôi nghĩ là tốt là có thể thể hiện luật số lượng lớn. Tôi có thể chỉ ra cách mọi thứ thay đổi với kích thước mẫu nhỏ và sau đó cho thấy cách chúng ổn định với kích thước lớn. Tôi cũng làm một loạt các bản demo số lượng lớn khác. Tôi có thể hiển thị sự tương tác trong Quincunx giữa số lượng quy trình ngẫu nhiên và số lượng mẫu.

(hóa ra việc không thể sử dụng phấn hoặc bảng trắng trong lớp học của tôi có thể là một phước lành)


Xin chào John: rất vui khi gặp lại bạn với bài đăng này sau gần chín năm! Sẽ rất thú vị khi đọc về những trải nghiệm bạn đã có trong thời gian đó với việc bạn sử dụng mô phỏng để dạy ý tưởng về CLT và LLNs.
whuber

Tôi đã ngừng dạy lớp đó một năm sau đó nhưng người hướng dẫn sau đó đã chọn ra ý tưởng mô phỏng. Trên thực tế, anh ta mang nó xa hơn nhiều và đã phát triển một chuỗi các ứng dụng sáng bóng và cho học sinh chơi với các mô phỏng cho vô số thứ trong lớp 250 người. Gần như tôi có thể nói từ việc dạy lớp trên, các sinh viên dường như nhận được rất nhiều từ nó. Sự khác biệt giữa học sinh của anh ấy và những người từ các lớp trung chuyển tương đương là đáng chú ý. (nhưng, tất nhiên, có rất nhiều biến không được kiểm soát ở đó)
John

Cảm ơn, John. Thật là bất thường khi nhận được phản hồi thậm chí là giai thoại về kết quả học tập lâu dài của học sinh sau khi một lớp học kết thúc mà tôi tìm thấy ngay cả thông tin quan tâm hạn chế này.
whuber

-8

Khi bạn thêm nhiều biểu đồ phân phối ngẫu nhiên cùng nhau, bạn sẽ duy trì hình dạng phân phối bình thường vì tất cả các biểu đồ riêng lẻ đã có hình dạng đó hoặc bạn có hình dạng đó vì các dao động trong biểu đồ riêng lẻ có xu hướng triệt tiêu lẫn nhau nếu bạn thêm lớn số lượng biểu đồ. Một biểu đồ phân phối ngẫu nhiên của một biến đã được phân phối xấp xỉ theo cách mà mọi người đã bắt đầu gọi phân phối bình thường bởi vì nó rất phổ biến và đó là một mô hình thu nhỏ của định lý giới hạn trung tâm.

Đây không phải là toàn bộ câu chuyện nhưng tôi nghĩ nó trực quan như nó có.


2
Mô tả của bạn về âm thanh "phân phối bình thường" thay vào đó giống như một phiên bản rời rạc của hàm mũ đôi, thậm chí không giống như phân phối chuẩn Gaussian (ngoại trừ cả hai đều không đồng nhất và đối xứng). Biểu đồ của các lần lật đồng xu không có các thanh giảm theo hệ số với mỗi bước! Điều đó cho thấy có thể có một số khó khăn ẩn giấu trong lời giải thích này đã được đưa ra bởi một kháng cáo về "trực giác". 2
whuber

5
Câu trả lời này chủ yếu là vô nghĩa. Không có số lần lật của một đồng xu công bằng sẽ dẫn đến việc phân phối số lượng đầu có xác suất ; thực sự đó thậm chí không phải là một hàm xác suất! Những cũng không số người đứng đầu liên tiếp có bất cứ điều gì để làm với câu hỏi này. 18,14,12,14,18
Dilip Sarwate
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.