Làm thế nào để bạn truyền đạt vẻ đẹp của Định lý giới hạn trung tâm cho một người không thống kê?


33

Cha tôi là một người đam mê toán học, nhưng không quan tâm đến số liệu thống kê nhiều. Sẽ thật gọn gàng khi cố gắng minh họa một số bit tuyệt vời của số liệu thống kê và CLT là một ứng cử viên chính. Làm thế nào bạn sẽ truyền đạt vẻ đẹp toán học và tác động của định lý giới hạn trung tâm đến một người không thống kê?


Một suy nghĩ nhanh là đưa quy tắc 68-95-99.7 ( en.wikipedia.org/wiki/68-95-99.7_rule ) vào cuộc thảo luận bằng cách nào đó.
raegtin

Câu trả lời:


16

Điều tôi yêu thích nhất với CLT là những trường hợp không áp dụng được - điều này mang đến cho tôi một hy vọng rằng cuộc sống thú vị hơn một chút mà đường cong Gauss gợi ý. Vì vậy, cho anh ta thấy phân phối Cauchy.


mối quan hệ giữa phân phối Cauchy và CLT hoặc việc điền vào CLT là gì?
cướp girard


CLT yêu cầu MGF tồn tại trong vùng lân cận 0. Phân phối Cauchy không có thuộc tính đó. CLT giành chiến thắng. Cauchy thậm chí không thỏa mãn các yêu cầu yếu hơn của phiên bản CLT mạnh hơn trong đó tất cả những gì được yêu cầu là giá trị trung bình và phương sai tồn tại. Phân phối Cauchy cho thấy giá trị trung bình là bắt buộc để CLT giữ. Nó không làm cho CLT thất bại.
Baltimark

@Baltimark Bạn đã hiểu nhầm bài đăng của tôi - rõ ràng là Cachy không được CLT bảo vệ vì các giả định của CLT, nếu không thì không thể chứng minh CLT. Tôi đã đưa ra ví dụ này bởi vì mọi người tin rằng CLT hoạt động cho tất cả các bản phân phối; có lẽ "thất bại" không phải là một từ hoàn hảo, nhưng tôi vẫn không nghĩ rằng đó là một lý do cho downvote. Ok, tôi thậm chí đã thay đổi nó để không áp dụng.

Tôi thích chỉnh sửa của bạn. Phân phối Cauchy chắc chắn là rất mát mẻ.
Baltimark

14

Để đánh giá đầy đủ CLT, nó nên được nhìn thấy.

Do đó, khái niệm về máy làm đậu và rất nhiều video youtube để minh họa.


Tôi nghĩ rằng nó cho thấy phân phối nhị thức; Tôi không nghĩ rằng tiệm cận của nó có liên kết trực tiếp với CLT.

2
máy đậu của tác giả của gói hoạt hình ... yihui.name/en/wp-content/uploads/2010/07/ Kẻ
cướp girard


@robin Mình đã viết về nó, có vấn đề gì vậy?

1
Tài khoản chỉ là một giới hạn của một phân phối nhị thức.

7

Thông thường khi các nhà toán học nói về xác suất họ bắt đầu bằng một phân phối xác suất đã biết sau đó nói về xác suất của các sự kiện. Giá trị thực của định lý giới hạn trung tâm là nó cho phép chúng ta sử dụng phân phối chuẩn như một xấp xỉ trong trường hợp chúng ta không biết phân phối thực. Bạn có thể hỏi cha mình một câu hỏi thống kê tiêu chuẩn (nhưng được gọi là toán học) về xác suất mà giá trị trung bình của mẫu sẽ lớn hơn giá trị đã cho nếu dữ liệu đến từ phân phối có trung bình mu và sd sigma, sau đó xem anh ta giả định một phân phối (mà sau đó bạn nói rằng chúng tôi không biết) hoặc nói rằng anh ta cần biết phân phối. Sau đó, bạn có thể chỉ ra rằng chúng tôi có thể tính gần đúng câu trả lời bằng CLT trong nhiều trường hợp.

Để so sánh toán học với các số liệu thống kê, tôi thích sử dụng định lý giá trị trung bình của tích phân (trong đó nói rằng đối với tích phân từ a đến b tồn tại một hình chữ nhật từ a đến b có cùng diện tích và chiều cao của hình chữ nhật là trung bình của đường cong). Nhà toán học nhìn vào định lý này và nói "tuyệt, tôi có thể sử dụng tích phân để tính trung bình", trong khi nhà thống kê nhìn vào cùng một định lý và nói "tuyệt, tôi có thể sử dụng trung bình để tính tích phân".

Tôi thực sự đã treo tranh treo tường trong văn phòng của tôi về định lý giá trị trung bình và CLT (cùng với định lý Bayes).


Hừm. Tôi nghĩ rằng hầu hết các nhà toán học sử dụng MVT để tính gần đúng một tích phân dưới dạng hình chữ nhật.
Đức hồng y

5

Tôi muốn chứng minh biến thể lấy mẫu và về cơ bản là Định lý giới hạn trung tâm thông qua một bài tập "trong lớp". Mọi người trong lớp nói 100 học sinh viết tuổi của họ trên một tờ giấy. Tất cả các mảnh giấy có cùng kích thước và được gấp theo cùng một kiểu sau khi tôi đã tính trung bình. Đây là dân số và tôi tính tuổi trung bình. Sau đó, mỗi học sinh chọn ngẫu nhiên 10 mẩu giấy, ghi lại các lứa tuổi và trả chúng vào túi. (S) anh ta tính toán trung bình và chuyển túi cho học sinh tiếp theo. Cuối cùng, chúng tôi có 100 mẫu gồm 10 sinh viên, mỗi người ước tính dân số có nghĩa là chúng tôi có thể mô tả thông qua biểu đồ và một số thống kê mô tả.

Sau đó, chúng tôi lặp lại cuộc biểu tình lần này bằng cách sử dụng một bộ 100 "ý kiến" sao chép một số câu hỏi Có / Không từ các cuộc thăm dò gần đây, ví dụ: Nếu cuộc bầu cử (Đại tướng Anh) được gọi vào ngày mai, bạn sẽ xem xét bỏ phiếu cho Đảng Quốc gia Anh. Học sinh họ mẫu 10 trong số những ý kiến ​​này.

Cuối cùng, chúng tôi đã chứng minh biến thể lấy mẫu, Định lý giới hạn trung tâm, v.v. với cả dữ liệu nhị phân và dữ liệu nhị phân.


4

Chơi xung quanh với mã sau đây, thay đổi giá trị Mvà chọn phân phối khác với đồng phục có thể là một minh họa thú vị.

N <- 10000
M <- 5
meanvals <- replicate(N, expr = {mean(runif(M,min=0, max=1))}) 
hist(meanvals, breaks=50, prob=TRUE) 

2

Nếu bạn sử dụng Stata, bạn có thể sử dụng lệnh -clt- tạo biểu đồ phân phối lấy mẫu, xem

http://www.ats.ucla.edu/stat/stata/ado/teach/clt.htm


Có vẻ như nó có thể rất đẹp, nhưng tôi chỉ thử cài đặt và chạy nó trong Stata 11.1 (tức là phiên bản mới nhất) và nó vẫn gây ra lỗi r (3000) khi nhấp vào "Xong" trong hộp thoại, ngay cả khi tôi gõ - phiên bản 6: clt-.
vào

2

Theo kinh nghiệm của tôi, CLT ít hữu ích hơn nó xuất hiện. Người ta không bao giờ biết ở giữa một dự án liệu n có đủ lớn để phép tính gần đúng có đủ cho nhiệm vụ hay không. Và để kiểm tra thống kê, CLT giúp bạn bảo vệ lỗi loại I nhưng không có lỗi gì để giữ lỗi loại II. Ví dụ, kiểm tra t có thể có công suất thấp tùy ý cho n lớn khi phân phối dữ liệu cực kỳ sai lệch.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.