Làm thế nào các nhà khoa học tìm ra hình dạng của hàm mật độ xác suất phân phối bình thường?


36

Đây có lẽ là một câu hỏi nghiệp dư, nhưng tôi quan tâm đến việc làm thế nào các nhà khoa học đưa ra hình dạng của hàm mật độ xác suất phân phối bình thường? Về cơ bản, điều khiến tôi băn khoăn là đối với ai đó có lẽ trực quan hơn là hàm xác suất của dữ liệu phân phối thông thường có hình tam giác cân chứ không phải đường cong hình chuông và bạn sẽ chứng minh cho người đó biết hàm mật độ xác suất như thế nào tất cả dữ liệu phân phối bình thường có hình chuông? Bằng thí nghiệm? Hoặc bằng một số dẫn xuất toán học?

Sau tất cả những gì chúng ta thực sự xem xét dữ liệu phân phối bình thường? Dữ liệu theo mô hình xác suất của phân phối bình thường, hoặc cái gì khác?

Về cơ bản câu hỏi của tôi là tại sao hàm mật độ xác suất phân phối bình thường có hình chuông mà không phải hình nào khác? Và làm thế nào các nhà khoa học tìm ra kịch bản thực tế nào có thể áp dụng phân phối bình thường, bằng thí nghiệm hoặc bằng cách nghiên cứu bản chất của các dữ liệu khác nhau?


Vì vậy, tôi đã tìm thấy liên kết này thực sự hữu ích trong việc giải thích sự xuất phát của dạng chức năng của đường cong phân phối bình thường, và do đó trả lời câu hỏi "Tại sao phân phối bình thường trông giống như vậy mà không phải là gì khác?". Lý luận thực sự suy nghĩ, ít nhất là đối với tôi.


2
Kiểm tra câu hỏi này - không đúng khi tuyên bố rằng chỉ phân phối bình thường là "hình chuông".
Cá bạc

11
Phân phối bình thường có một số thuộc tính thống kê cực kỳ quan trọng, làm cho nó trở thành một đối tượng nghiên cứu đặc biệt và cũng có nghĩa là nó thường phát sinh "một cách tự nhiên", ví dụ như trường hợp giới hạn của các phân phối khác. Xem cụ thể Định lý giới hạn trung tâm . Tuy nhiên, nó không phải là phân phối duy nhất đạt đỉnh ở giữa và có đuôi ở hai bên. Mọi người thường cho rằng dữ liệu đó là bình thường vì biểu đồ "trông giống hình chuông", nhưng câu trả lời được liên kết của tôi cho thấy có nhiều phân phối ứng cử viên khác cho các bộ dữ liệu đó như thế nào.
Cá bạc

4
Lưu ý rằng các nhà thống kê đã không khám phá phân phối bình thường bằng cách xem xét nhiều bộ dữ liệu và nhận ra hàm mật độ này thực sự phù hợp với nhiều người trong số họ. Khi bạn tự hỏi trong câu hỏi của mình, đã có một quá trình điều tra toán học về một số vấn đề nhất định trong lý thuyết xác suất, trong đó phân phối bình thường "bật ra" như một câu trả lời. Điều này được giải thích rõ trong ví dụ câu trả lời này ở đây .
Cá bạc

3
Và về cơ bản nếu ai đó yêu cầu tôi giải thích cho họ tại sao phân phối bình thường là "bình thường", tôi sẽ cần giải thích cho họ lịch sử phân phối bình thường kéo dài và phức tạp bắt đầu từ phân phối nhị thức và sau đó, có lẽ chứng minh định lý giới hạn trung tâm và chỉ ra rằng phân phối chuẩn được áp dụng trong nghiên cứu nhiều tình huống trong cuộc sống thực.
ahra

5
Bạn có thể hình dung hình dạng của một bản phân phối bình thường bằng cách sử dụng một trong những thiết bị tiện lợi này được gọi là bảng Galton. Trên thực tế đó là một phân phối nhị thức, nhưng, bạn biết đấy, định lý giới hạn trung tâm.
Federico Poloni

Câu trả lời:


21

" Sự phát triển của phân phối bình thường " của SAUL STAHL là nguồn thông tin tốt nhất để trả lời khá nhiều câu hỏi trong bài viết của bạn. Tôi sẽ chỉ đọc một vài điểm để thuận tiện cho bạn, bởi vì bạn sẽ tìm thấy cuộc thảo luận chi tiết bên trong bài báo.

Đây có lẽ là một câu hỏi nghiệp dư

Không, đó là một câu hỏi thú vị cho bất cứ ai sử dụng số liệu thống kê, bởi vì điều này không được đề cập chi tiết ở bất cứ đâu trong các khóa học tiêu chuẩn.

Về cơ bản, điều khiến tôi băn khoăn là đối với ai đó có lẽ trực quan hơn là hàm xác suất của dữ liệu phân phối thông thường có hình tam giác cân chứ không phải đường cong hình chuông và bạn sẽ chứng minh cho người đó biết hàm mật độ xác suất như thế nào tất cả dữ liệu phân phối bình thường có hình chuông?

Nhìn vào bức tranh này từ tờ giấy. Nó cho thấy các đường cong lỗi mà Simpson đã đưa ra trước khi Gaussian (Bình thường) được phát hiện để phân tích dữ liệu thực nghiệm. Vì vậy, trực giác của bạn là tại chỗ.

nhập mô tả hình ảnh ở đây

Bằng thí nghiệm?

Vâng, đó là lý do tại sao chúng được gọi là "đường cong lỗi". Thí nghiệm là các phép đo thiên văn. Các nhà thiên văn đã vật lộn với các lỗi đo lường trong nhiều thế kỷ.

Hoặc bằng một số dẫn xuất toán học?

Một lần nữa, CÓ! Câu chuyện dài ngắn: việc phân tích các lỗi trong dữ liệu thiên văn đã đưa Gauss đến bản phân phối (hay còn gọi là Bình thường) của ông. Đây là những giả định anh ta đã sử dụng:

nhập mô tả hình ảnh ở đây

Nhân tiện, Laplace đã sử dụng một vài cách tiếp cận khác nhau, và cũng đã đưa ra phân phối của mình trong khi làm việc với dữ liệu thiên văn:

nhập mô tả hình ảnh ở đây

Về lý do tại sao phân phối bình thường cho thấy trong thí nghiệm là lỗi đo lường, đây là một nhà vật lý giải thích "lượn sóng tay" điển hình được sử dụng để đưa ra (trích dẫn từ Gerhard Bohm, Günter Zech, Giới thiệu về Thống kê và Phân tích dữ liệu cho các nhà vật lý trang 85):

Nhiều tín hiệu thử nghiệm tuân theo một xấp xỉ rất tốt một phân phối bình thường. Điều này là do thực tế là chúng bao gồm tổng của nhiều đóng góp và hệ quả của định lý giới hạn trung tâm.


2
Tham chiếu Stahl giải quyết câu hỏi ban đầu rất nhiều từ góc độ mà nó được đặt ra - đó là một phát hiện thực sự tốt đẹp.
Cá bạc

44

Bạn dường như cho rằng trong câu hỏi của bạn rằng khái niệm phân phối bình thường đã xuất hiện trước khi phân phối được xác định và mọi người đã cố gắng tìm ra nó là gì. Nó không rõ ràng với tôi như thế nào sẽ làm việc. [Chỉnh sửa: có ít nhất một ý nghĩa mà chúng ta có thể xem là có "tìm kiếm phân phối" nhưng đó không phải là "tìm kiếm phân phối mô tả rất nhiều hiện tượng"]

Đây không phải là trường hợp; phân phối đã được biết đến trước khi nó được gọi là phân phối bình thường.

Làm thế nào bạn có thể chứng minh cho một người như vậy rằng hàm mật độ xác suất của tất cả dữ liệu được phân phối thông thường có hình chuông

Hàm phân phối bình thường là thứ có cái thường được gọi là "hình chuông" - tất cả các phân phối bình thường có cùng "hình dạng" (theo nghĩa là chúng chỉ khác nhau về quy mô và vị trí).

Dữ liệu có thể trông ít nhiều "hình chuông" trong phân phối nhưng điều đó không làm cho nó bình thường. Rất nhiều bản phân phối không bình thường trông giống như "hình chuông".

Phân phối dân số thực tế mà dữ liệu được rút ra có khả năng không bao giờ thực sự bình thường, mặc dù đôi khi nó khá gần đúng.

Điều này thường đúng với hầu hết tất cả các bản phân phối mà chúng tôi áp dụng cho mọi thứ trong thế giới thực - chúng là mô hình , không phải sự thật về thế giới. [Ví dụ: nếu chúng tôi đưa ra một số giả định nhất định (những giả định cho quy trình Poisson), chúng tôi có thể rút ra phân phối Poisson - một phân phối được sử dụng rộng rãi. Nhưng những giả định đó có bao giờ chính xác thỏa mãn? Nói chung, điều tốt nhất chúng ta có thể nói (trong các tình huống phù hợp) là chúng rất gần đúng.]

những gì chúng ta thực sự xem xét dữ liệu phân phối bình thường? Dữ liệu theo mô hình xác suất của phân phối bình thường, hoặc cái gì khác?

Đúng, để thực sự được phân phối bình thường, dân số mẫu được rút ra sẽ phải có phân phối có dạng chức năng chính xác của phân phối bình thường. Kết quả là, bất kỳ dân số hữu hạn có thể là bình thường. Các biến nhất thiết bị giới hạn không thể là bình thường (ví dụ: thời gian thực hiện cho các tác vụ cụ thể, độ dài của những thứ cụ thể không thể âm, vì vậy chúng thực sự không thể được phân phối bình thường).

có lẽ sẽ trực quan hơn khi hàm xác suất của dữ liệu được phân phối bình thường có hình tam giác cân

Tôi không thấy lý do tại sao điều này nhất thiết phải trực quan hơn. Nó chắc chắn đơn giản hơn.

Khi lần đầu tiên phát triển các mô hình phân phối lỗi (cụ thể là thiên văn học trong giai đoạn đầu), các nhà toán học đã xem xét nhiều hình dạng liên quan đến phân phối lỗi (bao gồm cả tại một điểm phân bố tam giác), nhưng trong phần lớn công việc này là toán học (đúng hơn hơn trực giác) đã được sử dụng. Laplace đã xem xét các phân phối theo cấp số nhân và bình thường gấp đôi (trong số một số khác). Tương tự, Gauss đã sử dụng toán học để rút ra nó cùng một lúc, nhưng liên quan đến một tập hợp cân nhắc khác với Laplace đã làm.

Theo nghĩa hẹp rằng Laplace và Gauss đang xem xét "phân phối lỗi", chúng ta có thể coi đó là "tìm kiếm phân phối", ít nhất là trong một thời gian. Cả hai đều yêu cầu một số thuộc tính cho phân phối lỗi mà họ cho là quan trọng (Laplace coi một chuỗi các tiêu chí hơi khác nhau theo thời gian) dẫn đến các phân phối khác nhau.

Về cơ bản câu hỏi của tôi là tại sao hàm mật độ xác suất phân phối bình thường có hình chuông mà không phải hình nào khác?

Dạng chức năng của thứ được gọi là hàm mật độ bình thường cho nó hình dạng đó. Xem xét tiêu chuẩn bình thường (để đơn giản; mọi bình thường khác có hình dạng giống nhau, chỉ khác nhau về tỷ lệ và vị trí):

fZ(z)= =ke-12z2;-<z<

k

x

Mặc dù một số người đã coi phân phối bình thường là "thông thường" bằng cách nào đó, nó thực sự chỉ trong các tình huống cụ thể mà bạn thậm chí có xu hướng coi đó là một xấp xỉ.


Việc phát hiện ra phân phối thường được ghi có vào de Moivre (như là một xấp xỉ với nhị thức). Thực tế, anh ta đã tạo ra dạng hàm khi cố gắng tính gần đúng các hệ số nhị thức (/ xác suất nhị thức) để tính gần đúng các phép tính tẻ nhạt nhưng - trong khi anh ta thực sự rút ra được dạng phân phối bình thường - anh ta dường như không nghĩ về phép tính gần đúng của mình phân phối xác suất, mặc dù một số tác giả cho rằng ông đã làm. Một số lượng giải thích nhất định là cần thiết để có phạm vi cho sự khác biệt trong giải thích đó.

Gauss và Laplace đã làm việc với nó vào đầu những năm 1800; Gauss đã viết về nó vào năm 1809 (liên quan đến nó là phân phối mà giá trị trung bình là MLE của trung tâm) và Laplace vào năm 1810, như là một xấp xỉ với phân phối tổng của các biến ngẫu nhiên đối xứng. Một thập kỷ sau Laplace đưa ra một dạng sớm của định lý giới hạn trung tâm, cho các biến rời rạc và liên tục.

Các tên ban đầu của phân phối bao gồm luật lỗi , luật tần suất lỗi và nó cũng được đặt theo tên của cả Laplace và Gauss, đôi khi cùng nhau.

Thuật ngữ "bình thường" được sử dụng để mô tả sự phân phối một cách độc lập bởi ba tác giả khác nhau vào những năm 1870 (Peirce, Lexis và Galton), lần đầu tiên vào năm 1873 và hai lần khác vào năm 1877. Đây là hơn sáu mươi năm sau tác phẩm của Gauss và Laplace và hơn hai lần kể từ khi xấp xỉ de Moivre. Việc sử dụng nó của Galton có lẽ có ảnh hưởng nhất nhưng ông đã sử dụng thuật ngữ "bình thường" chỉ liên quan đến nó một lần trong tác phẩm năm 1877 đó (chủ yếu gọi đó là "luật sai lệch").

Tuy nhiên, vào những năm 1880, Galton đã sử dụng tính từ "bình thường" liên quan đến phân phối nhiều lần (ví dụ như "đường cong bình thường" vào năm 1889), và đến lượt ông có rất nhiều ảnh hưởng đến các nhà thống kê sau này ở Anh (đặc biệt là Karl Pearson ). Anh ta không nói lý do tại sao anh ta sử dụng thuật ngữ "bình thường" theo cách này, nhưng có lẽ có nghĩa là "thông thường" hoặc "thông thường".

Việc sử dụng rõ ràng đầu tiên của cụm từ "phân phối bình thường" dường như là của Karl Pearson; ông chắc chắn sử dụng nó vào năm 1894, mặc dù ông tuyên bố đã sử dụng nó từ lâu (một tuyên bố tôi sẽ xem xét một cách thận trọng).


Tài liệu tham khảo:

Miller, Jeff
"Sử dụng sớm nhất một số từ của toán học:"
Phân phối bình thường (Entry by John Aldrich)
http://jeff560.tripod.com/n.html

Stahl, Saul (2006),
"Sự phát triển của phân phối bình thường",
Tạp chí toán học , số. 79, Số 2 (Tháng 4), Trang 96-113 https://www.maa.org/sites/default/files/pdf/upload_l Library / 22 / Allendoerfer / stahl96.pdf

Phân phối bình thường, (2016, ngày 1 tháng 8).
Trong Wikipedia, Bách khoa toàn thư miễn phí.
Truy cập 12:02, ngày 3 tháng 8 năm 2016, từ https://en.wikipedia.org/w/index.php?title=N normal_distribution & oldid = 755559095 # histist

Hald, A (2007),
"Xấp xỉ bình thường của De Moivre đối với nhị thức, 1733 và khái quát hóa của nó",
Trong: Lịch sử suy luận thống kê tham số từ Bernoulli đến Fisher, 1713 ném1935; Trang 17-24

[Bạn có thể lưu ý sự khác biệt đáng kể giữa các nguồn này liên quan đến tài khoản de Moivre của họ]


Cảm ơn bạn đã trả lời sâu sắc! Tôi đã xem xét thêm về cách hình dạng của phân phối bình thường được bắt nguồn và tôi đã tìm thấy tài liệu này các khóa học.ncssm.edu/math/Talks/PDFS/n normal.pdf và tôi có một vấn đề hiểu làm thế nào chúng ta có thể cho rằng lỗi không phụ thuộc vào hướng của hệ tọa độ (một giả định cho phép đưa ra kết luận quan trọng sau này), khi đó đối với tôi, giả định đó chỉ giữ trong ví dụ về phi tiêu, chứ không phải trong ví dụ về lỗi thử nghiệm ngẫu nhiên .
ahra

Trên thực tế, toàn bộ cách tiếp cận phi tiêu làm tôi bối rối vì tôi đang nghiên cứu phân phối bình thường trong bối cảnh các lỗi thử nghiệm ngẫu nhiên. Tôi đoán rằng cách tiếp cận phi tiêu giả định rằng bạn có thể mắc lỗi độc lập ở hai chiều, trong bối cảnh được sử dụng nhưng tôi không rõ nó sẽ dịch cái gì trong bối cảnh lỗi thử nghiệm khi bạn có biến phụ thuộc và biến độc lập có nghĩa là bạn có thể mắc lỗi chỉ trong một chiều.
ahra

1
Sử dụng tuyệt vời của tài liệu tham khảo. +1
Aaron Hall

2
Tôi nghĩ rằng "định lý giới hạn trung tâm" nên được đề cập ở đây ở đâu đó, vì OP dường như (ít nhất là một phần) sẽ hỏi tại sao phân phối cụ thể này lại phổ biến đến vậy.
JOC

1
@joc Tôi không thấy câu hỏi về mức độ phổ biến hoặc thậm chí gợi ý một câu hỏi về nó. Tuy nhiên, tôi nói về công việc của de Moivre liên quan đến nhị thức và về công việc của Laplace liên quan đến các xấp xỉ bình thường đối với các tổng của các biến ngẫu nhiên đối xứng ... liên quan trực tiếp hơn đến câu hỏi. Tuy nhiên, tôi sẽ thêm một câu liên quan đến công việc của Laplace về vấn đề này (mặc dù nó sẽ không được gọi như vậy trong một thế kỷ nữa).
Glen_b -Reinstate Monica

11

Phân phối "bình thường" được định nghĩa là phân phối cụ thể đó.

Câu hỏi đặt ra là tại sao chúng ta lại mong muốn phân phối cụ thể này là phổ biến trong tự nhiên và tại sao nó thường được sử dụng như một xấp xỉ ngay cả khi dữ liệu thực không tuân theo chính xác phân phối đó? (Dữ liệu thực thường được tìm thấy có "đuôi béo", nghĩa là các giá trị ở xa giá trị trung bình phổ biến hơn nhiều so với phân phối bình thường sẽ dự đoán).

Nói cách khác, phân phối bình thường có gì đặc biệt?

Bình thường có rất nhiều thuộc tính thống kê "đẹp", (ví dụ: https://en.wikipedia.org/wiki/Central_limit_theorem ), nhưng IMO có liên quan nhất là chức năng "entropy tối đa" cho bất kỳ phân phối nào với một trung bình và phương sai cho trước. https://en.wikipedia.org/wiki/Maximum_entropy_probability_distribution

Để diễn đạt điều này bằng ngôn ngữ thông thường, nếu bạn chỉ được cung cấp trung bình (điểm trung tâm) và phương sai (chiều rộng) của phân phối và bạn không cho rằng bất cứ điều gì khác về nó, bạn sẽ buộc phải vẽ một phân phối bình thường. Bất cứ điều gì khác đòi hỏi thông tin bổ sung (theo nghĩa của lý thuyết thông tin Shannon ), ví dụ như độ lệch, để xác định nó.

Nguyên tắc entropy tối đa được ET Jaynes đưa ra như một cách xác định các linh mục hợp lý theo suy luận Bayes, và tôi nghĩ ông là người đầu tiên thu hút sự chú ý đến tài sản này.

Xem phần này để thảo luận thêm: http://www.inf.fu-berlin.de/inst/ag-ki/rojas_home/document/tutorials/Gaussian-distribution.pdf


6
"Nói cách khác, nếu bạn chỉ được cung cấp trung bình (điểm trung tâm) và phương sai (chiều rộng) của phân phối và bạn không cho rằng bất cứ điều gì khác về nó, bạn sẽ buộc phải vẽ một phân phối bình thường." Tôi đoán điều đó phụ thuộc vào định nghĩa của "bắt buộc" là gì. Bạn có thể bị ép buộc. Tôi sẽ không. Những gì bạn đã mô tả là tương đương về mặt đạo đức khi bị "ép buộc" giả sử một hàm là tuyến tính khi bạn không biết dạng của nó hoặc các biến ngẫu nhiên là độc lập khi bạn không biết sự phụ thuộc chính xác của chúng. Tôi không, không, và sẽ không bị buộc phải đưa ra bất kỳ giả định nào trong số này.
Mark L. Stone

5
@Neil Tôi tin rằng một phần quan điểm của Mark có thể là sự biện minh không bắt buộc.
whuber

5
@Neil Xa nó! Trước tiên, bạn phải cho rằng nguyên tắc entropy tối đa là hữu ích và áp dụng cho vấn đề thống kê của bạn. Tiếp theo, bạn phải hoàn toàn chắc chắn không có gì khác bạn có thể giả định về việc phân phối. Cả hai đều có vấn đề. (Trong hầu hết các vấn đề thống kê mà tôi đã gặp phải - bên ngoài lĩnh vực vật lý lý thuyết - điều trước đây không phải là sự thật; và tôi chưa bao giờ thấy một vấn đề trong thế giới thực trong trường hợp sau là trường hợp.)
whuber

1
@Neil Đánh dấu và whuber. Tôi đã cố gắng làm rõ đoạn đó. Tôi nghĩ rằng "giả sử không có gì khác" là một giải thích ngôn ngữ thông thường hợp lý về những gì nguyên tắc của entropy tối đa đang cố gắng làm. Là ngôn ngữ bình thường, tất nhiên bạn có thể đặt một cách giải thích khác về nó. Đó là lý do tại sao chúng ta cần toán học. Tuyên bố chính xác hơn là chúng tôi không thêm thông tin, theo nghĩa của Shannon. Các liên kết giải thích điều này hơn nữa.
gareth

1
@gareth một phân phối thống nhất trên tất cả các thực tế (mà tôi nghĩ bạn có nghĩa trong nhận xét mới nhất của bạn) sẽ là một phân phối rất không phù hợp. Yêu cầu của bạn về entropy tối đa khi trình điều khiển của bạn đối với phân phối bình thường làm cho một giả định chính; tại sao nó mạnh hơn việc giả định một cái gì đó khác, chẳng hạn như phạm vi tối thiểu?
Henry

3

Các phân phối bình thường (hay còn gọi là " Gaussian Distribution ") có một nền tảng toán học vững chắc. Các giới hạn trung tâm lý nói rằng nếu bạn có một tập hữu hạn các n độc lập và phân phối hệt biến ngẫu nhiên có một ý nghĩa cụ thể và phương sai, và bạn lấy trung bình của các biến ngẫu nhiên, việc phân phối kết quả sẽ hội tụ về một phân phối Gaussian như n đi đến vô cùng. Không có phỏng đoán ở đây, vì đạo hàm toán học dẫn đến hàm phân phối cụ thể này và không có hàm nào khác.

Để đưa điều này vào các thuật ngữ hữu hình hơn, hãy xem xét một biến ngẫu nhiên duy nhất, chẳng hạn như lật một đồng tiền công bằng (2 kết quả có thể như nhau). Tỷ lệ nhận được một kết quả cụ thể là 1/2 cho đầu và 1/2 cho đuôi.

Nếu bạn tăng số lượng xu và theo dõi tổng số đầu thu được sau mỗi thử nghiệm, thì bạn sẽ nhận được Phân phối nhị thức , có hình chuông gần như. Chỉ cần biểu đồ với số lượng đầu dọc theo trục x và số lần bạn lật nhiều đầu dọc theo trục y.

Bạn càng sử dụng nhiều đồng xu và bạn càng lật nhiều đồng xu, biểu đồ sẽ càng gần giống như đường cong chuông Gaussian. Đó là những gì Định lý giới hạn trung tâm khẳng định.

Điều đáng kinh ngạc là định lý không phụ thuộc vào cách các biến ngẫu nhiên được phân phối thực sự, chỉ miễn là mỗi biến ngẫu nhiên có cùng phân phối. Một ý tưởng quan trọng trong định lý là bạn đang thêm hoặc lấy trung bình các biến ngẫu nhiên. Một khái niệm quan trọng khác là định lý đang mô tả giới hạn toán học khi số lượng biến ngẫu nhiên ngày càng lớn hơn. Bạn càng sử dụng nhiều biến, phân phối sẽ càng tiến gần đến Phân phối chuẩn.

Tôi khuyên bạn nên tham gia một lớp về Thống kê toán học nếu bạn muốn xem các nhà toán học xác định rằng Phân phối chuẩn thực sự là hàm đúng về mặt toán học cho đường cong hình chuông.


Cảm ơn sự đóng góp của bạn. Sẽ là chính xác nếu bạn giải thích rằng phân phối của tổng (hoặc trung bình) phải được chuẩn hóa. Mặt khác, phân phối của tổng không đạt đến giới hạn và phân phối trung bình tiếp cận một hằng số. Nhưng làm thế nào để bài viết này trả lời các câu hỏi đã được đặt ra? (Phải thừa nhận rằng có nhiều câu hỏi khác nhau được đặt ra và tất cả chúng đều bối rối và mơ hồ, nhưng dường như chúng đang hỏi về cách thức công thức cho Gaussian PDF được phát hiện hoặc xuất phát.)
whuber

2

Có một số câu trả lời tuyệt vời về chủ đề này. Tôi không thể không cảm thấy OP không hỏi cùng một câu hỏi như mọi người muốn trả lời. Mặc dù vậy, tôi hiểu điều đó bởi vì đây gần như là một trong những câu hỏi thú vị nhất để trả lời - tôi thực sự tìm thấy nó bởi vì tôi hy vọng ai đó có câu hỏi "Làm thế nào để chúng ta biết PDF bình thường là PDF?" và tôi đã tìm kiếm nó. Nhưng tôi nghĩ rằng câu trả lời cho câu hỏi có thể là để chứng minh nguồn gốc của phân phối bình thường.

nnnpnp(1-p)n

np0np= =1

n= =10p= =0,5n= =100p= =0,5n

Nếu tôi đổ 100 đồng xu xuống đất ngay bây giờ và đếm xem tôi nhận được bao nhiêu đầu, tôi có thể đếm 0 đầu hoặc tôi có thể đếm 100 đầu, nhưng tôi có nhiều khả năng sẽ đếm một số ở đâu đó ở giữa. Bạn có thấy tại sao biểu đồ này nên có hình chuông?


+1 - tuy nhiên, lưu ý rằng tôi thảo luận về de Moivre trong một số phần của câu trả lời của tôi. Bạn có thể tìm thấy ghi chú cuối cùng trong câu trả lời của tôi liên quan đến sự khác biệt trong các tài liệu tham khảo thú vị - thực sự đáng để xem những gì de Moivre đã viết để thấy mức độ mà các đặc điểm khác nhau trong tác phẩm của ông dường như giữ vững. Thảo luận cụ thể về lý do tại sao cdf nhị thức trở nên gần đúng bởi một cdf bình thường trong các điều kiện phù hợp được thảo luận trong Tại sao một phân phối nhị thức có hình chuông?
Glen_b -Reinstate Monica

1

Cũng sẽ đề cập đến dẫn xuất Maxwell-Herschel của phân phối chuẩn đa biến độc lập từ hai giả định:

  1. Phân phối không bị ảnh hưởng bởi vòng quay của vectơ.

  2. Các thành phần của vector là độc lập.

Đây là giải trình của Jaynes

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.