Ví dụ thực tế của các bản phân phối phổ biến


28

Tôi là một sinh viên tốt nghiệp phát triển một quan tâm cho thống kê. Tôi thích các tài liệu trên tất cả, nhưng đôi khi tôi có một thời gian khó khăn để suy nghĩ về các ứng dụng vào cuộc sống thực. Cụ thể, câu hỏi của tôi là về các bản phân phối thống kê thường được sử dụng (bình thường - beta- gamma, v.v.). Tôi đoán đối với một số trường hợp tôi nhận được các thuộc tính cụ thể làm cho phân phối khá đẹp - ví dụ như thuộc tính không có bộ nhớ theo cấp số nhân. Nhưng đối với nhiều trường hợp khác, tôi không có trực giác về cả tầm quan trọng và lĩnh vực ứng dụng của các bản phân phối phổ biến mà chúng ta thấy trong sách giáo khoa.

Có lẽ có rất nhiều nguồn tốt giải quyết mối quan tâm của tôi, tôi sẽ rất vui nếu bạn có thể chia sẻ những điều đó. Tôi sẽ có nhiều động lực hơn vào tài liệu nếu tôi có thể liên kết nó với các ví dụ thực tế.


8
Mười bốn loại ứng dụng bao gồm một loạt các bản phân phối được mô tả trong phần "ứng dụng" trên trang trợ giúp cho chức năng của EstimatedDistribution Mathicala .
whuber

Câu trả lời:


23

Wikipedia có một trang liệt kê nhiều phân phối xác suất với các liên kết đến chi tiết hơn về mỗi phân phối. Bạn có thể xem qua danh sách và theo các liên kết để cảm nhận rõ hơn về các loại ứng dụng mà các bản phân phối khác nhau thường được sử dụng.

Chỉ cần nhớ rằng các bản phân phối này được sử dụng để mô hình hóa thực tế và như Box nói: "tất cả các mô hình đều sai, một số mô hình là hữu ích".

Dưới đây là một số phân phối phổ biến và một số lý do khiến chúng hữu ích:

Bình thường: Điều này rất hữu ích để xem xét các phương tiện và các kết hợp tuyến tính khác (ví dụ: hệ số hồi quy) vì CLT. Liên quan đến điều đó là nếu một cái gì đó được biết là phát sinh do tác động cộng gộp của nhiều nguyên nhân nhỏ khác nhau thì bình thường có thể là một phân phối hợp lý: ví dụ, nhiều biện pháp sinh học là kết quả của nhiều gen và nhiều yếu tố môi trường và do đó thường xấp xỉ bình thường .

Gamma: Phải lệch và hữu ích cho những thứ có mức tối thiểu tự nhiên là 0. Thường được sử dụng cho thời gian trôi qua và một số biến tài chính.

Số mũ: trường hợp đặc biệt của Gamma. Nó là bộ nhớ và quy mô dễ dàng.

Chi-bình phương ( ): trường hợp đặc biệt của Gamma. Phát sinh dưới dạng tổng của các biến bình thường bình phương (được sử dụng cho phương sai).χ2

Beta: Được xác định trong khoảng từ 0 đến 1 (nhưng có thể được chuyển đổi thành giữa các giá trị khác), hữu ích cho tỷ lệ hoặc các đại lượng khác phải nằm trong khoảng từ 0 đến 1.

Binomial: Có bao nhiêu "thành công" trong số các thử nghiệm độc lập nhất định có cùng xác suất "thành công".

Poisson: Phổ biến cho số lượng. Các đặc tính tuyệt vời là nếu số lượng sự kiện trong một khoảng thời gian hoặc khu vực tuân theo Poisson, thì số đó trong hai lần thời gian hoặc khu vực vẫn theo Poisson (với hai lần giá trị trung bình): điều này hoạt động để thêm Poissons hoặc chia tỷ lệ với các giá trị khác 2.

Lưu ý rằng nếu các sự kiện xảy ra theo thời gian và thời gian giữa các lần xuất hiện theo cấp số nhân thì số xảy ra trong một khoảng thời gian sẽ xảy ra sau một Poisson.

Binomial âm: Đếm với 0 tối thiểu (hoặc giá trị khác tùy thuộc vào phiên bản nào) và không có giới hạn trên. Về mặt khái niệm, đó là số lần "thất bại" trước k "thành công". Nhị thức âm cũng là một hỗn hợp của các biến Poisson có nghĩa là đến từ phân phối gamma.

Hình học: trường hợp đặc biệt cho nhị thức âm trong đó là số "thất bại" trước "thành công" đầu tiên. Nếu bạn cắt bớt (làm tròn xuống) một biến số mũ để làm cho nó rời rạc, kết quả là hình học.


3
Vâng cảm ơn bạn đã trả lời của bạn. Tuy nhiên, wikipedia cung cấp một mô tả tổng quát hơn mà tôi muốn. Về cơ bản, câu hỏi của tôi là tại sao một số bản phân phối là tốt đẹp? Để đưa ra một câu trả lời khả dĩ trong trường hợp phân phối bình thường, có thể liên quan đến định lý giới hạn trung tâm - cho biết nếu bạn lấy mẫu một lượng quan sát vô hạn, bạn thực sự có thể thấy trong asympotics thấy rằng một thống kê đầy đủ của những quan sát đó, độc lập có phân phối bình thường . Tôi đang tìm kiếm nhiều ví dụ như thế ..
Roark

Không chính xác là một phân phối thực sự, nhưng những gì về bimodal? Tôi không thể nghĩ ra bất kỳ ví dụ thực tế thường thấy nào sau khi tôi thấy rằng nhiều sự khác biệt về giới tính ở con người không phải là lưỡng tính.
mèo trần

Thêm đa quốc gia

3

Lý thuyết tiệm cận dẫn đến phân phối bình thường, các loại giá trị cực đoan, các định luật ổn định và Poisson. Số mũ và Weibull có xu hướng xuất hiện dưới dạng thời gian tham số cho các phân phối sự kiện. Trong trường hợp của Weibull, đây là loại giá trị cực trị cho mức tối thiểu của mẫu. Liên quan đến các mô hình tham số cho các quan sát phân phối thông thường, phân phối chi bình phương, t và F phát sinh trong kiểm tra giả thuyết và ước lượng khoảng tin cậy. Chi bình phương cũng đưa ra phân tích bảng dự phòng và mức độ phù hợp của các xét nghiệm phù hợp. Để nghiên cứu sức mạnh của các bài kiểm tra, chúng tôi có các bản phân phối t và F phi tập trung. Phân phối siêu bội phát sinh trong thử nghiệm chính xác của Fisher cho các bảng dự phòng. Phân phối nhị thức rất quan trọng khi thực hiện các thí nghiệm để ước tính tỷ lệ. Nhị thức âm là một phân phối quan trọng để mô hình quá mức trong một quy trình điểm. Điều đó sẽ cung cấp cho bạn một khởi đầu tốt về phân phối tham số pratical. Đối với các biến ngẫu nhiên không âm trên (0,), phân phối Gamma linh hoạt để cung cấp nhiều hình dạng khác nhau và nhật ký thông thường cũng được sử dụng phổ biến. Trên [0,1] họ beta cung cấp các phân biệt đối xứng bao gồm cả đồng phục cũng như phân phối lệch sang trái hoặc lệch phải.

Tôi cũng nên đề cập rằng nếu bạn muốn biết tất cả các chi tiết khó chịu về phân phối trong thống kê, có loạt sách kinh điển của Johnson và Kotz bao gồm các phân phối rời rạc, phân phối đơn biến liên tục và phân phối đa biến liên tục và cả tập 1 của Lý thuyết nâng cao Thống kê của Kendall và Stuart.


Cảm ơn bạn vey nhiều cho câu trả lời, điều này là vô cùng hữu ích. Cảm ơn bạn một lần nữa, nó thực sự giúp tôi.
Roark

2

Mua và đọc ít nhất 6 chương đầu tiên (218 trang đầu tiên) của William J. Feller "Giới thiệu về Lý thuyết Xác suất và Ứng dụng của nó, Tập 2" http://www.amazon.com/dp/0471257095/ref=rdr_ext_tmb . Ít nhất là đọc tất cả các Vấn đề cho Giải pháp, và tốt nhất là thử giải quyết càng nhiều càng tốt. Bạn không cần phải đọc Vol 1, mà theo tôi không phải là đặc biệt có công.

Mặc dù tác giả đã chết 45 năm rưỡi trước, trước khi cuốn sách thậm chí hoàn thành, đây đơn giản là cuốn sách hay nhất, không có gì, để phát triển trực giác trong các quá trình xác suất và ngẫu nhiên, và hiểu và phát triển cảm giác về các bản phân phối khác nhau , làm thế nào chúng liên quan đến các hiện tượng trong thế giới thực và các hiện tượng ngẫu nhiên khác nhau có thể và có thể xảy ra. Và với nền tảng vững chắc bạn sẽ xây dựng từ nó, bạn sẽ được phục vụ tốt trong thống kê.

Nếu bạn có thể làm cho nó mặc dù các chương tiếp theo, có phần khó khăn hơn, bạn sẽ là năm nhẹ trước hầu hết mọi người. Nói một cách đơn giản, nếu bạn biết Feller Vol 2, bạn sẽ biết xác suất (và các quá trình ngẫu nhiên); có nghĩa là, bất cứ điều gì bạn không biết, chẳng hạn như những phát triển mới, bạn sẽ có thể nhanh chóng chọn và làm chủ bằng cách xây dựng trên nền tảng vững chắc đó.

Hầu như tất cả mọi thứ được đề cập trước đây trong chủ đề này đều nằm trong Feller Vol 2 (không phải tất cả các tài liệu trong Lý thuyết thống kê nâng cao của Kendall, nhưng đọc cuốn sách đó sẽ là một miếng bánh sau Feller Vol 2), và hơn thế nữa, tất cả, nhiều hơn nữa theo cách phát triển tư duy và trực giác ngẫu nhiên của bạn. Johnson và Kotz rất tốt cho các chi tiết vụn vặt trên các bản phân phối xác suất khác nhau, Feller Vol 2 rất hữu ích cho việc học cách suy nghĩ xác suất và biết cách trích xuất từ ​​Johnson và Kotz và cách sử dụng nó.


2

Chỉ để thêm vào các câu trả lời tuyệt vời khác.

npλ= =npkhông đổi, giới hạn từ 0 và vô cùng. Điều này cho chúng ta biết rằng nó hữu ích bất cứ khi nào chúng ta có một số lượng lớn các sự kiện rất khó xảy ra. Một số ví dụ điển hình là: tai nạn, chẳng hạn như số vụ tai nạn xe hơi ở New York trong một ngày, vì mỗi lần hai chiếc xe đi qua / gặp nhau có xác suất xảy ra tai nạn rất thấp và số cơ hội như vậy thực sự là thiên văn! Bây giờ, bản thân bạn có thể nghĩ về các ví dụ khác, chẳng hạn như tổng số vụ tai nạn máy bay trên thế giới trong một năm. Ví dụ kinh điển trong đó số người chết vì kỵ binh trong kỵ binh Preussian!

np(1-p)p1-pnpλpp


0

Nghiên cứu được công bố gần đâycho thấy hiệu suất của con người KHÔNG được phân phối bình thường, trái với suy nghĩ thông thường. Dữ liệu từ bốn lĩnh vực đã được phân tích: (1) Học thuật trong 50 ngành, dựa trên tần suất xuất bản trong các tạp chí chuyên ngành ưu tiên nhất. (2) Giải trí, chẳng hạn như diễn viên, nhạc sĩ và nhà văn, và số lượng giải thưởng, đề cử hoặc danh hiệu uy tín nhận được. (3) Các chính trị gia ở 10 quốc gia và kết quả bầu cử / tái cử. (4) Đại học và vận động viên chuyên nghiệp xem xét các biện pháp cá nhân nhất có sẵn, chẳng hạn như số lần chạy về nhà, tiếp khách trong các môn thể thao đồng đội và tổng số chiến thắng trong các môn thể thao cá nhân. Tác giả viết, "Chúng tôi đã thấy một sự phân phối quyền lực rõ ràng và nhất quán diễn ra trong mỗi nghiên cứu, bất kể chúng tôi đã phân tích dữ liệu hẹp hay rộng như thế nào ..."


4
Ai cho rằng hiệu suất của con người thường được phân phối?! Nguyên tắc 80-20 được đề xuất bởi Pareto (1906!).
abaumann
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.