Làm thế nào là sự suy yếu của một phân phối liên quan đến hình học của hàm mật độ?


12

Kurtosis là để đo độ cao và độ phẳng của phân phối. Hàm mật độ của phân phối, nếu nó tồn tại, có thể được xem như một đường cong và có các đặc điểm hình học (như độ cong, độ lồi, ...) liên quan đến hình dạng của nó.

Vì vậy, tôi tự hỏi liệu sự kurtosis của một phân phối có liên quan đến một số tính năng hình học của hàm mật độ, có thể giải thích ý nghĩa hình học của kurtosis?


Tôi đang yêu cầu một số mối quan hệ trong công thức với một số lượng hình học của đường cong mật độ, không chỉ là ý nghĩa mơ hồ mà tôi đã chỉ ra trong bài viết của mình. Hoặc thật tốt khi chỉ có một số lời giải thích về lý do tại sao kurtosis có ý nghĩa hình học
Tim

@Peter Đó là xa sự thật. Người ta có thể sửa đổi hình dạng của đồ thị của PDF gần như tùy ý mà không thay đổi bất kỳ khoảnh khắc (số hữu hạn nào) của nó.
whuber

Câu hỏi liên quan chặt chẽ tại stats.stackexchange.com/questions/25010/ gợi ý câu trả lời đúng cho câu hỏi này là gì.
whuber

@whuber trong khi tôi đồng ý và cảm ơn bạn vì ví dụ đó, tôi cũng tự hỏi liệu nó không nói nhiều về tài sản đáng chú ý của gia đình pdf cụ thể đó hay không nói chung về bệnh kurtosis.
user603

@ user603 Đó là một điều tốt để tự hỏi. Tuy nhiên, tuyên bố không phải là về gia đình cụ thể này: nó chỉ xảy ra rằng đối với phân phối logic, người ta có thể tạo ra một đại diện rõ ràng của một lớp các tệp PDF thay thế có cùng thời điểm. Nó đặc biệt mà tất cả những khoảnh khắc đều giống nhau, nhưng xáo trộn nhất phân phối theo một cách mà sửa chữa một số hữu hạn các khoảnh khắc của họ là không khó. (Thật khó cho các bản phân phối riêng biệt, chẳng hạn như Bernoulli, nhưng chúng không có tệp PDF.)
whuber

Câu trả lời:


17

Những khoảnh khắc của một phân phối liên tục, và các chức năng của chúng giống như sự suy yếu, cho bạn biết rất ít về biểu đồ của hàm mật độ của nó.

Hãy xem xét, ví dụ, các đồ thị sau.

enter image description here

Mỗi trong số này là biểu đồ của hàm không âm tích hợp với : chúng đều là các tệp PDF. Hơn nữa, tất cả chúng đều có cùng một khoảnh khắc - mỗi số lượng vô hạn cuối cùng của chúng. Do đó, họ chia sẻ một kurtosis phổ biến (xảy ra bằng nhau - 3 + 3 e 2 + 2 e 3 + e 4. )13+3e2+2e3+e4

Các công thức cho các chức năng này là

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

cho - 1 s 1 ,k Z .x>0, 1s1,kZ.

Hình hiển thị các giá trị của ở bên trái và các giá trị của ksk trên đỉnh. Cột bên trái hiển thị PDF cho phân phối lognatural tiêu chuẩn.

Bài tập 6.21 trong Lý thuyết thống kê nâng cao của Kendall (Stuart & Ord, ấn bản thứ 5) yêu cầu người đọc cho thấy rằng tất cả những điều này có cùng một khoảnh khắc.

Người ta có thể sửa đổi tương tự bất kỳ pdf nào để tạo một pdf khác có hình dạng hoàn toàn khác nhau nhưng với cùng một khoảnh khắc trung tâm thứ hai và thứ tư (do đó), do đó sẽ có cùng một sự tổn thương. Từ ví dụ này, rõ ràng rằng kurtosis không phải là một biện pháp dễ hiểu hoặc trực quan về sự đối xứng, không đồng nhất, lưỡng tính, lồi hoặc bất kỳ đặc điểm hình học quen thuộc nào khác của đường cong.

Các chức năng của các khoảnh khắc, do đó (và kurtosis như một trường hợp đặc biệt) không mô tả các thuộc tính hình học của biểu đồ của pdf. Điều này theo trực giác có ý nghĩa: bởi vì pdf biểu thị xác suất theo phương tiện , chúng ta gần như có thể tự do chuyển mật độ xác suất xung quanh từ vị trí này sang vị trí khác, thay đổi hoàn toàn diện mạo của pdf, trong khi sửa chữa bất kỳ số lượng hữu hạn nào của các khoảnh khắc được chỉ định trước.


1
"Chỉ từ ví dụ này thôi, nó sẽ rất rõ ràng ... bất kỳ đặc tính hình học quen thuộc nào khác của một đường cong." Tôi hiểu những gì bạn có ý nghĩa, nhưng có cơ sở cho sự khác biệt hợp lý trong việc giải thích ở đây. Một cách giải thích khác là của Darlington, người chỉ ra cách bắt đầu từ phân phối đối xứng, di chuyển một số khối lượng tại các điểm cụ thể làm tăng / giảm sự bứt rứt (một lần nữa, không phải là mâu thuẫn với ví dụ của bạn, chỉ là sự hiểu biết 'tích cực' hơn).
user603

1
@ user603 Tôi không đồng ý, nhưng tôi nghĩ rằng cách tiếp cận "tích cực" bỏ qua các giả định rất đặc biệt được thực hiện hoàn toàn để nó hoạt động. Người ta cũng có thể bắt đầu với biểu đồ của một tệp PDF cực kỳ bất đối xứng có độ lệch bằng 0 (chúng không khó xây dựng). Do đó, cách tiếp cận tích cực chỉ mô tả những gì xảy ra với một số tệp PDF rất đặc biệt khi khối lượng được di chuyển xung quanh. Mặc dù điều đó có thể khá hữu ích cho trực giác, nhưng dường như nó không có ý nghĩa logic đối với câu hỏi hiện tại.
whuber

1
Tôi đồng ý cho sự sai lệch (và cho câu trả lời của bạn nói chung). Nhưng kurtosis, như là một chức năng, có tối thiểu. Điều đó làm cho mọi thứ thú vị hơn một chút.
user603 2/214

1
@ user603 Cảm ơn bạn; đó là một sự khác biệt sâu sắc. Tôi không nghĩ rằng nó thay đổi bất kỳ kết luận hiện tại nào theo những cách quan trọng nhưng nó chắc chắn giúp trực giác và chỉ ra một sự khác biệt quan trọng giữa những khoảnh khắc chẵn và lẻ.
whuber

6

Đối với các phân phối đối xứng (đó là các phân phối mà các khoảnh khắc trung tâm thậm chí có ý nghĩa), độ nhiễu có thể đo lường một đặc tính hình học của pdf bên dưới. Không phải là sự thật rằng các biện pháp kurtosis (hoặc nói chung có liên quan) đến mức cao nhất của một phân phối. Thay vào đó, kurtosis đo lường mức độ phân phối cơ bản là bao xa so với đối xứng lưỡng kim (đại số, một phân phối đối xứng và lưỡng kim hoàn hảo sẽ có mức độ tổn thương là 1, là giá trị nhỏ nhất có thể có của kurtosis) [0].

Tóm lại [1], nếu bạn xác định:

k=E(xμ)4/σ4

với , sau đóE(X)=μ,V(X)=σ2

k=V(Z2)+11

cho .Z=(Xμ)/σ

Điều này ngụ ý rằng k có thể được coi là thước đo độ phân tán của xung quanh kỳ vọng của nó 1. Nói cách khác, nếu bạn có một cách giải thích hình học về phương sai và kỳ vọng, hơn là sự suy yếu theo sau.Z2

[0] RB Darlington (1970). Kurtosis có thực sự là "Đỉnh cao?". Thống kê người Mỹ, Tập. 24, số 2.

[1] JJA Moors (1986). Ý nghĩa của Kurtosis: Darlington Reexamined. Nhà thống kê người Mỹ, Tập 40, Số 4.


1
Bất cứ nơi nào bạn viết "bimodal" có lẽ bạn có nghĩa là "không chính thống"?
whuber

1
Vâng, những ví dụ này làm việc cho các phân phối đối xứng. Trong đó rõ ràng có thể được xây dựng từ các gia đình pseudo-loga chuẩn: lấy một trong những file PDF (vô modal) với trung bình của μ và xác định một pdf mới như g ( x ) = ( f ( x ) + f ( 2 μ - x ) ) / 2. Bằng cách trộn một lượng nhỏ g với phân phối kurtosis tối thiểu, bạn thấy rằng có các phân phối với vô số chế độ mà kurtosis gần tùy ý với giá trị tối thiểu là 1fμg(x)=(f(x)+f(2μx))/2.g1. Do đó, ít nhất, kurtosis không nói gì về lưỡng tính. Vì nó không có, chính xác tính chất hình học của pdf là gì?
whuber


1
Kurtosis không chỉ ra lưỡng tính, ngoại trừ trong trường hợp cực đoan khi nó ở gần mức tối thiểu, trong đó nó chỉ ra một cái gì đó tương tự như phân phối có thể trang bị hai điểm. Bạn có thể có các phân phối lưỡng kim với mọi giá trị có thể của kurtosis. Xem ncbi.nlm.nih.gov/pmc/articles/PMC4321753 để biết ví dụ.
Peter Westfall

1
Đúng; xem bài báo tôi liên kết Câu đầu tiên của bản tóm tắt của DeCarlo là hoàn toàn sai. Nếu bạn không muốn đọc bài báo của tôi, thì đây là phép toán: lấy bất kỳ phân phối lưỡng kim đối xứng nào và trộn nó với phân phối đối xứng rộng hơn nhiều có cùng trung vị với lưỡng kim. Hỗn hợp đối xứng và lưỡng kim cho nhỏ . Bằng cách điều chỉnh phân phối rộng hơn và trộn p , bạn có thể làm cho phạm vi kurtosis thành vô cùng. Và bạn có thể bị nhiễm trùng nhỏ như bạn muốn bằng cách sử dụng .5N (-1, v) + .5N (1, v), cho phéppp . Pdf đối xứng và bimodal dễ dàng được xây dựng cho tất cả các kurtosis. v0
Peter Westfall

5

[NB điều này đã được viết để trả lời một câu hỏi khác trên trang web; các câu trả lời đã được hợp nhất cho câu hỏi hiện tại. Đây là lý do tại sao câu trả lời này dường như trả lời một câu hỏi khác. Tuy nhiên phần lớn bài viết nên có liên quan ở đây.]

Kurtosis không thực sự đo lường hình dạng của các bản phân phối. Trong một số gia đình phân phối có lẽ, bạn có thể nói nó mô tả hình dạng, nhưng nói chung, sự bứt rứt không cho bạn biết nhiều về hình dạng thực tế. Hình dạng bị tác động bởi nhiều thứ, bao gồm cả những thứ không liên quan đến kurtosis.

Nếu một người thực hiện tìm kiếm hình ảnh cho kurtosis, khá nhiều hình ảnh như thế này xuất hiện:

p

mà thay vào đó dường như đang hiển thị phương sai thay đổi, thay vì tăng kurtosis. Để so sánh, đây là ba mật độ bình thường tôi vừa vẽ (sử dụng R) với các độ lệch chuẩn khác nhau:

enter image description here

Như bạn có thể thấy, nó trông gần giống với hình ảnh trước đó. Tất cả đều có chính xác cùng một sự tổn thương. Ngược lại, đây là một ví dụ có lẽ gần với những gì sơ đồ hướng tới

enter image description here

Đường cong màu xanh lá cây có nhiều đỉnh hơn và đuôi nặng hơn (mặc dù màn hình này không phù hợp để xem phần đuôi thực sự nặng hơn bao nhiêu). Các đường cong màu xanh là ít đỉnh và có đuôi rất nhẹ (thực sự nó không có đuôi gì cả ngoài 6 độ lệch chuẩn so với giá trị trung bình).

Đây thường là những gì mọi người có nghĩa là khi họ nói về kurtosis chỉ ra hình dạng của mật độ. Tuy nhiên, kurtosis có thể tinh tế - nó không phải hoạt động như vậy.

Ví dụ, tại một phương sai nhất định, sự tổn thương cao hơn thực sự có thể xảy ra với một đỉnh thấp hơn.

Người ta cũng phải cẩn thận với sự cám dỗ (và trong một vài cuốn sách, nó công khai tuyên bố) rằng sự kurtosis dư thừa bằng không ngụ ý sự bình thường. Có những bản phân phối với mức độ dư thừa 0 không giống như bình thường. Đây là một ví dụ:

dgam 2.3

Thật vậy, điều đó cũng minh họa điểm trước. Tôi có thể dễ dàng xây dựng một phân phối trông tương tự với mức độ tổn thương cao hơn mức bình thường nhưng vẫn là con số 0 ở trung tâm - hoàn toàn không có đỉnh.

Có một số bài viết trên trang web mô tả kurtosis hơn nữa. Một ví dụ là ở đây .


Nhưng tôi đã không nói điều đó? Cuốn sách nói lên điều đó?
Stat Tistician

Tôi biết điều đó. Tôi chưa bao giờ nói bạn nói điều đó. Làm thế nào bạn có thể đề nghị tôi trả lời những tuyên bố không chính xác mà bạn hỏi về? Cứ giả vờ như họ không sai?
Glen_b -Reinstate Monica

1
@Glen_b Những hình ảnh không phải từ cuốn sách. Cuốn sách không đưa ra minh họa. Tôi đã sử dụng tìm kiếm hình ảnh goolge cho những minh họa này.
Stat Tistician

2
Một số tác giả viết về kurtosis là đỉnh điểm và một số viết về nó như trọng lượng đuôi, nhưng sự giải thích hoài nghi rằng kurtosis là bất cứ biện pháp kurtosis nào là câu chuyện hoàn toàn an toàn. Một số ví dụ được đưa ra bởi một mình Irving Kaplansky (1945) đủ cho thấy rằng kurtosis không giải thích một cách dứt khoát. (Giấy Kaplansky là một trong số ít đó, ông đã viết vào giữa những năm 1940 về xác suất và thống kê. Ông được nhiều tốt hơn được biết đến như một nhà toán học nổi tiếng.) Full tài liệu tham khảo và nhiều hơn nữa trong stata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox

1
Có những cuốn sách và bài báo cho rằng kurtosis là đỉnh điểm, vì vậy điều khoản đầu tiên của tôi vẫn đúng cũng như có thể hỗ trợ như một tuyên bố về những gì trong tài liệu. Điều quan trọng hơn là cách người ta liên quan đến các ví dụ và lập luận của Kaplansky.
Nick Cox

3

μ±σ range) hình học có thể hiển thị một đỉnh cao vô hạn, một đỉnh bằng phẳng, hoặc đỉnh hai mốt, cả trong trường hợp nhọn là vô hạn, và trong trường hợp nhọn là ít hơn của phân phối bình thường. Kurtosis chỉ đo hành vi đuôi (ngoại lệ). Xem https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/

Chỉnh sửa 23/11/2018: Kể từ khi viết bài này, tôi đã phát triển một số quan điểm hình học về kurtosis. Một là sự suy yếu quá mức thực sự có thể được hình dung về mặt hình học về độ lệch so với đường 45 độ dự kiến ​​trong các đuôi của biểu đồ lượng tử - lượng tử thông thường; xem cốt truyện QQ này chỉ ra sự phân phối leptokurtic hay platykurtic?

pV(v)V={(Xμ)/σ}4XE(V)VX .

μ±σXμ±σμσX0.25μ±σμσ


3
Thay vì chỉ tiếp tục giới thiệu mọi người đến một bài báo trong hầu hết các bài đăng của bạn, bạn có phiền khi tóm tắt các lập luận ở đây không? Xem trợ giúp ở đây trong phần "luôn cung cấp ngữ cảnh cho các liên kết", đặc biệt là phần "luôn luôn trích dẫn phần quan trọng". Không nhất thiết phải trích dẫn nó theo nghĩa đen khi đối số được mở rộng, nhưng ít nhất cần phải có một bản tóm tắt về đối số. Bạn chỉ cần thực hiện một vài câu lệnh quét và sau đó liên kết đến một bài báo. Tuyên bố rằng kurtosis đo hành vi đuôi là (bối cảnh vắng mặt) gây hiểu lầm (rất tệ)
Glen_b -Reinstate Monica

2
... nhưng không thể không đồng ý với các lập luận mà bạn không trình bày ở đây và có lẽ đi đến một kết luận mang nhiều sắc thái hơn.
Glen_b -Reinstate Monica

Lập luận của tôi được trình bày rõ ràng ở đây: en.wikipedia.org/wiki/ Nhật Nhận xét chào mừng! BTW, nhọn một thước đo trọng lượng đuôi, chỉ cần không giống như những người khác đã được xem xét. Nó đo trọng lượng đuôi thông qua E (Z ^ 4), đây là thước đo trọng lượng đuôi vì các giá trị | Z | <1 đóng góp rất ít vào nó. Theo cùng một logic, E (Z ^ n), đối với năng lực thậm chí cao hơn n, cũng là các số đo trọng lượng đuôi.
Peter Westfall

Xin chào Peter, Vui lòng truy cập stats.stackexchange.com/help/merging-accounts để hợp nhất các tài khoản của bạn để bạn có thể sửa đổi các bài đăng cũ của mình.
whuber

3

Một loại câu trả lời khác: Chúng ta có thể minh họa kurtosis về mặt hình học, bằng cách sử dụng các ý tưởng từ http://www.quantdec.com/envstats/notes/ class_06 / properies.htmlm : khoảnh khắc đồ họa.

Bắt đầu với định nghĩa về kurtosis:

k= =E(X-μσ)4= =(x-μσ)4f(x)dx
Ở đâu f là mật độ của X, μ,σ2kỳ vọng tương ứng và phương sai. Hàm không âm dưới dấu tích phân tích hợp với kurtosis và đóng góp cho kurtosis từ xung quanhx. Chúng ta có thể gọi nó là mật độ kurtosis , và vẽ đồ thị cho thấy sự kurtosis bằng đồ họa. (Lưu ý rằng trong bài đăng này, chúng tôi không sử dụng kurtosis dư thừa ke= =k-3 ở tất cả).

Trong phần sau tôi sẽ trình bày sơ đồ về sự suy yếu đồ họa cho một số phân phối đối xứng, tất cả tập trung ở mức 0 và được chia tỷ lệ để có phương sai 1.

visual kurtosis for some symmetric distributions

Lưu ý sự vắng mặt ảo của sự đóng góp cho sự suy yếu từ trung tâm, cho thấy rằng sự tổn thương không liên quan nhiều đến "đỉnh điểm".


1
Chính xác. Các khu vực dưới các đường cong bạn hiển thị từ -1 đến +1 nằm trong khoảng từ 0 đến 1 cho tất cả các phân phối và nằm trong khoảng từ 0 đến 0,5 cho tất cả các phân phối liên tục có mật độZ2đang giảm trên phạm vi [0,1]. Hai định lý này đã được chứng minh trong bài báo của tôi ncbi.nlm.nih.gov/pmc/articles/PMC4321753 . Một định lý thứ ba đã được chứng minh trong đó là, đối với bất kỳ chuỗi phân phối nào mà sự tổn thương có xu hướng vô cùng, tỷ lệ của khu vực dưới phạm vi từ-b đến +b Kurtosis có xu hướng bằng không, cho mỗi cố định b.
Peter Westfall
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.