trực giác cho những khoảnh khắc về ý nghĩa của một phân phối?


11

ai đó có thể cung cấp một trực giác về lý do tại sao các khoảnh khắc phân phối xác suất cao hơn như khoảnh khắc p(x)thứ ba và thứ tư tương ứng với độ lệch và kurtosis không?

cụ thể, tại sao sự sai lệch về giá trị trung bình được nâng lên thành năng lượng thứ 3 hoặc thứ 4 lại chuyển thành một thước đo về độ lệch và kurtosis? Có cách nào để liên hệ điều này với các đạo hàm thứ ba hoặc thứ tư của hàm không?

xem xét định nghĩa này của kurtosis:

Kurtosis(X)=E[(xμX)4]/σ4

một lần nữa, không rõ tại sao việc tăng lại cho "đỉnh điểm" hoặc tại sao nên đưa ra sai lệch. có vẻ huyền diệu và bí ẩn ( x - μ ) 3(xμ)4(xμ)3

Chỉnh sửa : theo dõi nhanh. lợi thế của việc xác định các khoảnh khắc về giá trị trung bình và không phải là trung vị cho các số liệu như kurtosis là gì? các thuộc tính của công cụ ước tính như thế nào:

MedianKurtosis(X)=E[(xx~)4]/σ4

trong đó là trung vị. điều này có lẽ sẽ ít nhạy cảm hơn với các ngoại lệ trong phân phối mà không có ý nghĩa và có lẽ là một biện pháp công bằng hơn của đỉnh cao?x~


4
Trực giác của tôi về xiên là lưu ý rằng sức mạnh thứ ba bảo tồn những tiêu cực. Vì vậy, nếu bạn có độ lệch âm lớn hơn giá trị trung bình so với giá trị dương (đặt rất đơn giản), thì bạn kết thúc bằng một phân phối sai lệch âm. Trực giác của tôi đối với sự suy yếu là sức mạnh thứ tư khuếch đại độ lệch lớn so với trung bình nhiều hơn so với sức mạnh thứ hai. Đây là lý do tại sao chúng tôi nghĩ về kurtosis như là một thước đo về mức độ béo của đuôi phân phối. Lưu ý rằng các khả năng rất lớn của x từ trung bình mu được nâng lên công suất thứ tư, điều này làm cho chúng được khuếch đại nhưng bỏ qua dấu hiệu.
wolfsatthedoor


1
Vì các quyền lực thứ 4 bị ảnh hưởng nhiều hơn bởi các ngoại lệ so với các quyền lực thứ 1, tôi hy vọng bạn sẽ có được chút ít khi nhìn vào khoảnh khắc thứ tư về trung vị - ít nhất là nếu sự mạnh mẽ là mục tiêu.
Glen_b -Reinstate Monica

1
Đầu tiên, lưu ý rằng những khoảnh khắc cao hơn này không nhất thiết là các biện pháp tốt / đáng tin cậy về sự bất cân xứng / đỉnh cao. Điều đó nói rằng, tôi nghĩ rằng chùm tia mang lại một trực giác vật lý tốt trong ba khoảnh khắc đầu tiên, ví dụ: mean = cân bằng chùm / tỷ lệ , phương sai = uốn cong cantilever , skewness = bập bênh .
GeoMatt22

1
Bạn đã đúng, việc giải thích kurtosis như đo lường "đỉnh cao" huyền diệu và bí ẩn. Đó là bởi vì nó hoàn toàn không đúng. Kurtosis cho bạn hoàn toàn không có gì về đỉnh. Nó chỉ đo đuôi (ngoại lệ). Thật dễ dàng để chứng minh về mặt toán học rằng các quan sát gần đỉnh đóng góp một lượng rất nhỏ cho phép đo kurtosis, bất kể đỉnh đó là phẳng, có gai, lưỡng kim, hình sin hoặc hình chuông.
Peter Westfall

Câu trả lời:


5

Có một lý do chính đáng cho các định nghĩa này, sẽ trở nên rõ ràng hơn khi bạn nhìn vào biểu mẫu chung cho các khoảnh khắc của các biến ngẫu nhiên được tiêu chuẩn hóa. Để trả lời câu hỏi này, trước tiên hãy xem xét hình thức chung của thời điểm trung tâm được chuẩn hóa thứ :n

ϕn=E[(XE[X]S[X])n ].

ϕ1=0ϕ2=1n3

ϕn+=E[|XE[X]S[X]|n |X>E[X]]P(X>E[X]),ϕn=E[|XE[X]S[X]|n |X<E[X]]P(X<E[X]).

Đây là các đại lượng không âm cung cấp sức mạnh tuyệt đối thứ của biến ngẫu nhiên được tiêu chuẩn hóa có điều kiện trên nó ở trên hoặc dưới giá trị mong đợi của nó. Bây giờ chúng ta sẽ phân tách thời điểm trung tâm được tiêu chuẩn hóa thành các phần này.n


Các giá trị lẻ của đo độ lệch trong các đuôi:n Đối với bất kỳ giá trị lẻ nào của chúng ta có một công suất lẻ trong phương trình mô men và do đó chúng ta có thể viết mô men trung tâm chuẩn hóa là . Từ dạng này, chúng ta thấy rằng thời điểm trung tâm được tiêu chuẩn hóa cho chúng ta sự khác biệt giữa công suất tuyệt đối thứ của biến ngẫu nhiên được tiêu chuẩn hóa, có điều kiện tương ứng trên hoặc dưới mức trung bình của nó.n3ϕn=ϕn+ϕnn

Do đó, đối với bất kỳ công suất lẻ chúng ta sẽ có được một số đo mang lại giá trị dương nếu công suất tuyệt đối dự kiến ​​của biến ngẫu nhiên được tiêu chuẩn hóa cao hơn cho các giá trị trên giá trị trung bình so với giá trị dưới giá trị trung bình và đưa ra các giá trị âm nếu dự kiến công suất tuyệt đối thấp hơn cho các giá trị trên giá trị trung bình so với giá trị dưới giá trị trung bình. Bất kỳ đại lượng nào trong số này có thể được coi là thước đo của một loại "độ lệch" một cách hợp lý, với quyền hạn cao hơn mang lại trọng số tương đối lớn hơn cho các giá trị khác xa giá trị trung bình.n3

Vì hiện tượng này xảy ra đối với mọi công suất lẻ , nên sự lựa chọn tự nhiên cho một thước đo "độ lệch" nguyên mẫu là xác định là độ lệch. Đây là một khoảnh khắc trung tâm được tiêu chuẩn hóa thấp hơn so với các quyền lực lẻ cao hơn và việc khám phá các khoảnh khắc bậc thấp trước khi xem xét các khoảnh khắc bậc cao là điều tự nhiên. Trong thống kê, chúng tôi đã thông qua quy ước coi thời điểm trung tâm được tiêu chuẩn hóa này là độ lệch , vì đây là thời điểm trung tâm được tiêu chuẩn hóa thấp nhất đo lường khía cạnh này của phân phối. (Các quyền hạn lẻ cao hơn cũng đo lường các loại độ lệch, nhưng với sự nhấn mạnh lớn hơn và lớn hơn vào các giá trị khác xa giá trị trung bình.)n3ϕ3


Các giá trị chẵn của đo độ béo của đuôi:n Với bất kỳ giá trị chẵn nào của chúng ta có công suất chẵn trong phương trình mô men và do đó chúng ta có thể viết mô men trung tâm chuẩn hóa là . Từ dạng này, chúng ta thấy rằng thời điểm trung tâm được tiêu chuẩn hóa cho chúng ta tổng công suất tuyệt đối thứ của biến ngẫu nhiên được tiêu chuẩn hóa, có điều kiện tương ứng với nó ở trên hoặc dưới giá trị trung bình của nó.n3ϕn=ϕn++ϕnn

Do đó, đối với bất kỳ công suất chẵn chúng ta sẽ có được một số đo cho các giá trị không âm, với các giá trị cao hơn xảy ra nếu các đuôi của phân phối biến ngẫu nhiên được tiêu chuẩn hóa đầy hơn. Lưu ý rằng đây là kết quả liên quan đến biến ngẫu nhiên được tiêu chuẩn hóa và do đó, thay đổi tỷ lệ (thay đổi phương sai) không ảnh hưởng đến biện pháp này. Thay vào đó, nó thực sự là thước đo độ béo của đuôi, sau khi chuẩn hóa cho phương sai của phân phối. Bất kỳ số lượng nào trong số này có thể được coi là một thước đo hợp lý của một loại "kurtosis", với các quyền lực cao hơn mang lại trọng lượng tương đối lớn hơn cho các giá trị khác xa giá trị trung bình.n3

Vì hiện tượng này xảy ra đối với mọi công suất chẵn , nên sự lựa chọn tự nhiên cho một biện pháp kurtosis nguyên mẫu là xác định là kurtosis. Đây là một khoảnh khắc trung tâm được tiêu chuẩn hóa thấp hơn so với các quyền lực thậm chí cao hơn và việc khám phá các khoảnh khắc bậc thấp trước khi xem xét các khoảnh khắc bậc cao là điều tự nhiên. Trong thống kê, chúng tôi đã thông qua quy ước coi thời điểm trung tâm được tiêu chuẩn hóa này là "sự suy yếu", vì đây là thời điểm trung tâm được tiêu chuẩn hóa thấp nhất đo lường khía cạnh phân phối này. (Sức mạnh thậm chí cao hơn cũng đo lường các loại kurtosis, nhưng với sự nhấn mạnh lớn hơn và lớn hơn vào các giá trị khác xa giá trị trung bình.)n3ϕ4


Phương trình này được xác định rõ ràng cho bất kỳ phân phối nào có hai khoảnh khắc đầu tiên tồn tại và có phương sai khác không. Chúng tôi sẽ giả định rằng phân phối lợi ích rơi vào lớp này cho phần còn lại của phân tích.


2

Câu hỏi tương tự Cái gì là 'khoảnh khắc' về 'khoảnh khắc' của phân phối xác suất? Tôi đã đưa ra một câu trả lời vật lý mà giải quyết những khoảnh khắc.

"Gia tốc góc là đạo hàm của vận tốc góc, là đạo hàm của góc đối với thời gian, nghĩa là . Hãy xem xét rằng khoảnh khắc thứ hai tương tự như mô-men xoắn áp dụng cho chuyển động tròn hoặc nếu bạn sẽ tăng tốc / giảm tốc (cũng là đạo hàm thứ hai) của chuyển động tròn đó (tức là góc, ). là một tốc độ thay đổi mô-men xoắn, v.v.dωdt=α,dθdt=ωθ

Xem liên kết vì điều này có lẽ dễ hình dung hơn với các ví dụ vật lý.

Skewness dễ hiểu hơn kurtosis. Một độ lệch tiêu cực là một cái đuôi bên trái nặng hơn (hoặc hướng tiêu cực xa hơn) so với bên phải và độ lệch tích cực ngược lại.

Wikipedia trích dẫn Westfall (2014) và ngụ ý rằng mức độ tổn thương cao phát sinh đối với các biến ngẫu nhiên có giá trị vượt xa hoặc cho các hàm mật độ có một hoặc hai đuôi nặng trong khi cho rằng bất kỳ xu hướng trung tâm nào của dữ liệu hoặc mật độ đều ảnh hưởng tương đối ít đến giá trị kurtosis. Giá trị thấp của kurtosis sẽ ngụ ý ngược lại, nghĩa là thiếu các ngoại lệ -axis và độ sáng tương đối của cả hai đuôi.x


Skewness là điểm cân bằng của pdf của và kurtosis là điểm cân bằng của pdf của . Cả hai biến đổi "kéo dài" đuôi, kurtosis nhiều hơn. Nếu pdf của rơi sang phải khi điểm tựa được đặt ở 0, thì sẽ có độ lệch dương trong phân phối ban đầu. Nếu pdf của rơi sang phải khi điểm tựa được đặt ở mức 3.0, thì phân phối ban đầu có đuôi nặng hơn so với phân phối bình thường. Ở đây, "độ nặng của đuôi" đề cập chính xác hơn đến đòn bẩy hơn là khối lượng. Giải thích của Moors không hoàn toàn đúng khi viết cả hai "đề cập". Z 4 Z 3 Z 4Z3Z4Z3Z4
Peter Westfall

@PeterWestfall Tôi đồng ý rằng cách giải thích của Moors là không hoàn hảo. Ngôn ngữ chính xác không dễ dàng đạt được mà không gây nhầm lẫn. Lấy "đòn bẩy" chẳng hạn. Đòn bẩy có nghĩa là khoảnh khắc đầu tiên và người ta sẽ phải phát minh ra thứ gì đó như "đòn bẩy đòn bẩy" cho khoảnh khắc thứ hai, điều này có thể gây nhầm lẫn nhiều hơn là chiếu sáng. Cách tiếp cận của bạn dường như phát minh ra một khái niệm mới, tức là "đòn bẩy kéo dài", gợi ý về các biến đổi hình học mà người ta cũng có thể cho rằng một số người ủng hộ ủng hộ nó là tự đồng nhất với nguy cơ gây tranh cãi và phi vật lý cho người khác .
Carl

"Đòn bẩy" chỉ thời điểm đầu tiên của biến , trong đó . Nó không phải là khoa học tên lửa. U = Z 4UU=Z4
Peter Westfall

@PeterWestfall Không được quá hay, nhưng bạn đang tận dụng đòn bẩy. Chắc chắn, bạn vẫn có thể sử dụng từ này và nếu không phải là đối tượng thứ tư, so với khoảng cách một chiều, , nó thậm chí có thể hữu ích. Bối cảnh ở đây là những khoảnh khắc, và tạo ra một mô hình vật lý cho những khoảnh khắc. Có một số cách có thể được thực hiện, ví dụ, xem câu trả lời của tôi về điều đó ở đây . Nói cách khác, để đặt những khoảnh khắc vào bất kỳ bối cảnh vật lý nào, chúng ta phải làm nhiều hơn là vẫy tay và gọi chiều thứ tư. ZZ4Z
Carl

@PeterWestfall Trong bối cảnh chuyển động tròn, chúng ta sẽ gọi mô-men xoắn giây thứ hai , và không phải là đòn bẩy của , mà sau này, mặc dù không chính xác, không mang lại bất kỳ điều gì về thể chất. Z2
Carl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.