Tại sao kurtosis của một phân phối bình thường là 3 thay vì 0


18

Điều gì có nghĩa là tuyên bố rằng sự suy yếu của phân phối bình thường là 3. Điều đó có nghĩa là trên đường ngang, giá trị của 3 tương ứng với xác suất cao nhất, tức là 3 là chế độ của hệ thống?

Khi tôi nhìn vào một đường cong bình thường, có vẻ như đỉnh xảy ra ở trung tâm, hay còn gọi là 0. Vậy tại sao sự suy yếu không phải là 0 và thay vào đó là 3?


6
Như @Glen_b viết, hệ số "kurtosis" đã được xác định là thời điểm chuẩn hóa thứ tư: Nó như vậy sẽ xảy ra rằng đối với phân phối chuẩn,L4=3σ4nênβ2=3. Cácnhọn dư thừathường được biểu thị bởiγ2γ2=β2(Bình thường)-3. Phải cẩn thận vì đôi khi các tác giả viết "kurtosis" và họ có nghĩa là "kurtosis dư thừa".
β2=E[(Xμ)4](E[(Xμ)2])2=μ4σ4
μ4=3σ4β2=3γ2γ2=β2(Normal)3
Alecos Papadopoulos

1
Re: Nhận xét trước của tôi. Các biểu hiện chính xác cho các hệ số nhọn dư thừa là
γ2=β2β2(Normal)=β23
Alecos Papadopoulos

Câu trả lời:


29

Kurtosis chắc chắn không phải là vị trí của đỉnh. Như bạn nói, đó đã được gọi là chế độ.

Nhọn là thời điểm thứ tư chuẩn: Nếu , là phiên bản được tiêu chuẩn hóa của biến chúng ta đang xem xét, sau đó mức độ suy giảm dân số là sức mạnh thứ tư trung bình của biến được tiêu chuẩn hóa đó; E(Z4). Kurtosis mẫu có liên quan tương ứng với sức mạnh thứ tư trung bình của một tập hợp các giá trị mẫu được tiêu chuẩn hóa (trong một số trường hợp, nó được chia tỷ lệ theo 1 trong các mẫu lớn).Z=X-μσE(Z4)

Như bạn lưu ý, khoảnh khắc chuẩn hóa thứ tư này là 3 trong trường hợp biến ngẫu nhiên bình thường. Như Alecos ghi chú trong các bình luận, một số người định nghĩa kurtosis là ; điều đó đôi khi được gọi là kurtosis dư thừa (nó cũng là tích lũy thứ tư). Khi nhìn thấy từ 'kurtosis', bạn cần lưu ý khả năng này là những người khác nhau sử dụng cùng một từ để chỉ hai đại lượng khác nhau (nhưng có liên quan chặt chẽ).E(Z4)-3

Kurtosis thường được mô tả là cực đại * (giả sử, đỉnh cong cong mạnh đến mức nào - có lẽ là mục đích của việc chọn từ "kurtosis") hoặc nặng nề (thường là những gì mọi người quan tâm khi sử dụng nó để đo lường), nhưng trong thực tế khoảnh khắc tiêu chuẩn thứ tư thông thường không hoàn toàn đo được một trong những điều đó.

Thật vậy, tập đầu tiên của Kendall và Stuart đưa ra các mẫu đối lập cho thấy mức độ tổn thương cao hơn không nhất thiết phải liên quan đến đỉnh cao hơn (trong một biến được tiêu chuẩn hóa) hoặc đuôi béo hơn (theo cách tương tự như khoảnh khắc thứ ba không hoàn toàn đo được nhiều người nghĩ rằng nó làm).

Tuy nhiên, trong nhiều tình huống, có một số xu hướng liên quan đến cả hai, trong đó đỉnh cao hơn và đuôi nặng hơn thường có xu hướng được nhìn thấy khi mức độ kurtosis cao hơn - chúng ta chỉ cần cẩn thận nghĩ rằng đó là điều cần thiết.

Kurtosis và xiên có liên quan chặt chẽ với nhau (độ nhiễu phải ít nhất bằng 1 so với bình phương của độ lệch; việc giải thích về kurtosis có phần dễ dàng hơn khi phân bố gần như đối xứng.

nhập mô tả hình ảnh ở đây

Darlington (1970) và Moors (1986) cho thấy rằng biện pháp thời điểm IV nhọn có hiệu lực thay đổi về "vai" - , và Balanda và MacGillivray (1988) gợi ý suy nghĩ của nó trong điều khoản mơ hồ liên quan đến cảm giác đó ( và xem xét một số cách khác để đo lường nó). Nếu sự phân bố tập trung chặt chẽ về L ± σ , sau đó nhọn là (nhất thiết) nhỏ, trong khi nếu phân phối được trải ra khỏi L ± σ (mà sẽ có xu hướng cùng một lúc chồng nó lên ở trung tâm và di chuyển xác vào đuôi ở để di chuyển nó ra khỏi vai), sự suy yếu ở giây thứ tư sẽ lớn.μ±σμ±σμ±σ

De Carlo (1997) là nơi khởi đầu hợp lý (sau các tài nguyên cơ bản hơn như Wikipedia) để đọc về kurtosis.

E(Z4)E(Z2) (-1,1)); và ngược lại - nếu bạn đặt thêm trọng lượng ở trung tâm trong khi giữ phương sai ở mức 1, bạn cũng đặt một số ra ở đuôi.

[NB như đã thảo luận trong các ý kiến, điều này không chính xác như một tuyên bố chung; một tuyên bố hơi khác nhau được yêu cầu ở đây.]

Tác động của phương sai được giữ không đổi có liên quan trực tiếp đến cuộc thảo luận về kurtosis là "sự thay đổi về vai" trong các bài báo của Darlington và Moors. Kết quả đó không phải là một số khái niệm tay, mà là một sự tương đương toán học đơn giản - người ta không thể giữ nó để được khác mà không diễn đạt sai lệch.

(1,1)(1,1)

[Việc tôi đưa Kendall và Stuart vào các tài liệu tham khảo là bởi vì cuộc thảo luận của họ về kurtosis cũng liên quan đến điểm này.]

Vậy chúng ta có thể nói gì? Kurtosis thường được liên kết với một đỉnh cao hơn và với một cái đuôi nặng hơn, mà không phải xảy ra khô héo. Chắc chắn sẽ dễ dàng hơn để nâng mức độ tổn thương bằng cách chơi với đuôi (vì có thể lấy hơn 1 sd đi) sau đó điều chỉnh trung tâm để giữ phương sai không đổi, nhưng điều đó không có nghĩa là đỉnh không có tác động; nó chắc chắn làm điều đó, và người ta có thể điều khiển kurtosis bằng cách tập trung vào nó thay vào đó. Kurtosis phần lớn nhưng không chỉ liên quan đến độ nặng của đuôi - một lần nữa, hãy nhìn vào sự thay đổi về kết quả của vai; nếu bất cứ điều gì đó là những gì kurtosis đang nhìn vào, trong một ý nghĩa toán học không thể tránh khỏi.

Người giới thiệu

Balanda, KP và MacGillivray, HL (1988),
"Kurtosis: Một đánh giá quan trọng."
Thống kê người Mỹ 42 , 111-119.

Darlington, Richard B. (1970),
"Kurtosis có thực sự là" Đỉnh cao? "."
Thống kê người Mỹ 24 , 19-22.

Moors, JJA (1986),
"Ý nghĩa của kurtosis: Darlington tái cấu trúc."
Thống kê người Mỹ 40 , 283-284.

DeCarlo, LT (1997),
"Về ý nghĩa và cách sử dụng của kurtosis."
Thần kinh. Phương pháp, 2 , 292-307.

Kendall, MG và A. Stuart,
Lý thuyết thống kê nâng cao ,
Tập. 1, 3 Ed.
(phiên bản gần đây hơn có Stuart và Ord)


03

1
Bài viết của Westfall về kurtosis, có tiêu đề Kurtosis là Đỉnh cao, 1905-2014 RIP đáng để xem xét. Nó chỉ trích DeCarlo (trong số những người khác thậm chí được liệt kê ở trên) vì đã truyền bá kiến ​​thức về kurtosis như một biện pháp đỉnh cao
Lil'Lobster

1
@ Tôi nghĩ Westfall nói quá về trường hợp của mình. Bởi (gần như) hoàn toàn tập trung vào những cái đuôi nặng nề, anh ta hoàn toàn không đúng. Mặc dù kurtosis có liên quan khá mạnh với đuôi nặng, nhưng kurtosis không phải là đuôi nặng nề (phản vật chất nơi đuôi nặng hơn dễ bị tổn thương, như được nêu trong một số tài liệu tham khảo ở trên; chúng cũng dễ thực hiện). Kurtosis được liên kết ít mạnh mẽ hơn với đỉnh điểm nhưng vẫn có một hiệp hội ở đó; bằng cách khẳng định đó không phải là đỉnh điểm, ông đã đi quá xa trong những lời chỉ trích của mình (những lời chỉ trích tương tự áp dụng cho kết luận của chính ông). ... ctd
Glen_b -Reinstate Monica

1
Glen_b, bạn và tôi đều yêu thích toán học. Nếu bạn định chỉ trích tôi vì "nói quá trường hợp của tôi", xin vui lòng cho tôi biết lập luận toán học của bạn kết nối sự bứt rứt của Pearson với "đỉnh điểm".
Peter Westfall

1
Gelen_b, nhận xét của bạn "Điều này có nghĩa là chuyển động của xác suất vào đuôi phải đi kèm với một số chi tiết bên trong mu + - sigma và ngược lại - nếu bạn đặt thêm trọng lượng ở trung tâm trong khi giữ phương sai ở 1, bạn cũng đặt một số ở đuôi "Là sai. Nó không phải. Bạn có thể giữ xác suất (trên thực tế là toàn bộ phân phối) bên trong mu + - sigma không đổi và tăng mức độ tổn thương đến vô cùng trong các họ phân phối tham số nhất định. Xem tại đây: math.stackexchange.com/questions/167656/ trộm
Peter Westfall

2

Dưới đây là một hình ảnh trực tiếp để hiểu những gì số "3" liên quan đến sự suy yếu của phân phối bình thường.

Để cho X được phân phối bình thường và để Z= =(X-μ)/σ. Để choV= =Z4. Hãy xem xét biểu đồ của pdfV, pV(v). Đường cong này nằm ở bên phải của số 0 và kéo dài đến vô tận, với 0,999 số lượng tử 117,2, nhưng phần lớn khối lượng gần bằng không; ví dụ: 68% nhỏ hơn 1.0.

Ý nghĩa của phân phối này là kurtosis. Một cách phổ biến để hiểu giá trị trung bình là "điểm cân bằng" của biểu đồ pdf. NếuX là bình thường, đường cong này pV(v) số dư ở mức 3.0.

Đại diện này cũng giải thích lý do tại sao kurtosis đo độ nặng của đuôi phân phối. NếuX là không bình thường, đường cong pV(v) "rơi sang bên phải" khi mức độ tổn thương lớn hơn 3.0 và do đó, trong trường hợp này mật độ của Xcó thể nói là "nặng hơn đuôi phân phối bình thường". Tương tự, đường congpV(v) "rơi sang bên trái" khi mức độ tổn thương nhỏ hơn 3.0 và do đó, trong trường hợp này mật độ của X có thể nói là "nhẹ hơn so với phân phối bình thường."

Người ta thường nghĩ rằng kurtosis cao hơn đề cập đến khối lượng lớn hơn gần trung tâm (nghĩa là, khối lượng lớn hơn gần 0 trong pdf pV(v)). Mặc dù trong nhiều trường hợp, điều này là đúng, nhưng rõ ràng không phải khối lượng (có thể tăng) gần bằng 0 khiến biểu đồ "rơi sang phải" trong trường hợp bị tổn thương cao. Nó thay vào đó là đòn bẩy đuôi.

Từ quan điểm này, cách giải thích "trọng lượng đuôi" về cơ bản chính xác có thể được đặc trưng cụ thể hơn là "đòn bẩy đuôi" để tránh nhầm lẫn "tăng trọng lượng đuôi" với "khối lượng tăng ở đuôi". Rốt cuộc, có thể là sự tổn thương cao hơn tương ứng với khối lượng ít hơn ở đuôi, nhưng trong đó khối lượng giảm dần này chiếm một vị trí xa hơn.

"Hãy cho tôi chỗ đứng, và tôi sẽ di chuyển trái đất." -Kiến thức

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.