Làm thế nào để giá trị mong đợi liên quan đến trung bình, trung bình, vv trong một phân phối không bình thường?


9

Làm thế nào để giá trị mong đợi của một biến ngẫu nhiên liên tục liên quan đến trung bình số học của nó, trung vị, v.v. trong một phân phối không bình thường (ví dụ: skew-normal)? Tôi quan tâm đến bất kỳ phân phối phổ biến / thú vị nào (ví dụ: log-normal, phân phối bi / đa phương thức đơn giản, bất cứ điều gì khác lạ và tuyệt vời).

Tôi đang tìm kiếm chủ yếu cho các câu trả lời định tính, nhưng bất kỳ câu trả lời định lượng hoặc công thức cũng được hoan nghênh. Tôi đặc biệt muốn thấy bất kỳ biểu diễn trực quan nào làm cho nó rõ ràng hơn.


Bạn có thể rõ ràng hơn một chút? Trung bình số học và trung bình số học là các hàm chúng tôi áp dụng cho dữ liệu, không phải bất cứ điều gì nội tại đối với các phân phối cụ thể ... ví dụ: dữ liệu không phải là Bình thường để bạn tính toán trung bình mẫu.
khách

Ok, vì vậy, câu hỏi về mặt kỹ thuật nên là "làm thế nào để giá trị mong đợi liên quan đến giá trị trung bình, trung bình, vv của dữ liệu được rút ngẫu nhiên từ một phân phối xác suất cụ thể?" Tôi đang tìm kiếm những cách hiểu đơn giản, trực quan, tương tự như cách bạn có thể nói một cách trực giác rằng khi phân phối bị lệch nhiều hơn, trung vị và giá trị trung bình cách xa nhau hơn và trung vị có thể cho biết rõ hơn về dữ liệu nằm ở đâu.
ness101

Heh. Cảm ơn Marco. Tôi rõ ràng đã đọc sai. Cũng có thể viết như là một câu trả lời, tôi sẽ chọn nó ở câu trả lời hay nhất.
ness101

Câu trả lời:


8

(chuyển đổi một phần từ nhận xét hiện đã bị xóa của tôi ở trên)

Giá trị mong đợi và trung bình số học là chính xác cùng một điều. Trung vị có liên quan đến giá trị trung bình theo cách không tầm thường nhưng bạn có thể nói một vài điều về mối quan hệ của chúng:

  • khi một phân bố đối xứng, giá trị trung bình và trung vị là như nhau

  • khi một phân phối bị lệch, âm trung bình thường lớn hơn giá trị trung bình

  • khi một phân phối bị lệch dương, trung bình thường nhỏ hơn giá trị trung bình


Hấp dẫn. Những ví dụ nào về hành vi bất thường của phân phối bị lệch âm trong đó giá trị trung bình lớn hơn trung vị?
ness101

@ naught101: đây có phải là một lỗi đánh máy không? Phân phối lệch âm là một phân phối trong đó các kết quả bên trái trung tâm xảy ra thường xuyên hơn so với các kết quả bên phải trung tâm, và do đó, "đuôi" của các kết quả tần số thấp đi ra bên phải. Trong tình huống như vậy, bướu bên trái sẽ luôn kéo trung bình (số học) bên trái của trung tâm, trong khi đuôi bên phải sẽ giữ trung vị lớn hơn giá trị trung bình.
Assad Ebrahim

@AssadEbrahim: Không, đó là một tham chiếu đến nhận xét của Macro "trung bình thường lớn hơn trung bình" - Tôi đã yêu cầu các ví dụ phản biện.
ness101

@ naught101: Các ví dụ ngược lại trong trường hợp phân phối không theo phương thức là dòng tiếp theo của anh ta: khi bướu ở bên phải thì đuôi ở bên trái kéo trung vị bên dưới giá trị trung bình. Đuôi càng dài, khoảng cách giữa trung bình và trung bình càng lớn.
Assad Ebrahim

1
Các trường hợp thực tế trong đó người ta sẽ sử dụng một trung bình trên một trung bình hoặc ngược lại là gì? Ví dụ, trong phân tích sinh tồn trong đó thời gian sống theo phân phối theo cấp số nhân, tôi nên sử dụng trung bình (để một nửa số thứ tồn tại lâu hơn, một nửa ít hơn) hoặc trung bình (thời gian "dự kiến") nếu tôi phải dự đoán sự sống / cái chết là nhị phân kết quả thế nào?
drevicko

5

Có một mối quan hệ tốt đẹp giữa điều hòa, hình học và trung bình số học của biến ngẫu nhiên phân phối thông thường log . Để choXLN(μ,σ2)

  • HM(X)=eμ12σ2 (trung bình hài hòa),
  • GM(X)=eμ (trung bình hình học),
  • AM(X)=eμ+12σ2 (trung bình số học).

Không khó để thấy rằng tích của trung bình hài và trung bình số học mang lại bình phương của trung bình hình học, nghĩa là

HM(X)AM(X)=GM2(X).

Vì tất cả các giá trị đều dương, chúng ta có thể lấy gốc squre và thấy rằng giá trị trung bình hình học của là giá trị trung bình hình học của trung bình hài hòa của và trung bình số học củaXXX , nghĩa là

GM(X)=HM(X)AM(X).

Hơn nữa, bất đẳng thức HM-GM-AM nổi tiếng

HM(X)GM(X)AM(X)

có thể được thể hiện như

HM(X)GVar(X)=GM(X)=AM(X)GVar(X),

trong đó là phương sai hình học.GVar(X)=eσ2


1

Để hoàn thiện, cũng có những phân phối mà giá trị trung bình không được xác định rõ. Một ví dụ kinh điển là phân phối Cauchy ( câu trả lời này có một lời giải thích hay về lý do tại sao). Một ví dụ quan trọng khác là phân phối Pareto với số mũ nhỏ hơn 2.


1
Một số iff. Luật quyền lực không phải là phân phối, mà phân phối Pareto là luật quyền lực. Điều này liên quan đến tính không tích hợp của hàm năng lượng log-lồi tại . Đối với luật quyền lực, bạn có nghĩa là ít hơn 2, không lớn hơn 2.x=0
Carl

@Carl điểm tốt - Tôi chỉnh sửa câu trả lời cho phù hợp. Nhiều thx (:
drevicko

0

Mặc dù đúng là giá trị trung bình và giá trị kỳ vọng được xác định một cách chính xác, đối với phân phối sai lệch, quy ước đặt tên này trở nên sai lệch.

Hãy tưởng tượng bạn đang hỏi một người bạn về giá nhà đất ở thành phố của cô ấy bởi vì bạn thực sự thích nó ở đó và thực sự nghĩ về việc chuyển đến thành phố đó.

Nếu việc phân phối giải thưởng nhà ở là không đồng đều và đối xứng, thì bạn của bạn có thể cho bạn biết giá trung bình của nhà ở và thực sự bạn có thể mong đợi tìm thấy hầu hết các ngôi nhà trên thị trường xung quanh giá trị trung bình đó .

Tuy nhiên, nếu sự phân phối giá nhà ở không đồng đều và sai lệch, ví dụ như lệch phải với hầu hết các ngôi nhà trong phạm vi giá thấp hơn ở bên trái và chỉ một số nhà cắt cổ ở bên phải, thì giá trị trung bình sẽ bị "lệch" sang giá cao bên phải.

Đối với phân phối giá nhà lệch lạc, không chính thống này, bạn có thể mong đợi để tìm thấy hầu hết các ngôi nhà trên thị trường xung quanh trung bình .


1
Không rõ ý của bạn là gì khi bạn nói về sự phân phối không chính thống, phân phối giá nhà có giá xung quanh trung vị. Điều có thể nói là một nửa các giá trị sẽ ở hoặc dưới trung vị & một nửa sẽ ở hoặc trên trung bình. Nó không chỉ ra mức độ gần với các giá trị này với giá trị trung bình.
Michael R. Chernick

Tôi cho rằng câu cuối cùng của bạn được cho là kết thúc bằng "trung vị"? Nếu vậy tôi nghĩ rõ ràng rằng trung vị phải là giá trị (có thể đạt được) gần nhất với mức trung bình (có thể không đạt được, ví dụ không phải là giá nhà đất) của một mẫu ngẫu nhiên được lấy từ dân số được mô tả ở trên. Đó là trung bình gần nhất với mẫu trung bình đó, trung bình. Nếu không phải như vậy, tôi đã không đưa ra tuyên bố về mức độ trung bình của các giá trị này. Tôi đưa ra yêu cầu về khoảng cách của họ với trung vị.
Sol Hator
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.