Mối quan hệ thực nghiệm giữa trung bình, trung bình và chế độ


40

Đối với phân phối không chính thống bị lệch vừa phải, chúng ta có mối quan hệ thực nghiệm sau đây giữa giá trị trung bình, trung bình và chế độ: Mối quan hệ này như thế nào nguồn gốc?

(Mean - Mode)3(Mean - Median)

Có phải Karl Pearson đã vạch ra hàng ngàn mối quan hệ này trước khi hình thành kết luận này, hay có một dòng lý luận logic đằng sau mối quan hệ này?

Câu trả lời:


29

Biểu thị giá trị trung bình ( trung bình), m trung bình, σ độ lệch chuẩn và M chế độ. Cuối cùng, gọi X là mẫu, một nhận thức về phân phối F không đồng nhất liên tục mà trong đó hai khoảnh khắc đầu tiên tồn tại.μmσMXF

Nó được biết đến rằng

(1)|μm|σ

Đây là một bài tập sách giáo khoa thường xuyên:

Xuất phát bình đẳng đầu tiên từ định nghĩa của giá trị trung bình, thứ ba đến về vì trung bình là minimiser duy nhất (trong số tất cảc's) củaE| X-c| và thứ tư từ bất đẳng thức của Jensen (nghĩa là định nghĩa của hàm lồi). Trên thực tế, sự bất bình đẳng này có thể được thực hiện chặt chẽ hơn. Trong thực tế, đối với bất kỳF, thỏa mãn các điều kiện trên, nó có thể được hiển thị [3]

|μm|=|E(Xm)|E|Xm|E|Xμ|=E(Xμ)2E(Xμ)2=σ
cE|Xc|F

(2)|mμ|0.6σ

Mặc dù nó là nói chung không đúng sự thật ( Abadir, 2005 ) rằng bất kỳ phân phối unimodal phải đáp ứng một trong hai của nó vẫn có thể chỉ ra rằng sự bất bình đẳng

Mmμ or Mmμ

(3)|μM|3σ

giữ cho bất kỳ phân phối có thể tích hợp không vuông, vuông (bất kể độ nghiêng). Điều này được chứng minh chính thức ở Johnson và Rogers (1951) mặc dù bằng chứng phụ thuộc vào nhiều bổ đề khó có thể phù hợp ở đây. Đi xem giấy gốc.


FμmMF

(4)F(mx)+F(m+x)1 for all x

μmMμm(4)(4)

(4)σ=1

3(mμ)(0,30.6] and Mμ(mμ,3]

0<mμ<33<σ=1(4)

  • [0]: Vấn đề thời điểm cho phân phối không chính thống. NL Johnson và CA Rogers. Biên niên sử thống kê toán học, tập. 22, số 3 (tháng 9 năm 1951), trang 433-439
  • [1]: Bất bình đẳng trung bình-chế độ trung bình: Counterexamples Karim M. Abadir Lý thuyết kinh tế lượng, Vol. 21, Số 2 (Tháng Tư, 2005), trang 477-482
  • [2]: WR van Zwet, Trung bình, trung vị, chế độ II, Thống kê. Neerlandica, 33 (1979), trang 1--5.
  • [3]: Trung bình, trung bình và phương thức phân phối không chính thống: Một đặc tính. S. Basu và A. DasGupta (1997). Lý thuyết Probab. Appl., 41 (2), 210 bóng223.
  • [4]: Một số nhận xét về ý nghĩa, trung bình, chế độ và sự sai lầm. Michikemo Sato. Tạp chí Thống kê Úc. Tập 39, Số 2, trang 219 Từ224, tháng 6 năm 1997
  • [5]: PT von Hippel (2005). Trung bình, trung bình và Skew: Sửa một quy tắc sách giáo khoa. Tạp chí Giáo dục Thống kê Tập 13, Số 2.

Tôi xin lỗi, tôi chỉ là một sinh viên toán năm thứ nhất. Bạn có thể vui lòng cung cấp / giới thiệu một liên kết / cuốn sách / giấy mô tả mối quan hệ được bắt nguồn như thế nào không?
Sara

3
@Sara Tôi nghĩ rằng nó bắt nguồn từ Karl Pearson, người sử dụng mối quan hệ thực nghiệm này cho "độ lệch chế độ Pearson" của mình. Ngoài ra, bạn có thể thấy bài viết trực tuyến thú vị này, j.mp/aWymCv .
chl

Cảm ơn bạn chl và kwak cho liên kết và câu trả lời bạn đã cung cấp. Tôi sẽ nghiên cứu chúng.
Sara

2
E|Xk|kX

1
|Mμ|3|μm|

9

Tờ chl chỉ ra một số thông tin quan trọng - cho thấy rằng nó không gần với quy tắc chung (ngay cả đối với các biến liên tục, trơn tru, "cư xử độc đáo", như Weibull). Vì vậy, trong khi nó thường có thể gần đúng, nhưng nó thường không.

Vậy Pearson đến từ đâu? Làm thế nào anh ta đến gần đúng này?

May mắn thay, Pearson khá nhiều cho chúng ta câu trả lời chính mình.

Việc sử dụng đầu tiên của thuật ngữ "xiên" theo nghĩa chúng ta đang sử dụng có vẻ là Pearson, 1895 [1] (nó xuất hiện ngay trong tiêu đề). Bài viết này dường như cũng là nơi ông giới thiệu chế độ thuật ngữ (chú thích, tr345):

Tôi đã thấy thuận tiện khi sử dụng chế độ thuật ngữ cho abscissa tương ứng với tọa độ tần số tối đa. "Trung bình", "chế độ" và "trung vị" có tất cả các ký tự riêng biệt quan trọng đối với nhà thống kê.

Nó cũng có vẻ là chi tiết thực sự đầu tiên của ông về hệ thống các đường cong tần số .

Vì vậy, khi thảo luận về ước tính của tham số hình dạng trong phân phối Pearson Loại III (cái mà bây giờ chúng ta gọi là dịch chuyển - và có thể bị lật - gamma), ông nói (tr375):

p

>1

x

Và thực tế, nếu chúng ta nhìn vào tỷ lệ (chế độ trung bình) so với (trung bình trung bình) cho phân phối gamma, chúng ta quan sát điều này:

nhập mô tả hình ảnh ở đây

(Phần màu xanh đánh dấu vùng Pearson nói rằng phép tính gần đúng là hợp lý).

αβ

nhập mô tả hình ảnh ở đây

βα=kβααβααββ+α=cβ+ααβ

α>10

nhập mô tả hình ảnh ở đây

eμσ2,eμeμ+σ2/2

eμeσ2/2eσ2eσ2/21σ232σ212σ2σ2

Có một số lượng lớn các bản phân phối nổi tiếng - một vài trong số đó Pearson đã quen thuộc - gần như đúng với một loạt các giá trị tham số; anh ta nhận thấy nó với bản phân phối gamma, nhưng sẽ có ý tưởng được xác nhận khi anh ta xem xét một số bản phân phối khác mà anh ta có thể sẽ xem xét.

[1]: Pearson, K. (1895),
"Đóng góp cho lý thuyết tiến hóa toán học, II: Biến đổi xiên trong vật liệu đồng nhất",
Giao dịch triết học của Hiệp hội Hoàng gia, sê-ri A, 186, 343-414
[Không có bản quyền. Tự do có sẵn ở đây ]


4

Mối quan hệ này đã không được bắt nguồn. Nó đã được nhận thấy để giữ khoảng phân phối gần đối xứng theo kinh nghiệm . Xem giải trình của Yule trong phần Giới thiệu về lý thuyết thống kê , (1922), tr.121, Chương VII Phần 20. Ông trình bày ví dụ thực nghiệm.


+1 Thật vậy, câu nói của tôi về Pearson 1895 chỉ ra rằng đó là thứ anh ấy chú ý hơn là xuất phát.
Glen_b

2
Các văn bản toán học cũ rất thú vị để đọc hơn so với văn bản ngày nay
Aksakal
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.