Định lý giới hạn trung tâm cho trung vị mẫu


54

Nếu tôi tính trung bình của một số lượng lớn các quan sát được rút ra từ cùng một phân phối, thì định lý giới hạn trung tâm có nói rằng phân phối của các trung vị sẽ xấp xỉ một phân phối bình thường không? Sự hiểu biết của tôi là điều này đúng với phương tiện của một số lượng lớn các mẫu, nhưng nó cũng đúng với trung bình?

Nếu không, phân phối cơ bản của trung bình mẫu là gì?


9
Bạn cần một số điều kiện đều đặn để trung vị sẽ có phân phối bình thường dưới sự thay đổi kích thước trong giới hạn. Để xem những gì có thể sai, hãy xem xét bất kỳ phân phối nào qua số điểm hữu hạn, giả sử, thống nhất trên . { - 1 , 0 , 1 }X{1,0,1}
Đức hồng y

5
Về điều kiện đều đặn: Nếu phân phối cơ bản có mật độ khác biệt ở trung vị (đúng), thì trung vị mẫu sẽ có phân phối chuẩn không tiệm cận với phương sai phụ thuộc vào đạo hàm đã nói. Điều này thường giữ cho các lượng tử tùy ý.
Đức hồng y

6
@cardinal Tôi tin rằng bạn cần các điều kiện bổ sung: khi mật độ khác biệt thứ hai, bằng 0 tại trung vị và không có đạo hàm đầu tiên ở đó, thì phân phối tiệm cận của trung vị mẫu sẽ là lưỡng kim.
whuber

4
@whuber: Có, vì mật độ (không phải là đạo hàm của nó như tôi vô tình đã nêu trước đó) đi vào phương sai dưới dạng đối ứng, giá trị của mật độ tại điểm đó không được bằng không. Xin lỗi vì đã bỏ điều kiện đó!
hồng y

4
Các mẫu phản ứng cơ bản có thể được tạo bằng cách sử dụng bất kỳ phân phối nào gán xác suất cho một khoảng và xác suất cho trong đó chẳng hạn như một Bernoulli ( ). Giá trị trung bình mẫu sẽ nhỏ hơn hoặc bằng thường xuyên vì chúng lớn hơn hoặc bằng . Khả năng trung vị không nằm trong gần đối với các mẫu lớn, thực sự để lại một "khoảng trống" trong1/2(,μ]1/2[μ+δ,)δ>0,(1/2)μ=0,δ=1μμ+δ(μ,μ+δ)0(μ,μ+δ)trong phân phối giới hạn - mà rõ ràng sau đó sẽ không bình thường, bất kể nó được chuẩn hóa như thế nào.
whuber

Câu trả lời:


38

Nếu bạn làm việc theo các biến chỉ báo (nghĩa là nếu và nếu không), bạn có thể trực tiếp áp dụng định lý giới hạn trung tâm cho một giá trị trung bình của và bằng cách sử dụng phương thức Delta , biến nó thành một phân phối chuẩn tiệm cận cho , do đó có nghĩa là bạn sẽ có được bình thường tiệm cận cho quantiles cố định của .Zi=1Xix0ZF - 1 X ( ˉ Z ) XFX1(Z¯)X

Vì vậy, không chỉ là trung vị, mà là tứ phân vị, phần trăm thứ 90, ... vv

Một cách lỏng lẻo, nếu chúng ta nói về lượng tử mẫu thứ trong các mẫu đủ lớn, chúng ta sẽ biết rằng nó sẽ có phân phối bình thường với số lượng trung bình dân số và phương sai .qqxqq(1q)/(nfX(xq)2)

Do đó, đối với trung vị ( ), phương sai trong các mẫu đủ lớn sẽ xấp xỉ .q=1/21/(4nfX(μ~)2)

Dĩ nhiên, bạn cần tất cả các điều kiện để giữ, vì vậy nó không hoạt động trong mọi tình huống, nhưng đối với các phân phối liên tục trong đó mật độ tại lượng tử dân số là dương và khác biệt, v.v., ...

Hơn nữa, nó không giữ được lượng tử cực đoan, vì CLT không hoạt động ở đó (trung bình của Z sẽ không bình thường về mặt triệu chứng). Bạn cần lý thuyết khác nhau cho các giá trị cực đoan.


Chỉnh sửa: phê bình của whuber là chính xác; điều này sẽ hoạt động nếu là trung vị dân số chứ không phải trung bình mẫu. Đối số cần được sửa đổi để thực sự hoạt động đúng.x


5
Tôi nghĩ có thể thiếu một phần logic của lời giải thích này: làm thế nào chính xác một người sử dụng các chỉ số để lấy trung bình mẫu ? Tôi có thể thấy khi là trung vị cơ bản , chỉ báo sẽ hoạt động: nhưng chỉ báo này không trùng với trung vị mẫu hoặc bất kỳ chức năng nào của nó. X ixxXix
whuber

Làm thế nào để bạn đi từ phân phối chuẩn tiệm cận cho để có được bình thường tiệm cận cho quantiles cố định của X? Chỉnh sửa: Tôi đã nhận nó, mà ¯ Z trở thành một giá trị phần trăm 0-100% giá trị do đó quantile là tiệm bình thườngFX1(Z¯)Z¯
adam

48

Ý tưởng chính là phân phối lấy mẫu của trung vị là đơn giản để biểu thị theo hàm phân phối nhưng phức tạp hơn để biểu thị theo giá trị trung bình. Khi chúng ta hiểu làm thế nào hàm phân phối có thể biểu thị lại các giá trị dưới dạng xác suất và quay lại lần nữa, thật dễ dàng để lấy được phân phối lấy mẫu chính xác của trung vị. Một phân tích nhỏ về hành vi của hàm phân phối gần trung vị của nó là cần thiết để chỉ ra rằng điều này là không bình thường.

(Phân tích tương tự làm việc cho phân phối lấy mẫu của bất kỳ lượng tử nào, không chỉ trung vị.)

Tôi sẽ không cố gắng nghiêm ngặt trong việc trình bày này, nhưng tôi thực hiện nó theo các bước dễ dàng được chứng minh một cách nghiêm ngặt nếu bạn có ý định làm điều đó.


Trực giác

Đây là những bức ảnh chụp hộp chứa 70 nguyên tử khí nguyên tử nóng:

Hình 1

Trong mỗi hình ảnh, tôi đã tìm thấy một vị trí, được hiển thị dưới dạng một đường thẳng đứng màu đỏ, phân chia các nguyên tử thành hai nhóm bằng nhau giữa bên trái (được vẽ dưới dạng các chấm đen) và bên phải (các chấm trắng). Đây là trung vị của các vị trí: 35 nguyên tử nằm bên trái và 35 bên phải. Các trung vị thay đổi vì các nguyên tử đang di chuyển ngẫu nhiên xung quanh hộp.

Chúng tôi quan tâm đến việc phân phối vị trí giữa này. Một câu hỏi như vậy được trả lời bằng cách đảo ngược thủ tục của tôi: trước tiên hãy vẽ một đường thẳng đứng ở đâu đó, nói tại vị trí . Cơ hội mà một nửa các nguyên tử sẽ ở bên trái của x và một nửa ở bên phải của nó là gì? Các nguyên tử ở bên trái riêng lẻ có cơ hội x ở bên trái. Các nguyên tử ở bên phải riêng lẻ có cơ hội 1 - x ở bên phải. Giả sử vị trí của họ là độc lập thống kê, cơ hội sẽ nhân lên, cho x 35 ( 1 - x ) 35xxx1xx35(1x)35cho cơ hội của cấu hình cụ thể này. Một cấu hình tương đương có thể đạt được cho sự phân chia khác nhau của nguyên tử thành hai phần 35 tầng . Thêm các số này cho tất cả các phân chia có thể có như vậy sẽ có cơ hội7035

Pr(x is a median)=Cxn/2(1x)n/2

Trong đó là tổng số nguyên tử và tỷ lệ thuận với số lần chia của các nguyên tử thành hai nhóm nhỏ bằng nhau.C nnCn

Công thức này xác định sự phân bố của các trung bình như một Beta phân phối(n/2+1,n/2+1) .

Bây giờ hãy xem xét một hộp có hình dạng phức tạp hơn:

Hình 2

Một lần nữa, trung vị khác nhau. Vì hộp thấp gần trung tâm, nên không có nhiều thể tích của nó ở đó: một sự thay đổi nhỏ trong thể tích chiếm bởi một nửa số nguyên tử (một lần nữa là màu đen) - hoặc, chúng ta cũng có thể thừa nhận, các khu vực ở phía bên trái như trong những con số - tương ứng với một sự thay đổi tương đối lớn trong vị trí nằm ngang của trung bình. Trên thực tế, do diện tích được phụ thuộc bởi một phần nằm ngang nhỏ của hộp tỷ lệ thuận với chiều cao ở đó, nên những thay đổi về trung vị được chia cho chiều cao của hộp. Điều này làm cho trung vị biến đổi nhiều hơn cho hộp này so với hộp vuông, bởi vì cái này thấp hơn rất nhiều ở giữa.

Nói tóm lại, khi chúng ta đo vị trí của dải trung vị theo diện tích (bên trái và bên phải), phân tích ban đầu (đối với hộp vuông) không thay đổi. Hình dạng của hộp chỉ làm phức tạp sự phân phối nếu chúng ta khăng khăng đo trung vị theo vị trí nằm ngang của nó. Khi chúng ta làm như vậy, mối quan hệ giữa diện tích và vị trí đại diện tỷ lệ nghịch với chiều cao của hộp.

Có nhiều hơn để học hỏi từ những hình ảnh. Rõ ràng là khi một vài nguyên tử nằm trong hộp (một trong hai), có nhiều khả năng một nửa trong số chúng có thể vô tình cuộn lại thành cụm ở hai bên. Khi số lượng nguyên tử tăng lên, khả năng mất cân bằng cực độ như vậy sẽ giảm. Để theo dõi điều này, tôi đã lấy "phim" - một chuỗi dài 5000 khung hình - cho hộp cong chứa đầy , rồi , , và cuối cùng là nguyên tử, và ghi chú các trung vị. Dưới đây là biểu đồ của các vị trí trung bình:15 75 37531575375

Hình 3

Rõ ràng, với số lượng nguyên tử đủ lớn, sự phân bố vị trí trung bình của chúng bắt đầu trông giống hình chuông và ngày càng hẹp hơn: trông giống như một kết quả Định lý giới hạn trung tâm, phải không?


Kết quả định lượng

"Hộp", tất nhiên, mô tả mật độ xác suất của một số phân phối: trên cùng của nó là biểu đồ của hàm mật độ (PDF). Do đó, các khu vực đại diện cho xác suất. Đặt điểm ngẫu nhiên và độc lập trong một hộp và quan sát vị trí nằm ngang của chúng là một cách để lấy mẫu từ phân phối. (Đây là ý tưởng đằng sau lấy mẫu từ chối. )n

Hình tiếp theo kết nối những ý tưởng này.

hinh 4

Điều này có vẻ phức tạp, nhưng nó thực sự khá đơn giản. Có bốn lô liên quan ở đây:

  1. Biểu đồ trên cùng hiển thị bản PDF của bản phân phối cùng với một mẫu ngẫu nhiên có kích thước . Các giá trị lớn hơn trung vị được hiển thị dưới dạng các chấm trắng; các giá trị nhỏ hơn trung vị là các chấm đen. Nó không cần tỷ lệ dọc vì chúng ta biết tổng diện tích là sự thống nhất.n

  2. Biểu đồ giữa là hàm phân phối tích lũy cho cùng một phân phối: nó sử dụng chiều cao để biểu thị xác suất. Nó chia sẻ trục ngang của nó với cốt truyện đầu tiên. Trục dọc của nó phải đi từ đến vì nó đại diện cho xác suất.101

  3. Cốt truyện bên trái có nghĩa là được đọc sang một bên: đó là bản PDF của bản phân phối Beta . Nó cho thấy trung vị trong hộp sẽ thay đổi như thế nào, khi trung vị được đo theo các khu vực ở bên trái và bên phải của giữa (thay vì được đo bởi vị trí nằm ngang của nó). Tôi đã rút ra điểm ngẫu nhiên từ bản PDF này, như được hiển thị và kết nối chúng với các đường đứt nét ngang với các vị trí tương ứng trên CDF gốc: đây là cách các khối lượng (được đo ở bên trái) được chuyển đổi sang các vị trí (được đo trên đỉnh, giữa và đồ họa phía dưới). Một trong những điểm này thực sự tương ứng với trung vị được hiển thị trong cốt truyện hàng đầu; Tôi đã vẽ một đường thẳng đứng vững chắc để thể hiện điều đó.16(n/2+1,n/2+1)16

  4. Biểu đồ dưới cùng là mật độ lấy mẫu của trung vị, được đo bằng vị trí nằm ngang của nó. Nó có được bằng cách chuyển đổi khu vực (trong ô bên trái) sang vị trí. Công thức chuyển đổi được đưa ra bởi nghịch đảo của CDF gốc: đây đơn giản là định nghĩa của CDF nghịch đảo! (Nói cách khác, CDF chuyển đổi vị trí thành khu vực bên trái; CDF nghịch đảo chuyển đổi từ khu vực này sang vị trí khác.) Tôi đã vẽ các đường đứt nét dọc cho thấy cách các điểm ngẫu nhiên từ ô bên trái được chuyển đổi thành các điểm ngẫu nhiên trong ô dưới cùng . Quá trình đọc qua và sau đó xuống cho chúng ta biết làm thế nào để đi từ khu vực này đến vị trí khác.

Đặt là CDF của phân phối gốc (lô giữa) và là CDF của phân phối Beta. Để tìm cơ hội trung vị nằm ở bên trái của một số vị trí , trước tiên, sử dụng để lấy khu vực bên trái của trong hộp: đây là chính . Phân phối Beta ở bên trái cho chúng ta cơ hội rằng một nửa số nguyên tử sẽ nằm trong tập này, cho : đây là CDF của vị trí trung bình . Để tìm tệp PDF của nó (như được hiển thị trong ô dưới cùng), hãy lấy đạo hàm:FGxFxF(x)G(F(x))

ddxG(F(x))=G(F(x))F(x)=g(F(x))f(x)

Trong đó là PDF (âm mưu trên cùng) và là Beta PDF (âm mưu bên trái).fg

Đây là một công thức chính xác để phân phối trung vị cho bất kỳ phân phối liên tục. (Với sự cẩn thận trong diễn giải, nó có thể được áp dụng cho bất kỳ phân phối nào, dù liên tục hay không.)


Kết quả tiệm cận

Khi là rất lớn và không có một bước nhảy tại trung bình của nó, là trung bình mẫu phải thay đổi chặt chẽ xung quanh đúng trung bình của phân phối. Ngoài ra, giả sử PDF liên tục gần , trong công thức trước sẽ không thay đổi nhiều so với giá trị của nó tại được đưa ra bởi Hơn nữa, sẽ không thay đổi nhiều so với giá trị của nó ở đó: theo thứ tự đầu tiên,nFμfμ f(x)μ,f(μ).F

F(x)=F(μ+(xμ))F(μ)+F(μ)(xμ)=1/2+f(μ)(xμ).

Do đó, với một xấp xỉ ngày càng hoàn thiện khi phát triển lớn hơn,n

g(F(x))f(x)g(1/2+f(μ)(xμ))f(μ).

Đó chỉ đơn thuần là sự thay đổi vị trí và quy mô phân phối Beta. Việc thay đổi kích thước theo sẽ chia phương sai của nó cho (tốt hơn là không khác!). Ngẫu nhiên, phương sai của Beta rất gần với .f(μ)f(μ)2(n/2+1,n/2+1)n/4

Phân tích này có thể được xem như là một ứng dụng của Phương pháp Delta .

Cuối cùng, Beta xấp xỉ Bình thường đối với lớn . Có nhiều cách để thấy điều này; có lẽ đơn giản nhất là nhìn vào logarit của tệp PDF gần :(n/2+1,n/2+1)n1/2

log(C(1/2+x)n/2(1/2x)n/2)=n2log(14x2)+C=C2nx2+O(x4).

(Các hằng số và chỉ đơn giản hóa tổng diện tích thành thống nhất.) Thông qua thứ tự thứ ba trong sau đó, đây giống như nhật ký của PDF bình thường với phương sai (Đối số này được thực hiện nghiêm ngặt bằng cách sử dụng các hàm tạo đặc trưng hoặc tích lũy thay vì nhật ký của PDF.)CCx,1/(4n).

Đặt điều này hoàn toàn, chúng tôi kết luận rằng

  • Phân bố trung vị mẫu có phương sai xấp xỉ ,1/(4nf(μ)2)

  • và nó là khoảng bình thường cho lớn ,n

  • tất cả được cung cấp PDF là liên tục và khác không ở trung vịfμ.


Tôi thích con số thứ 4 đó. Bạn đã làm cho nó bằng cách sử dụng R?
EngrStudent

@Engr tôi có lẽ có thể đã thực hiện một mặt hàng như nó trong R, có lẽ sử dụng layout, nhưng trên thực tế nó đã được thực hiện với Mathematica 9.
whuber

1
'Đây là một điều của vẻ đẹp.
EngrStudent

@whuber không phải là Beta (n / 2 + 1, n / 2 + 1) theo Beta (1,1) trước? Xem ví dụ: ine.pt/revstat/pdf/rs080204.pdf
Tim

1
@Tim Tôi không hiểu mức độ liên quan của tham chiếu đến trước, nhưng tôi đánh giá cao việc bạn chỉ ra rằng tên chính xác của bản phân phối Beta được xác định trong phần "Trực giác" là Beta . Tôi sẽ sửa nó ở bất cứ nơi nào nó xảy ra (ở một vài nơi trong cuộc thảo luận). (n/2+1,n/2+1)
whuber

18

Câu trả lời chiếu sáng @EngrStudent cho chúng ta biết rằng chúng ta nên mong đợi các kết quả khác nhau khi phân phối liên tục và khi nó rời rạc (biểu đồ "màu đỏ", trong đó phân phối tiệm cận của mẫu trung gian thất bại trông giống như bình thường, tương ứng với phân phối Binomial (3), Hình học (11), Hypergeometric (12), Binomial âm (14), Poisson (18), Đồng phục rời rạc (22).

Và thực sự đây là trường hợp. Khi phân phối rời rạc, mọi thứ trở nên phức tạp. Tôi sẽ cung cấp bằng chứng cho Trường hợp hoàn toàn liên tục, về cơ bản không làm chi tiết hơn câu trả lời đã được @Glen_b đưa ra, và sau đó tôi sẽ thảo luận một chút về những gì xảy ra khi phân phối rời rạc, cũng cung cấp một tài liệu tham khảo gần đây cho bất kỳ ai quan tâm đến lặn trong.

TUYỆT ĐỐI LIÊN TỤC
Xem xét một tập hợp các biến ngẫu nhiên hoàn toàn liên tục iid với hàm phân phối (cdf) và hàm mật độ . Xác định trong đó là hàm chỉ thị. Do đó, là một Bernoulli rv, với {X1,...Xn}FX(x)=P(Xix)FX(x)=fX(x)ZiI{Xix}I{}Zi

E(Zi)=E(I{Xix})=P(Xix)=FX(x),Var(Zi)=FX(x)[1FX(x)],i

Đặt là giá trị trung bình mẫu của các iid Bernoullis này, được xác định cho cố định là có nghĩa là Định lý giới hạn trung tâm áp dụng và chúng tôi cóYn(x)x

Yn(x)=1ni=1nZi
E[Yn(x)]=FX(x),Var(Yn(x))=(1/n)FX(x)[1FX(x)]

n(Yn(x)FX(x))dN(0,FX(x)[1FX(x)])

Lưu ý rằng tức là không khác với hàm phân phối theo kinh nghiệm. Bằng cách áp dụng "Phương pháp Delta", chúng ta có chức năng liên tục và khác biệt với đạo hàm khác không tại điểm quan tâm, chúng ta thu đượcYn(x)=F^n(x)g(t)g(t)

n(g[F^n(x)]g[FX(x)])dN(0,FX(x)[1FX(x)](g[FX(x)])2)

Bây giờ, chọn trong đó biểu thị hàm nghịch đảo. Đây là một hàm liên tục và khác biệt (vì có và theo Định lý hàm nghịch đảo mà chúng ta cóg(t)FX1(t),t(0,1)1FX(x)

g(t)=ddtFX1(t)=1fx(FX1(t))

Chèn các kết quả này vào trong kết quả tiệm cận có nguồn gốc phương pháp delta chúng ta cóg

n(FX1(F^n(x))FX1(FX(x)))dN(0,FX(x)[1FX(x)][fx(FX1(FX(x)))]2)

và đơn giản hóa,

n(FX1(F^n(x))x)dN(0,FX(x)[1FX(x)][fx(x)]2)

.. cho bất kỳ cố định . Bây giờ đặt , trung vị (đúng) của dân số. Sau đó, chúng tôi có và kết quả chung ở trên trở thành, đối với trường hợp quan tâm của chúng tôi,xx=mFX(m)=1/2

n(FX1(F^n(m))m)dN(0,1[2fx(m)]2)

Nhưng hội tụ đến trung vị mẫu . Đây là vìFX1(F^n(m))m^

FX1(F^n(m))=inf{x:FX(x)F^n(m)}=inf{x:FX(x)1ni=1nI{Xim}}

Phía bên phải của bất đẳng thức hội tụ đến và nhỏ nhất mà cuối cùng là , là trung vị mẫu.1/2xFX1/2

Vì vậy, chúng tôi có được

n(m^m)dN(0,1[2fx(m)]2)
là Trung tâm Định lý giới hạn cho trung vị mẫu cho các phân phối hoàn toàn liên tục.

PHÂN PHỐI KHÁM PHÁ
Khi phân phối rời rạc (hoặc khi mẫu chứa các mối quan hệ), người ta đã lập luận rằng định nghĩa "cổ điển" của các lượng tử mẫu, và do đó cũng là trung bình, có thể gây hiểu nhầm ở vị trí đầu tiên , vì khái niệm lý thuyết là được sử dụng để đo lường những gì người ta cố gắng đo bằng lượng tử.
Trong mọi trường hợp, nó đã được mô phỏng theo định nghĩa cổ điển này (cái mà chúng ta đều biết), phân phối tiệm cận của trung vị mẫu là không bình thường và phân phối rời rạc.

Một định nghĩa khác của các lượng tử mẫu là bằng cách sử dụng khái niệm hàm "phân phối giữa", được định nghĩa là

Fmid(x)=P(Xx)12P(X=x)

Định nghĩa của các lượng tử mẫu thông qua khái niệm hàm phân phối giữa có thể được xem như là một khái quát hóa có thể bao gồm các trường hợp đặc biệt là các phân phối liên tục, nhưng cũng có thể là các phân phối không liên tục.

Đối với trường hợp phân phối rời rạc, trong số các kết quả khác, người ta thấy rằng trung vị mẫu như được định nghĩa thông qua khái niệm này có phân phối bình thường không có triệu chứng với ... phương sai nhìn phức tạp.

Hầu hết đây là những kết quả gần đây. Tham chiếu là Ma, Y., Genton, MG, & Parzen, E. (2011). Tính chất tiệm cận của các lượng tử mẫu của các phân phối rời rạc. Biên niên sử của Viện Toán học Thống kê, 63 (2), 227-243. , nơi người ta có thể tìm thấy một cuộc thảo luận và liên kết đến các tài liệu liên quan cũ hơn.


2
(+1) Đối với bài viết. Đây là một câu trả lời tuyệt vời.
Alex Williams

Bạn có thể giải thích tại sao hội tụ đến trung vị mẫu không? FX1(F^n(m))m^
kasa

Tôi biết rằng trong phân phối, nhưng tôi không thể thấy mẫu trung bình bằng vớiF^n(m)FX(m)m^FX1(F^n(m))
kasa

1
@kasa Tôi nói thêm một chút về vấn đề này.
Alecos Papadopoulos

Tôi rất tiếc khi tiếp tục đưa vấn đề này trở lại: Nhưng nhỏ nhất mà cuối cùng là , là trung vị dân số, không phải là trung vị mẫu, phải không? xFX(x)1/2
kasa

10

Vâng, và không chỉ cho trung vị, mà còn cho bất kỳ định lượng mẫu nào. Sao chép từ bài báo này , được viết bởi TS Ferguson, một giáo sư tại UCLA (trang của ông ở đây ), trong đó đề cập đến sự phân phối chung của trung bình mẫu và lượng tử mẫu, chúng tôi có:

Hãy để là iid với hàm phân phối , mật độ , trung bình và phương sai hữu hạn . Đặt và để biểu thị lượng tử thứ của , sao cho . Giả sử rằng mật độ liên tục và dương tại . Đặt biểu thị định lượng -th mẫu . Sau đóX1,...,XnF(x)f(x)μσ20<p<1xppFF(xp)=pf(x)xpYn=X(n:np)p

n(Ynxp)dN(0,p(1p)/(f(xp))2)

Với (trung vị) và bạn có CLT cho trung vị,p=1/2xp=m

n(Ynm)dN(0,[2f(m)]2)

1
Đẹp. Điều đáng nói là phương sai của trung bình mẫu không dễ ước tính như giá trị trung bình của mẫu.
Michael M

@Alecos - Làm thế nào bạn có được hai câu trả lời cho câu hỏi này?
EngrStudent

1
@EngrStudent Hệ thống cho phép nó, nó chỉ yêu cầu bạn xác minh rằng bạn thực sự muốn thêm câu trả lời thứ hai.
Alecos Papadopoulos

8

Tôi thích câu trả lời phân tích được đưa ra bởi Glen_b. Đó là một câu trả lời tốt.

Nó cần một hình ảnh. Tôi thích hình ảnh.

Dưới đây là các lĩnh vực co giãn trong câu trả lời cho câu hỏi:

  • Có rất nhiều bản phân phối trên thế giới. Số dặm có khả năng thay đổi.
  • Đủ có ý nghĩa khác nhau. Đối với một ví dụ ngược với một lý thuyết, đôi khi một ví dụ phản biện duy nhất được yêu cầu để "đủ" được đáp ứng. Để chứng minh tỷ lệ khuyết tật thấp sử dụng độ không đảm bảo nhị thức, hàng trăm hoặc hàng nghìn mẫu có thể được yêu cầu.

Đối với một tiêu chuẩn bình thường, tôi đã sử dụng mã MatLab sau:

mysamples=1000;

loops=10000;

y1=median(normrnd(0,1,mysamples,loops));

cdfplot(y1)

và tôi đã nhận được cốt truyện sau đây như là một đầu ra:

nhập mô tả hình ảnh ở đây

Vậy tại sao không làm điều này cho 22 bản phân phối "tích hợp" khác, ngoại trừ sử dụng các ô thăm dò (trong đó đường thẳng có nghĩa là rất bình thường)?

nhập mô tả hình ảnh ở đây

Và đây là mã nguồn cho nó:

mysamples=1000;

loops=600;

y=zeros(loops,23);

y(:,1)=median(random('Normal', 0,1,mysamples,loops));

y(:,2)=median(random('beta', 5,0.2,mysamples,loops));
y(:,3)=median(random('bino', 10,0.5,mysamples,loops));
y(:,4)=median(random('chi2', 10,mysamples,loops));
y(:,5)=median(random('exp', 700,mysamples,loops));

y(:,6)=median(random('ev', 700,mysamples,loops));
y(:,7)=median(random('f', 5,3,mysamples,loops));
y(:,8)=median(random('gam', 10,5,mysamples,loops));
y(:,9)=median(random('gev', 0.24, 1.17, 5.8,mysamples,loops));
y(:,10)=median(random('gp', 0.12, 0.81,mysamples,loops));

y(:,11)=median(random('geo', 0.03,mysamples,loops));
y(:,12)=median(random('hyge', 1000,50,20,mysamples,loops));
y(:,13)=median(random('logn', log(20000),1.0,mysamples,loops));
y(:,14)=median(random('nbin', 2,0.11,mysamples,loops));
y(:,15)=median(random('ncf', 5,20,10,mysamples,loops));

y(:,16)=median(random('nct', 10,1,mysamples,loops));
y(:,17)=median(random('ncx2', 4,2,mysamples,loops));
y(:,18)=median(random('poiss', 5,mysamples,loops));
y(:,19)=median(random('rayl', 0.5,mysamples,loops));
y(:,20)=median(random('t', 5,mysamples,loops));

y(:,21)=median(random('unif',0,1,mysamples,loops));
y(:,22)=median(random('unid', 5,mysamples,loops));
y(:,23)=median(random('wbl', 0.5,2,mysamples,loops));


figure(1); clf
hold on

for i=2:23
    subplot(4,6,i-1)

    probplot(y(:,i))
    title(['Probplot of ' num2str(i)])
    axis tight

    if not(isempty(find(i==[3,11,12,14,18,22])))
        set(gca,'Color','r')
    end

end

Khi tôi thấy bằng chứng phân tích tôi có thể nghĩ "về lý thuyết tất cả chúng đều phù hợp" nhưng khi tôi dùng thử thì tôi có thể tiết lộ rằng "có một số cách điều này không hoạt động tốt, thường liên quan đến rời rạc hoặc bị ràng buộc cao các giá trị "và điều này có thể khiến tôi muốn cẩn thận hơn trong việc áp dụng lý thuyết vào bất cứ điều gì tốn tiền.

Chúc may mắn.


Tôi có sai hay phân phối mà trung vị không được phân phối bình thường là rời rạc?
SeF
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.