Một ước tính không thiên vị của trung vị


16

Giả sử chúng ta có một biến ngẫu nhiên được hỗ trợ trên từ đó chúng ta có thể vẽ mẫu. Làm thế nào chúng ta có thể đưa ra một ước tính không thiên vị về trung vị của ?[ 0 , 1 ] XX[0,1]X

Tất nhiên chúng ta có thể tạo ra một số mẫu và lấy trung bình mẫu, nhưng tôi hiểu điều này nói chung sẽ không thiên vị.

Lưu ý: câu hỏi này có liên quan, nhưng không giống với câu hỏi cuối cùng của tôi , trong trường hợp chỉ có thể được lấy mẫu xấp xỉ.X

Câu trả lời:


13

Một công cụ ước tính như vậy không tồn tại.

Trực giác là trung vị có thể cố định trong khi chúng ta tự do thay đổi mật độ xác suất xung quanh cả hai mặt của nó, do đó, bất kỳ công cụ ước tính nào có giá trị trung bình là một trung bình cho một phân phối sẽ có trung bình khác nhau cho phân phối bị thay đổi, làm cho nó bị sai lệch. Giải trình sau đây cung cấp một chút nghiêm ngặt hơn cho trực giác này.


Chúng tôi tập trung vào các bản phân phối có trung vị duy nhất , do đó theo định nghĩa và cho tất cả . Khắc phục kích thước mẫu và giả sử rằng ước tính . (Nó sẽ đủ mà chỉ được bao bọc, nhưng thông thường người ta không xem xét nghiêm túc ước lượng sản xuất rõ ràng là giá trị không thể.) Chúng tôi làm không giả định về ; nó thậm chí không phải liên tục ở bất cứ đâu.m F ( m ) 1 / 2 F ( x ) < 1 / 2 x < m n 1 t : [ 0 , 1 ] n[ 0 , 1 ] m t tFmF(m)1/2F(x)<1/2x<mn1t:[0,1]n[0,1]mtt

Ý nghĩa của là thiên (đối với cỡ mẫu cố định này) làt

EF[t(X1,,Xn)]=m

cho bất kỳ mẫu iid với . Một "ước lượng không thiên vị" là một với khách sạn này cho tất cả các ví dụ .t FXiFtF

Giả sử tồn tại một ước lượng không thiên vị. Chúng tôi sẽ rút ra một mâu thuẫn bằng cách áp dụng nó vào một bộ phân phối đặc biệt đơn giản. Xem xét các bản phân phối có các thuộc tính này:F=Fx,y,m,ε

  1. 0x<y1 ;

  2. 0<ε<(yx)/4 ;

  3. x+ε<m<yε ;

  4. Pr(X=x)=Pr(X=y)=(1ε)/2 ;

  5. Pr(mεXm+ε)=ε ; và

  6. [ m - ε , m + ε ]F là đồng nhất trên .[mε,m+ε]

Các phân phối này đặt xác suất tại mỗi và và một lượng nhỏ xác suất được đặt đối xứng quanh giữa và . Làm cho này trung bình độc đáo của . (Nếu bạn lo ngại rằng đây không phải là phân phối liên tục, thì hãy kết hợp nó với một Gaussian rất hẹp và cắt kết quả thành : đối số sẽ không thay đổi.)x y m x y m F [ 0 , 1 ](1ε)/2xymxymF[0,1]

Bây giờ, đối với bất kỳ giả định trung bình ước lượng , ước tính các chương trình dễ dàng mà là đúng phạm mức trung bình của giá trị trong đó thay đổi trên tất cả các kết hợp có thể có của và . Tuy nhiên, chúng ta có thể thay đổi giữa và , một sự thay đổi ít nhất (theo điều kiện 2 và 3). Do đó, tồn tại một và từ đó phân phối tương ứngE [ t ( X 1 , X 2 , ... , X n ) ] ε 2 n t ( x 1 , x 2 , ... , x n ) x i x y m x + ε y - ε ε m F x , y , m , εtE[t(X1,X2,,Xn)]ε2nt(x1,x2,,xn)xixymx+εyεεmFx,y,m,ε, theo đó kỳ vọng này không bằng trung bình, QED.


(+1) Bằng chứng tốt đẹp. Bạn đã đến với nó, hoặc nó là một cái gì đó bạn nhớ từ trường học?
StasK

4
Đây là một bằng chứng khác: Hầu hết các biến ngẫu nhiên Bernoulli có trung vị hoặc . Ước tính từ thử nghiệm chỉ phụ thuộc vào các giá trị trung bình của công cụ ước tính trên các đỉnh của với và trọng số của các giá trị trung bình này là một đa thức tính theo độ . Nếu đây là một ước lượng không thiên vị, nó phải có giá trị trung bình cho bất kỳ , và có hơn giá trị như vậy , vì vậy đa thức này phải được liên tục ... nhưng nó phải là trên giá trị thấp hơn của , vì vậy nó cũng không thể thiên vị ở đó.1 n [ 0 , 1 ] n k p n 1 p > 1 / 2 n + 1 p 0 p01n[0,1]nkpn1p>1/2n+1p0p
Douglas Zare

1
@Doumund Đó là một bằng chứng tuyệt vời. Tuy nhiên, tôi nghi ngờ một số người có thể cảm thấy hơi khó chịu về phạm vi áp dụng của nó, bởi vì trung vị cho biến Bernoulli có phần đặc biệt, trùng khớp với một trong hai điểm hỗ trợ của nó (trừ khi ). Người đọc có thể bị cám dỗ tuyên bố đây là "bệnh hoạn" và cố gắng ngăn chặn những con quái vật đó bằng cách chỉ nhìn vào các bản phân phối liên tục với mật độ tích cực ở khắp mọi nơi trên miền của chúng. Đó là lý do tại sao tôi quan tâm chỉ ra rằng những nỗ lực như vậy sẽ thất bại. p=1/2
whuber

3

Tìm một công cụ ước lượng không thiên vị mà không có mô hình tham số sẽ khó khăn! Nhưng bạn có thể sử dụng bootstrapping và sử dụng nó để điều chỉnh trung vị theo kinh nghiệm để có được một ước lượng không thiên vị.


Nếu điều này là không thể, liệu có thể chứng minh nó? Ví dụ: nếu là các mẫu độc lập với thì người ta có thể chứng minh rằng không thể thiên vị cho bất kỳ lựa chọn nào của không? X f ( X 1 , Rời , X n ) fX1,X2,,XnXf(X1,,Xn)f
robinson

2
Tôi nghĩ rằng kjetil đang nói rằng trong một khuôn khổ không tham số không có phương pháp nào sẽ đưa ra ước tính không thiên vị cho mọi phân phối có thể. Nhưng trong khung tham số có lẽ bạn có thể. Bootstrapping một ước tính mẫu thiên vị có thể cho phép bạn ước tính độ lệch và điều chỉnh nó để có được ước tính bootstrap gần như không thiên vị. Đó là đề nghị của anh ấy để xử lý vấn đề trong khuôn khổ không tham số. Chứng minh rằng một ước tính không thiên vị là không thể cũng sẽ khó khăn.
Michael R. Chernick

2
Nếu bạn thực sự muốn chứng minh rằng không tồn tại một công cụ ước lượng không thiên vị, thì có một cuốn sách, "Số liệu thống kê toán học - Phương pháp lý thuyết quyết định" có một số ví dụ về loại điều đó!
kjetil b halvorsen

Tôi tưởng tượng rằng các điều kiện đều đặn cho bootstrap sẽ bị vi phạm với các hàm phân phối mà whuber xem xét trong câu trả lời của mình. Michael, bạn có thể bình luận?
StasK

2
@Stas Như tôi đã chỉ ra, các chức năng của tôi có thể được thực hiện để trông rất "đẹp" bằng cách làm dịu chúng. Chúng cũng có thể được khái quát hóa để làm nhuyễn các hỗn hợp hữu hạn lớn của các nguyên tử. Lớp phân phối như vậy dày đặc trong tất cả các phân phối trên khoảng thời gian đơn vị, vì vậy tôi không nghĩ rằng tính thường xuyên của bootstrap sẽ được tham gia ở đây.
whuber

0

Tôi tin rằng hồi quy lượng tử sẽ cung cấp cho bạn một ước lượng phù hợp của trung vị. Cho mô hình . Và bạn muốn ước tính vì là hằng số. Tất cả những gì bạn cần là , điều này đúng với điều kiện bạn có các trận hòa độc lập. Tuy nhiên, theo như sự thiên vị, tôi không biết. Trung bình là khó khăn.med ( y ) = med ( α + u ) = α + med ( u ) α med ( u ) = 0Y=α+umed(y)=med(α+u)=α+med(u)αmed(u)=0


Xem câu trả lời của @whuber
Peter Flom - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.