Trực giác đằng sau việc xác định tính đầy đủ trong một thống kê là không thể tạo thành một công cụ ước lượng không thiên vị từ ?


21

Trong thống kê cổ điển, có một định nghĩa rằng thống kê của một tập hợp dữ liệu được xác định là hoàn chỉnh cho một tham số không thể tạo thành một công cụ ước lượng không thiên vị từ từ đó. Đó là, cách duy nhất để có cho tất cả là có là gần như chắc chắn.Ty1,,ynθ0Eh(T(y))=0θh0

Có một trực giác đằng sau này? Có vẻ như là một cách khá cơ học để xác định điều này, tôi biết điều này đã được hỏi trước đây, nhưng tự hỏi liệu có một trực giác rất dễ hiểu sẽ khiến sinh viên nhập môn có thể dễ dàng tiêu hóa tài liệu hơn.


2
Đó là một câu hỏi rất hay, tôi đã phải tự đào sâu vào nó. Nó chỉ ra rằng lý do nó là một định nghĩa cơ học và không có ý nghĩa trực giác đối với một người thực hành tiêu chuẩn như tôi là nó chủ yếu được sử dụng để chứng minh những đóng góp cơ bản trong thống kê toán học. Cụ thể, tìm kiếm ngắn của tôi cho thấy định lý Lehmann-Scheffé và định lý của Basu đòi hỏi phải hoàn thành một thống kê để giữ vững. Đây là những đóng góp của giữa những năm 1950. Tôi không thể cung cấp cho bạn một lời giải thích trực quan - nhưng nếu bạn thực sự muốn xây dựng nó, có thể là cộng sự bằng chứng
Jeremias K

Câu trả lời:


18

Tôi sẽ cố gắng để thêm vào câu trả lời khác. Đầu tiên, tính đầy đủ là một điều kiện kỹ thuật chủ yếu được chứng minh bằng các định lý sử dụng nó. Vì vậy, chúng ta hãy bắt đầu với một số khái niệm và định lý liên quan nơi chúng xảy ra.

Đặt đại diện cho một vectơ dữ liệu iid, mà chúng ta mô hình là có phân phối trong đó tham số điều khiển dữ liệu là không xác định. là đủ nếu phân phối có điều kiện của không phụ thuộc vào tham số . là phụ trợ nếu phân phối của không phụ thuộc vào (trong gia đình ). là một công cụ ước lượng không thiên vị bằng 0 nếu kỳ vọng của nó bằng 0, không phân biệtX=(X1,X2,,Xn)f(x;θ),θΘθT=T(X)X T θ V = V ( X ) V θ f ( x ; θ ) U = U ( X )XTθV=V(X)Vθf(x;θ)U=U(X)θS = S ( X . là một thống kê hoàn chỉnh nếu bất kỳ công cụ ước tính không thiên vị nào của 0 dựa trên đều bằng 0, nghĩa là, nếu sau đó ae (cho tất cả ).S=S(X)S E g ( S ) = 0 ( cho tất cả  θ ) g ( S ) = 0 θSEg(S)=0(for all θ)g(S)=0θ

Bây giờ, giả sử bạn có hai công cụ ước tính không thiên vị khác nhau của dựa trên thống kê đủ , . Đó là, trong các ký hiệu và (cho tất cả ). Khi đó là một công cụ ước tính không thiên vị của số 0, không bằng 0, chứng tỏ rằng chưa hoàn thành. Vì vậy, tính đầy đủ của một thống kê đủ cho chúng ta rằng chỉ tồn tại một công cụ ước lượng duy nhất không thiên vị của dựa trênθTg1(T),g2(T)

Eg1(T)=θ,Eg2(T)=θ
P(g1(T)g2(T))>0θg1(T)g2(T)TTθT. Điều đó đã rất gần với định lý Lehmann Nhận Scheffé.

Chúng ta hãy xem xét một số ví dụ. Giả sử bây giờ là đồng phục iid trên khoảng . Chúng ta có thể chỉ ra rằng ( là thống kê đơn hàng) cặp là đủ, nhưng nó chưa hoàn thành, vì sự khác biệt là phụ trợ, chúng ta có thể tính toán kỳ vọng của nó, hãy để nó là (chỉ là hàm của ), và sau đóX1,,Xn(θ,θ+1)X(1)<X(2)<<X(n)(X(1),X(n))X(n)X(1)cn- cX(n)X(1)csẽ là một công cụ ước lượng không thiên vị của số 0 mà không bằng 0. Vì vậy, thống kê đầy đủ của chúng tôi, trong trường hợp này, không đầy đủ và đủ. Và chúng ta có thể thấy điều đó có nghĩa là gì: tồn tại các chức năng của thống kê đầy đủ không có thông tin về (trong bối cảnh của mô hình). Điều này không thể xảy ra với một thống kê đầy đủ; theo nghĩa tối đa là thông tin, trong đó không có chức năng nào của nó là không chính xác. Mặt khác, nếu có một số chức năng của thống kê đủ tối thiểu có kỳ vọng bằng 0, thì đó có thể được coi là một thuật ngữ tiếng ồn , các thuật ngữ nhiễu / nhiễu trong các mô hình có kỳ vọng bằng không. Vì vậy, chúng ta có thể nói rằng số liệu thống kê chưa đầy đủ có chứa một số nhiễu .θ

Nhìn lại phạm vi trong ví dụ này. Vì phân phối của nó không phụ thuộc vào , nên bản thân nó không chứa bất kỳ thông tin nào về . Nhưng, cùng với số liệu thống kê đầy đủ, nó làm! Làm sao? Nhìn vào trường hợp được quan sát. Sau đó, trong bối cảnh mô hình (được biết là đúng) của chúng tôi, chúng tôi có kiến ​​thức hoàn hảo về ! Cụ thể, chúng ta có thể nói chắc chắn rằng . Bạn có thể kiểm tra xem có bất kỳ giá trị nào khác cho sau đó dẫn đến hoặcR=X(n)X(1)θθ R = 1 θ θ = X ( 1 ) θ X ( 1 ) X ( n )θR=1θθ=X(1)θX(1)X(n)là một quan sát không thể, theo mô hình giả định. Mặt khác, nếu chúng ta quan sát , thì phạm vi của các giá trị có thể có cho là khá lớn (bài tập ...). R=0.1θ

Theo nghĩa này, thống kê phụ trợ có chứa một số thông tin về độ chính xác mà chúng tôi có thể ước tính dựa trên dữ liệu và mô hình này. Trong ví dụ này và các ví dụ khác, thống kê phụ trợ "đảm nhận vai trò của cỡ mẫu". Thông thường, khoảng tin cậy và như vậy cần cỡ mẫu , nhưng trong ví dụ này, chúng ta có thể tạo khoảng tin cậy có điều kiện, nó chỉ được tính bằng , không phải (bài tập.) Đây là một ý tưởng của Fisher, nên suy luận có điều kiện một số thống kê phụ trợ.RθRnRn

Bây giờ, định lý của Basu: Nếu hoàn thành đủ, thì nó độc lập với bất kỳ thống kê phụ trợ nào. Đó là, suy luận dựa trên một thống kê đầy đủ đầy đủ là đơn giản hơn, trong đó chúng ta không cần phải xem xét suy luận có điều kiện. Tất nhiên, điều hòa trên một thống kê độc lập với không thay đổi bất cứ điều gì.TT

Sau đó, một ví dụ cuối cùng để đưa ra một số trực giác hơn. Thay đổi ví dụ phân phối đồng đều của chúng tôi thành phân phối đồng đều trong khoảng thời gian (với ). Trong trường hợp này, thống kê đầy đủ và đầy đủ. Những gì đã thay đổi? Chúng ta có thể thấy rằng tính đầy đủ thực sự là một tài sản của mô hình . Trong trường hợp trước, chúng ta có một không gian tham số bị hạn chế. Hạn chế này đã phá hủy tính hoàn chỉnh bằng cách giới thiệu các mối quan hệ trên số liệu thống kê đơn hàng. Bằng cách loại bỏ hạn chế này, chúng tôi đã hoàn thành! Vì vậy, theo một nghĩa nào đó, thiếu tính đầy đủ có nghĩa là không gian tham số không đủ lớn và bằng cách mở rộng nó, chúng ta có thể hy vọng khôi phục tính đầy đủ (và do đó, suy luận dễ dàng hơn).(θ1,θ2)θ1<θ2(X(1),X(n))

Một số ví dụ khác khi thiếu tính đầy đủ là do các hạn chế về không gian tham số,

  • xem câu trả lời của tôi về: loại thông tin nào là thông tin của Fisher?

  • Đặt là iid (mô hình quy mô vị trí). Sau đó, thống kê đơn hàng đầy đủ nhưng không đầy đủ. Nhưng bây giờ mở rộng mô hình này thành một mô hình hoàn toàn không tham số, vẫn còn nhưng từ một số phân phối hoàn toàn không xác định . Sau đó, số liệu thống kê đơn hàng là đủ và đầy đủ. X1,Giáo dục,XnCmộtbạnchy(θ,σ)F

  • Đối với các gia đình hàm mũ có không gian tham số chính tắc (nghĩa là càng lớn càng tốt), thống kê đủ tối thiểu cũng hoàn tất. Nhưng trong nhiều trường hợp, đưa ra các hạn chế về không gian tham số, như với các họ hàm mũ cong , phá hủy tính hoàn chỉnh.

Một bài viết rất phù hợp là Giải thích về sự hoàn thiện và Định lý của Basu.


7

Một số trực giác có thể có sẵn từ lý thuyết của các ước lượng không thiên vị tốt nhất (phương sai tối thiểu).

Nếu thì là công cụ ước tính không thiên vị tốt nhất của iff không tương thích với tất cả các công cụ ước tính không thiên vị bằng không.W τ ( θ ) WEθW= =τ(θ)Wτ(θ)W

Chứng minh : Đặt là một công cụ ước tính không thiên vị không tương quan với tất cả các công cụ ước tính không thiên vị bằng không. Đặt là một công cụ ước tính khác sao cho . Viết . Theo giả định, . Do đó, đối với bất kỳ .W ' E θ W ' = E θ W = τ ( θ ) W ' = W + ( W ' - W ) V một r θ WWW'EθW'= =EθW= =τ(θ)W'= =W+(W'-W)W 'VmộtrθW'= =VmộtrθW+Vmộtrθ(W'-W)W'VmộtrθW'VmộtrθW

Bây giờ giả sử rằng là một công cụ ước tính không thiên vị tốt nhất. Để có một số ước tính với . cũng không thiên vị cho . Chúng tôi có Nếu có một sao cho , chúng tôi sẽ nhận được cho . sau đó có thể không phải là công cụ ước tính không thiên vị tốt nhất. QEDU E θ U = 0 φ một : = W + một U τ ( θ ) V một r θ φ một : = V một r θWBạnEθBạn= =0φmột: =W+mộtBạnτ(θ)θ 0q C o v θ

Varθϕa:=VarθW+2aCovθ(W,U)+a2VarθU.
θ0ΘVmộtrθφmột<VmộtrθWmột(0,-2Cov θ 0 (W,U)/Vmộtr θ 0 U)WCovθ0(W,U)<0Varθϕa<VarθWa(0,2Covθ0(W,U)/Varθ0U)W

Theo trực giác, kết quả nói rằng nếu một công cụ ước tính là tối ưu, thì không thể cải thiện nó bằng cách thêm một chút nhiễu vào nó, theo nghĩa là kết hợp nó với một công cụ ước tính trung bình chỉ bằng 0 (là một công cụ ước lượng không thiên vị bằng không ).

Thật không may, rất khó để mô tả tất cả các ước lượng không thiên vị bằng không. Tình huống trở nên đơn giản hơn nhiều nếu bản thân zero là công cụ ước lượng không thiên vị duy nhất bằng 0, vì bất kỳ thống kê nào thỏa mãn . Hoàn thành mô tả một tình huống như vậy.C o v θ ( W , 0 ) = 0WCovθ(W,0)=0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.