Làm thế nào để chỉ ra rằng một thống kê đủ là KHÔNG đủ tối thiểu?


8

Vấn đề bài tập về nhà của tôi là đưa ra một ví dụ trong đó một thống kê nhất định không nói chung là đủ tối thiểu. Bất kể các chi tiết tìm kiếm một ví dụ cụ thể cho thống kê cụ thể này, điều này đặt ra câu hỏi sau đây cho tôi:

Câu hỏi: Làm thế nào người ta có thể xây dựng điều kiện không phải là một thống kê đủ tối thiểu theo cách có thể chứng minh rằng một thống kê đủ thỏa mãn điều kiện này?

Làm việc cho đến nay: Định nghĩa về thống kê đủ tối thiểu trong sách giáo khoa của tôi (Keener, Thống kê lý thuyết: Chủ đề cho một khóa học cốt lõi ) như sau:

  • Một thống kê TT là tối thiểu đủ khi và chỉ khi TT là đủ và cho mọi số liệu thống kê đầy đủ ~ TT~ có tồn tại một hàm ff như vậy T = f ( ~ T )T=f(T~) ae PP .

Lưu ý rằng (ae PP ) có nghĩa rằng các thiết lập nơi bình đẳng không là một tập hợp null cho mỗi phân bố xác suất PP trong mô hình thống kê PP , P PPP .

Cố gắng phủ nhận điều này, tôi đến:

  • Một thống kê TTkhông tối thiểu đủ khi và chỉ khi ở một thiểu những điều sau đây giữ:
    1. TT là không đủ.
    2. Có tồn tại ít nhất một thống kê đủ ~ TT~ mà có không chức năng ff như vậy T = f ( ~ T )T=f(T~) ae PP .

Vì vậy, nếu một thống kê đủ, thì có vẻ như sẽ cực kỳ khó khăn để chỉ ra rằng nó không đủ tối thiểu, ngay cả khi nó không đủ tối thiểu. (Bởi vì người ta sẽ phải hiển thị 2. thay vì 1., vì 1. là sai - nhưng 2. sẽ rất khó khăn để hiển thị bởi vì, ngay cả khi người ta có một thống kê phản ví dụ ~ T trong tâm trí, chúng ta vẫn có để hiển thị không tồn tại của bất kỳ chức năng nào với tài sản đó. Và không tồn tại thường khó hiển thị.)T~

Sách giáo khoa của tôi không đưa ra bất kỳ điều kiện tương đương (nghĩa là cần đủ) cho một thống kê là một thống kê đủ tối thiểu. Nó thậm chí không đưa ra bất kỳ điều kiện cần thiết thay thế nào cho một thống kê là thống kê đủ tối thiểu (bên cạnh đó là một thống kê đầy đủ).

Do đó, đối với vấn đề bài tập về nhà của tôi, nếu tôi không thể chỉ ra rằng số liệu thống kê là không đủ (vì nó là vậy), thì làm sao tôi có thể chứng minh rằng nó không đủ tối thiểu?


3
Bạn đã xem xét bắt đầu với một thống kê đủ tối thiểu và sau đó mở rộng nó để bao gồm nhiều thành phần hơn?
whuber

3
Trong toán học nói chung, người ta thường chứng minh sự không tồn tại của một cái gì đó bằng cách giả sử nó tồn tại và sử dụng nó để tìm một sự co lại.
Kodiologist

2
Thống kê là một hàm có giá trị véc tơ của dữ liệu. Nó có các thành phần. Ví dụ, một thống kê đủ tối thiểu cho họ phân phối Bình thường là hai vectơ bao gồm giá trị trung bình mẫu và phương sai mẫu. Liền kề nhiều thành phần - ví dụ, ném vào độ lệch và kurtosis mẫu - cung cấp cho bạn một thống kê với bốn thành phần. Gợi ý của tôi chỉ nêu lên điều hiển nhiên: thống kê mới này rõ ràng là đủ, bởi vì hai thành phần đầu tiên của nó đã đủ. Nhưng nó có đủ tối thiểu không?
whuber

2
Tôi không thấy bất kỳ quan sát nào trong số những quan sát về đồ trang sức hoặc sự đồng nhất có thể có liên quan. Bạn đang sử dụng một số định nghĩa bất thường về "thống kê" hoặc "đủ"?
whuber

3
Bạn dường như đang sử dụng một số loại định nghĩa độc đáo về sự đầy đủ. Trong ví dụ của tôi, tất cả những gì quan trọng là số liệu thống kê mới là số liệu thống kê chính hãng - chức năng có thể đo lường được của dữ liệu. Bản đồ từ R 4 đến R 2 (lấy ra hai số liệu thống kê ban đầu, số liệu thống kê đủ tối thiểu) có thể đo được (thực sự, có thể phân biệt được). Đó là tất cả những gì bạn phải kiểm tra. R4R2
whuber

Câu trả lời:


1

Như bạn đã nói:

Nếu có tồn tại x 1 , x 2 Xx1,x2X sao cho f ( x 1 ) = f ( x 2 )f(x1)=f(x2) nhưng g ( x 1 ) g ( x 2 )g(x1)g(x2) , sau đó gg không thể được viết như một hàm của ff , tức là có tồn tại không có chức năng hh với g = h fg=hf .

Vì vậy, ví dụ, trong trường hợp X 1 , . . . . , X nX1, . . . . , Xn là các biến ngẫu nhiên Bernoulli độc lập. Chúng ta có thể chứng minh rằng ( x 1 , . . . . , X n )( x1, . . . . , xn) không phải là tối thiểu đủ bằng cách hiển thị rằng nó không phải là một chức năng của Σ x iΣ xTôi . Điều này là hiển nhiên, vì hàm phải ánh xạ 11 đến cả hai ( 1 , 0 , 0 ... , 0 , 0 , 0 )(1,0,0...,0,0,0)( 0 , 0 , 0 ... , 0 , 0 , 1 )(0,0,0...,0,0,1) .


2

Tôi đã suy nghĩ về vấn đề này gần đây hơn, và đây là những gì tôi đã đưa ra.

Hãy Ω là một không gian xác suất, sau đó là một biến ngẫu nhiên X là một hàm đo được X : Ω X , nơi X là một không gian đo ( X có một định σ -algebra, và X có thể đo lường đối với này với σ -algebra và σ -algebra trên Ω ). Các phân phối của X chỉ là biện pháp pullback trên X , tức là P X ( Một ) = P Ω ( X -Ω XX:ΩXXXσXσσΩXX1 (A)). Khi đó, mộtthống kêcủaXlà bất kỳ hàm * có thể đo lường nàof: X Y , trong đó Y là một không gian đo lường tùy ý khác.PX(A)=PΩ(X1(A))Xf:XYY

Cho hai số liệu thống kê f : XY , g : XZ , " g là hàm của f " nghĩa là gì?f:XYg:XZgf

Theo như tôi có thể nói, dường như có nghĩa là tồn tại hàm ** có thể đo được h : YZ sao cho g = h f , tức là g có thể được tính bởi f .h:YZg=hfgf

(Nói cách khác, " g phải được xác định rõ là một hàm trên f ( X ) Y ".)gf(X)Y

Vậy khi nào thì bao thanh toán như vậy có thể? Chúng ta hãy nghĩ về các mối quan hệ tương đương. Cụ thể, xác định mối quan hệ tương đương ~ f trên X bằng x 1 ~ f x 2fXf ( x 1 ) = f ( x 2 ) , tương tự như vậy, xác định mối quan hệ tương đương ~ g trên X bằng x 1 ~ g x 2x1fx2f(x1)=f(x2)gXg ( x 1 ) = g ( x 2 ) .x1gx2g(x1)=g(x2)

Sau đó, để cho g là factorable bởi f , các mối quan hệ tương đương ~ f~ g cần phải tương thích với nhau, theo nghĩa *** rằng đối với bất kỳ x 1 , x 2X , x 1 ~ f x 2gffgx1,x2Xx 1 ~ g x 2 , tức là g không thể mất hai yếu tố đó là tương đương trực thuộc f và bản đồ chúng đến các giá trị mà không phải là tương đương dưới g , tức là " g không thể hoàn tác giảm thông tin trước đây được thực hiện bởi f ".x1fx2x1gx2gfggf

Nói cách khác, g phải được xác định rõ là một hàm trên X / ~ ff ( X ) , tức là có tồn tại đã tồn tại một hàm ~ g : X / ~ fZg = ~ gpi f , nơi π f là kinh điển chiếu XX / ~ f . (Đối với những người không thoải mái với ý nghĩa trừu tượng, π f thực chất là fgX/ff(X)g~:X/fZg=g~πfπfXX/fπff~ G chất làh. Công thức trên chỉ làm cho sự tương tự với các tình huống khác rõ ràng hơn.)g~h

Nói một cách đơn giản nhất có thể, g có thể được viết như chức năng của f khi và chỉ khi, đối với bất kỳ x 1 , x 2X , f ( x 1 ) = f ( x 2 )gfx1,x2Xg ( x 1 ) = g ( x 2 ) .f(x1)=f(x2)g(x1)=g(x2)

Ví dụ: lấy X = Y = Z = RX một biến ngẫu nhiên có giá trị thực tùy ý, thì g : x x 2 có thể được viết dưới dạng hàm của f : x x , nhưng không phải ngược lại, vì x 1 = x 2X=Y=Z=RXg:xx2f:xxx 2 1 = x 2 2 , nhưng 1 2 = ( - 1 ) 2 nhưng 1 - 1 .x1=x2x21=x2212=(1)211

Cụ thể, giả sử rằng mọi lớp tương đương dưới f là một singleton (tức là ftiêm ). Sau đó g luôn có thể được viết như một hàm của f , vì X / ~ fX , tức là f ( x 1 ) = f ( x 2 )ffgfX/fXx 1 = x 2 có nghĩa là x 1 = x 2f(x1)=f(x2)x1=x2f ( x 1 ) = f ( x 2 ) (nói chung, vì không nhất thiết phải tiêm f , chỉ giữ một hướng), vì vậy điều kiện của chúng tôi trở thành x 1 = x 2x1=x2f(x1)=f(x2)fg ( x 1 ) = g ( x 2 ) , được trivially hài lòng chobất kỳ g : XZ . (Để xác định h , nó có thể làm bất cứ điều gì nó muốn trên Yf ( X ) miễn là có thể đo được, và sau đó với bất kỳ y f ( X ) nào , tức là y = f ( x ) cho một số x X , định nghĩa h hx1=x2g(x1)=g(x2) g:XZhYf(X)yf(X)y=f(x)xXh: Y = f ( x ) g ( x ) . Điều này được xác định rõ khi f được tiêm bởi vì có một x X duy nhấtsao cho f ( x ) = y . Tổng quát hơn, điều này chỉ được xác định khi, bất kể x chúng ta chọn trong f - 1 ( y ) , g ( x ) vẫn có cùng giá trị, tức là f ( x 1 ) = fh:y=f(x)g(x)f xXf(x)=yxf1(y)g(x)( x 2 ) ( = y ) g ( x 1 ) = g ( x 2 ) .)f(x1)=f(x2) (=y)g(x1)=g(x2)

Ngoài ra, nhìn vào Định lý 3.11 trong Keener, tuyên bố của nó là loại khó hiểu, nhưng suy nghĩ theo các thuật ngữ trên, tôi tin rằng nó có thể được viết lại như sau:

Giả sử T là một thống kê đầy đủ ****. Sau đó, một điều kiện đủ để T đủ tối thiểu là nó có thể được viết dưới dạng hàm của tỷ lệ khả năng.TT

Từ đó, rõ ràng là tỷ lệ khả năng phải tự nó đủ nhỏ.

Điều này cũng dẫn đến kết luận rằng:

Nếu có tồn tại x 1 , x 2X sao cho f ( x 1 ) = f ( x 2 ) nhưng g ( x 1 ) g ( x 2 ) , sau đó g có thể không được viết như một hàm của f , tức là có tồn tại không có chức năng h với g = h f .x1,x2Xf(x1)=f(x2)g(x1)g(x2)gfhg=hf

Do đó, điều kiện không thực sự khó hiển thị như tôi đã nghĩ.


* Keener không giải quyết vấn đề liệu một thống kê có cần phải đo lường được hay chỉ là một chức năng tùy ý hay không. Tuy nhiên, tôi khá chắc chắn rằng một thống kê được một chức năng đo lường được, bởi vì nếu không chúng tôi không thể xác định một phân phối cho nó , tức là một biện pháp pullback.

** Nếu h không đo được, chúng ta sẽ có mâu thuẫn vì cả fg đều có thể đo được và thành phần của các hàm đo được lại có thể đo được. Ít nhất, h phải được đo lường được giới hạn f ( X ) Y , mặc dù tôi nghĩ rằng điều này sẽ có nghĩa là trong hầu hết các trường hợp hợp lý rằng h sẽ phải đồng ý về f ( X ) với một chức năng mà có thể đo lường trên tất cả các Y (lấy h | f ( X ) trên f ( X )hfghf(X)Yhf(X)Yh|f(X)f(X)và ví dụ z trên Y f ( X ) nếu tồn tại điểm có thể đo được z Z , lưu ý rằng cả f ( X )Y f ( X ) nên có thể đo được trong Y ) để wlog h có thể được coi là có thể đo được tất cả các Y .zYf(X)zZf(X)Yf(X)YhY

*** Ít nhất điều này là cần thiết và đủ cho sự tồn tại của một hàm bao hàm tùy ý qua g và trên f , và tôi nghĩ ** ngụ ý rằng nếu một hàm tùy ý như vậy tồn tại, thì hàm này cũng phải đo được, vì cả fg là, tức là nó thực sự sẽ là một thống kê YZ .gffgYZ

**** Điều kiện đưa ra tương đương với T là đủ theo định lý nhân tố, 3.6.T


1
Làm thế nào để bạn xác định tỷ lệ khả năng?
Tây An

@ Xi'an Tôi thực sự không nhớ tất cả những thứ ngu ngốc mà tôi đã viết ở trên, vì vậy thành thật mà nói tôi không chắc bạn đang đề cập đến phần nào. Nếu bạn đang ngầm gợi ý rằng trước tiên tôi chứng minh rằng thống kê tỷ lệ khả năng là đủ tối thiểu, và sau đó giảm bất kỳ bằng chứng nào khác về mức độ tối thiểu để "tương đương đủ" phù hợp với thống kê tỷ lệ khả năng, có lẽ là hữu ích trong thực tế, nhưng ít nhất là về mặt lý thuyết dường như chỉ đá cái
lon
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.