Ước tính tham số của một phân phối thống nhất: không đúng trước?


10

Chúng tôi có N mẫu, , từ phân phối đồng đều trong đó không xác định. Ước tính từ dữ liệu.Xi[0,θ]θθ

Vì vậy, quy tắc của Bayes ...

f(θ|Xi)=f(Xi|θ)f(θ)f(Xi)

và khả năng là:

0Xiθif(Xi|θ)=i=1N1θ (chỉnh sửa: khi cho tất cả và 0 khác - cảm ơn người bán hàng)0Xiθi

nhưng không có thông tin nào khác về , có vẻ như phần trước phải tỷ lệ với (tức là đồng phục) hoặc (Jeffreys trước?) trên nhưng sau đó các tích phân của tôi không không hội tụ và tôi không biết phải tiến hành như thế nào. Có ý kiến ​​gì không?θ11L[0,]


2
Khả năng của bạn là không chính xác: nó sẽ bằng 0 bất cứ khi nào nhỏ hơn lớn nhất . X tôiθXi
whuber

Bạn có thể hiển thị những gì tích hợp bạn đang dùng?

Phải, vì vậy, tôi đoán tôi chỉ không biết làm thế nào để đối phó với những điều không đúng trước đó. Ví dụ: tôi muốn viếtf[Xi]=Θf(Xi|θ)f(θ)dθ
Sẽ

1
Đối với trước không đúng, = = và đối với bạn tương tự có đượcVì gần như chắc chắn, nên chắc chắn các tích phân sẽ hội tụ. f[Xi]=Θf(Xi|θ)f(θ)dθmax(Xi)θNdθmax(Xi)1N/(N1)f(θ)1/θmax(Xi)N/N.maxXi>0
whuber

1
Các hậu thế tham chiếu Bernardo là Pareto - xem danh mục của các linh mục không thông tin .
Stéphane Laurent

Câu trả lời:


4

Điều này đã tạo ra một số cuộc tranh luận thú vị, nhưng lưu ý rằng nó thực sự không tạo ra nhiều khác biệt cho câu hỏi quan tâm. Cá nhân tôi nghĩ rằng vì là một tham số tỷ lệ, nên đối số nhóm biến đổi là phù hợp, dẫn đến trướcθ

p(θ|I)=θ1log(UL)θ1L<θ<U

Phân phối này có dạng tương tự dưới sự thay đổi kích thước của vấn đề (khả năng cũng vẫn là "bất biến" khi thay đổi kích thước). Hạt nhân trước này, có thể được suy ra bằng cách giải phương trình hàm . Các giá trị phụ thuộc vào vấn đề và thực sự chỉ quan trọng nếu kích thước mẫu rất nhỏ (như 1 hoặc 2). Các hậu thế là một pareto cắt ngắn, được đưa ra bởi:f(y)=y1af(ay)=f(y)L,U

p(θ|DI)=NθN1(L)NUNL<θ<UwhereL=max(L,X(N))
Trong đó là Nth thống kê thứ tự, hoặc giá trị tối đa của mẫu. Chúng ta lấy trung bình sau của Nếu chúng ta đặt và , chúng ta sẽ có được mức giảm áp đơn giản hơn .X(N)
E(θ|DI)=N((L)1NU1N)(N1)((L)NUN)=NN1L(1[LU]N11[LU]N)
UL0E(θ|DI)=NN1X(N)

Nhưng bây giờ, giả sử chúng ta sử dụng một tổng quát hơn trước, được đưa ra bởi (lưu ý rằng chúng tôi giữ các giới hạn để đảm bảo mọi thứ đều đúng - sau đó không có toán học số ít ). Các hậu thế sau đó giống như trên, nhưng với thay thế bằng - với điều kiện . Lặp lại các tính toán trên, chúng tôi có nghĩa là đơn giản hóa saup(θ|cI)θc1L,UNc+Nc+N0

E(θ|DI)=N+cN+c1X(N)

Vì vậy, đồng phục trước ( ) sẽ đưa ra ước tính với điều kiện (có nghĩa là vô hạn đối với ). Điều này cho thấy cuộc tranh luận ở đây hơi giống với việc nên sử dụng hay làm ước số trong ước tính phương sai.c=1N1N2X(N)N2N=2NN1

Một lập luận chống lại việc sử dụng đồng phục không phù hợp trước đó trong trường hợp này là hậu thế không phù hợp khi , vì nó tỷ lệ thuận với . Nhưng điều này chỉ quan trọng nếu hoặc rất nhỏ.N=1θ1N=1


1

Vì mục đích ở đây có lẽ là để có được một số ước tính hợp lệ và hữu ích của , nên phân phối trước phải phù hợp với đặc điểm phân bố dân số mà mẫu xuất phát. Điều này KHÔNG theo bất kỳ cách nào có nghĩa là chúng tôi "tính toán" việc sử dụng mẫu trước đó - điều này sẽ vô hiệu hóa tính hợp lệ của toàn bộ quy trình. Chúng tôi biết rằng dân số mà mẫu xuất phát là một quần thể gồm các biến ngẫu nhiên thống nhất iid mỗi biến trong . Đây là một giả định được duy trì và là một phần của thông tin trước đó mà chúng tôi có (và nó không liên quan gì đến mẫu , tức là với việc thực hiện cụ thể một tập hợp con của các biến ngẫu nhiên này).θ[0,θ]

Bây giờ giả sử rằng dân số này bao gồm biến ngẫu nhiên, (trong khi mẫu của chúng tôi bao gồm hiện thực hóa biến ngẫu nhiên). Giả định được duy trì cho chúng ta biết rằng mn<mn

maxi=1,...,n{Xi}maxj=1,...,m{Xj}θ

Biểu thị cho sự gọn nhẹ . Sau đó, chúng ta có cũng có thể được viết maxi=1,...,n{Xi}XθX

θ=cXc1

Hàm mật độ của của iid Đồng phục rv nằm trong là maxN[0,θ]

fX(x)=N(x)N1θN

cho hỗ trợ và 0 ở nơi khác. Sau đó, bằng cách sử dụng và áp dụng công thức thay đổi biến, chúng tôi có được phân phối trước cho phù hợp với giả định được duy trì: [0,θ]θ=cXθ

fp(θ)=N(θc)N1θN1c=NcNθ1θ[x,]

có thể không phù hợp nếu chúng ta không chỉ định hằng số phù hợp. Nhưng mối quan tâm của chúng tôi nằm ở việc có một hậu thế thích hợp cho , và đồng thời, chúng tôi không muốn hạn chế các giá trị có thể có của (ngoài giới hạn được ngụ ý bởi giả định được duy trì). Vì vậy, chúng tôi để lại không xác định. Sau đó viết phía sau làcθθc
X={x1,..,xn}

f(θX)θNNcNθ1f(θX)=ANcNθ(N+1)

đối với một số hằng số chuẩn hóa A. Chúng tôi muốn

Sθf(θX)dθ=1xANcNθ(N+1)dθ=1

ANcN1NθN|x=1A=(cx)N

Chèn vào sau

f(θX)=(cx)NNcNθ(N+1)=N(x)Nθ(N+1)

Lưu ý rằng hằng số không xác định của phân phối trước đã hủy bỏ một cách thuận tiện.c

Hậu thế tóm tắt tất cả thông tin mà mẫu cụ thể có thể cung cấp cho chúng tôi về giá trị của . Nếu chúng ta muốn có được một giá trị cụ thể cho chúng ta có thể dễ dàng tính giá trị mong đợi của hậu thế, θθ

E(θX)=xθN(x)Nθ(N+1)dθ=NN1(x)NθN+1|x=NN1x

Có trực giác nào trong kết quả này không? Chà, khi số lượng tăng lên, nhiều khả năng là nhận thức tối đa trong số chúng sẽ càng ngày càng gần với giới hạn trên của chúng, - đó chính xác là giá trị trung bình sau của phản ánh: nếu, nói , , nhưng nếu . Điều này cho thấy chiến thuật của chúng tôi về việc lựa chọn trước là hợp lýphù hợp với vấn đề hiện tại, nhưng không nhất thiết là "tối ưu" theo một nghĩa nào đó.XθθN=2E(θX)=2xN=10E(θX)=109x


1
Căn cứ trước các dữ liệu nghe có vẻ tanh với tôi. Làm thế nào để bạn biện minh cho phương pháp này?
whuber

2
Tôi không có gì chống lại thực tế rằng trước đó của bạn không phải là "tốt nhất". Tôi đã nói điều gì như thế ở đâu? Tôi chỉ đang cố gắng để hiểu cách tiếp cận của bạn. Tôi chưa hiểu sự bình đẳng này. Nếu không đổi trong đẳng thức , điều đó có nghĩa là cả và đều không hợp lệ? Bằng cách này, bạn không sử dụng thực tế là trong đạo hàm trước, phải không? (cc @whuber)cθ=cXXθc1
Stéphane Laurent

1
Và sự hỗ trợ của bạn trước phụ thuộc vào dữ liệu? ( )θ[x,[
Stéphane Laurent

3
Tùy thuộc trước (ngay cả khi điều này chỉ thông qua hỗ trợ) trên dữ liệu nghe có vẻ sai: bạn không thể biết tối đa của mẫu trước khi mẫu được tạo . Hơn nữa, bạn cho rằng là một đẳng thức gần như chắc chắn, với cả và ngẫu nhiên (do đó có tương quan ). Nhưng điều này ngụ ý rằng phân phối sau của (là phân phối có điều kiện của cho mẫu) là khối Dirac tại . Và điều này mâu thuẫn với sự phát sinh của bạn về phân phối sau. ... (Không còn ký tự nào nữa ...)θ=cXθX1θθcx
Stéphane Laurent

1
Phân phối sau của là Dirac tại có nghĩa là . Định lý Bayes không phải là nguyên nhân. Bạn phá hủy mọi thứ bằng cách giả sử . Điều này hàm ý , do đó phân phối có điều kiện của cho là khối Dirac tại , trong khi giả định ban đầu là phân phối này là phân phối đồng đều trên . θcxθ cxθ=cXX=θ/cXθθ/c(0,θ)
Stéphane Laurent

0

Định lý phân phối trước thống nhất (trường hợp khoảng):

"Nếu toàn bộ thông tin của bạn về bên ngoài dữ liệu được ghi lại bởi mệnh đề duy nhất sau đó Đặc điểm kỹ thuật trước nhất quán nhất có thể có của bạn là θD

B={{Possible values for θ}={the interval (a,b)},a<b}
f(θ)=Uniform(a,b)

Do đó, đặc điểm kỹ thuật trước của bạn phải tương ứng với ưu tiên của Jeffrey nếu bạn thực sự tin vào định lý trên. "

Không phải là một phần của Định lý phân phối trước thống nhất:

Ngoài ra, bạn có thể chỉ định phân phối trước dưới dạng phân phối Pareto, là phân phối liên hợp cho đồng phục, biết rằng phân phối sau của bạn sẽ phải là phân phối đồng đều khác theo cách chia. Tuy nhiên, nếu bạn sử dụng phân phối Pareto, thì bạn sẽ cần chỉ định các tham số của phân phối Pareto theo một cách nào đó.f(θ)


4
Trước tiên, bạn nói câu trả lời "chỉ có thể có trong nội bộ nhất quán" là phân phối thống nhất và sau đó bạn tiến hành đề xuất một giải pháp thay thế. Điều đó nghe có vẻ phi logic và không phù hợp với tôi :-).
whuber

2
Tôi không thể đồng ý. Chẳng hạn, cũng là tậpKhi PDF của là cho . Nhưng theo "định lý", có pdf là trong khoảng đó. Nói tóm lại, mặc dù mệnh đề không phụ thuộc vào cách vấn đề được tham số hóa, kết luận của "định lý" không phụ thuộc vào tham số hóa, vì nó không rõ ràng. B{θ|θ3(a3,b3)}.ΘUniform(a,b),Ψ=Θ31/(3ψ2/3(ba))a3<ψ<b3ΨUniform(a3,b3)1/(b3a3)
whuber

2
BabakP: Làm thế nào người ta có thể nói đây là một định lý ? Một định lý là một yêu cầu toán học với một bằng chứng toán học. "Định lý" này sẽ được gọi là "nguyên tắc" một cách thích hợp hơn, nhưng nó không hợp lý vì nó mâu thuẫn, như được thể hiện bởi @whuber.
Stéphane Laurent

2
Cảm ơn đã tham khảo BabakP. Tôi muốn chỉ ra rằng "bản phác thảo bằng chứng" là không có thật. Draper chia khoảng thời gian thành một số hữu hạn các giá trị cách đều nhau và "vượt qua giới hạn". Bất kỳ ai cũng có thể chia khoảng thời gian thành các giá trị cách nhau để xấp xỉ bất kỳ mật độ nào họ thích và tương tự vượt qua giới hạn, tạo ra hoàn toàn tùy ý "chỉ có thể có các thông số kỹ thuật trước nhất quán về mặt logic." Loại công cụ này - cụ thể là sử dụng toán học tồi trong một nỗ lực để chỉ ra rằng những người không phải là người Bayes là phi logic - mang lại cho phân tích Bayes một cái tên xấu (không đáng tin). (cc @ Stéphane.)
whuber

1
@ Stéphane Xin hãy tha thứ cho sự vô cảm của tôi ( insensibilité ) - Tôi ngưỡng mộ kỹ năng của bạn khi tương tác ở đây bằng ngôn ngữ thứ hai và không cố ý sử dụng các thuật ngữ tối nghĩa! Bogus là một tính từ xuất phát từ một từ lóng 200 năm tuổi của Hoa Kỳ đề cập đến một cỗ máy làm tiền giả. Trong trường hợp này, nó là một máy toán học cho các định lý giả :-).
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.