Nhận dạng mô hình là gì?


38

Tôi biết rằng với một mô hình không thể xác định được, dữ liệu có thể được cho là được tạo bởi nhiều phép gán khác nhau cho các tham số mô hình. Tôi biết rằng đôi khi có thể hạn chế các tham số sao cho tất cả đều có thể nhận dạng được, như trong ví dụ trong Cassella & Berger 2nd ed, phần 11.2.

Đưa ra một mô hình cụ thể, làm thế nào tôi có thể đánh giá liệu nó có thể nhận dạng được hay không?

Câu trả lời:


45

Đối với identifiability chúng ta đang nói về một tham số (mà có thể là một vector), trong đó khoảng hơn một không gian tham số Θ , và một gia đình của các bản phân phối (vì đơn giản, suy nghĩ PDF) lập chỉ mục bởi θ mà chúng tôi thường viết một cái gì đó giống như { f θ |θΘθ . Ví dụ, θ có thể là θ = β f có thể là{fθ|θΘ}θθ=βf

trong đó sẽ có nghĩa làΘ=(0,). Để mô hình được thấy rõ, sự chuyển đổi mà bản đồθđểfθnênone-to-one. Với một mô hình trong đùi của bạn, cách đơn giản nhất để kiểm tra này là để bắt đầu với phương trìnhfθ 1 =fθ 2 , (bình đẳng này nên giữ cho (gần như) tất cả cácxtrong

fθ(x)=1βex/β, x>0, β>0,
Θ=(0,)θfθfθ1=fθ2xhỗ trợ ) và cố gắng sử dụng đại số (hoặc một số lập luận khác) để chứng minh rằng chỉ như một phương trình hàm ý rằng, trên thực tế, .θ1=θ2

Nếu bạn thành công với kế hoạch này, thì mô hình của bạn có thể xác định được; tiếp tục với công việc kinh doanh của bạn Nếu bạn không, thì mô hình của bạn không thể nhận dạng được hoặc bạn cần tìm một đối số khác. Trực giác là như nhau, bất kể: trong một mô hình có thể nhận dạng, không thể có hai tham số riêng biệt (có thể là vectơ) để tạo ra cùng một hàm khả năng.

Điều này có ý nghĩa, bởi vì, nếu, đối với dữ liệu cố định, hai tham số duy nhất có cùng khả năng, thì không thể phân biệt giữa hai tham số ứng cử viên chỉ dựa trên dữ liệu. Trong trường hợp đó, không thể xác định được tham số thực sự.

fθ1=fθ2

1β1ex/β1=1β2ex/β2,
x>0
lnβ1xβ1=lnβ2xβ2
x>0
(1β11β2)x(lnβ1lnβ2)

f(y)=y2y[1,1]y[0,1]


2
(+1) Giải thích hay, toàn diện, thực tế. Sự tương tự bạn vẽ làm cho các khái niệm rõ ràng.
Đức hồng y

Bạn chắc chắn đã trả lời câu hỏi tôi đã hỏi, nhưng tôi quá nhiều người mới để thực sự hiểu câu trả lời của bạn. Nếu bạn biết một lời giải thích tốt hơn cho người mới, xin vui lòng cho tôi biết.
Jack Tanner

1
@cardinal, cảm ơn. Đối với Jack, được rồi, tôi hiểu rồi. Làm thế nào về điều này: nếu có một cái gì đó ở trên chưa rõ ràng, và nếu bạn chỉ ra cho tôi, thì tôi có thể cố gắng bổ sung thêm. Hoặc, nếu bạn thích, bạn có thể viết một câu hỏi khác yêu cầu giải thích "cư sĩ" hoặc ví dụ về những ý tưởng này. Tôi nghĩ thật công bằng khi nói rằng nhận dạng là một chủ đề thường xuất hiện sau thời gian giới thiệu điển hình, vì vậy nếu bạn muốn cung cấp một số bối cảnh về lý do tại sao bạn gặp phải điều này bây giờ nó có thể giúp người trả lời tiềm năng.

2
yij=μ+α1+α2++αk+εi

23

ΣΣΣ

Σ

Nếu bạn đang thực hiện một vấn đề khả năng tối đa, thì bạn sẽ biết ma trận hiệp phương sai tiệm cận của các ước tính của bạn bằng với nghịch đảo của thông tin khai thác được đánh giá tại MLE. Vì vậy, kiểm tra ma trận thông tin cá cho tính đơn lẻ (gần đúng) cũng là một cách hợp lý để đánh giá nhận dạng. Điều này cũng hoạt động khi khó có thể tính toán thông tin lý thuyết vì thông thường có thể tính chính xác bằng số một ước lượng nhất quán của ma trận thông tin thủy sản bằng cách ước tính sản phẩm bên ngoài dự kiến ​​của hàm điểm bằng sản phẩm ngoài trung bình quan sát được .

Σ


2
(+1) Làm tốt lắm. Tôi thậm chí đã không nghĩ đến cách tiếp cận câu hỏi này từ hướng đó.

1
Một lý do ý tưởng về việc tính toán ma trận hiệp phương sai dựa trên dữ liệu mô phỏng là đặc biệt gọn gàng, đó là dù sao đi nữa cũng nên mô phỏng dữ liệu để thực hiện kiểm tra Cook-Gelman-Rubin .
Jack Tanner
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.