Câu hỏi này liên quan đến ước tính khả năng tối đa hạn chế (REML) trong một phiên bản cụ thể của mô hình tuyến tính, cụ thể là:
nơi là một ( n × p ) ma trận parametrized bởi α ∈ R k , như là Σ ( α ) . β là một vector chưa biết các thông số phiền toái; sự quan tâm là ước tính α và chúng ta có k ≤ p ≪ n . Ước tính mô hình theo khả năng tối đa là không có vấn đề, nhưng tôi muốn sử dụng REML. Mọi người đều biết, ví dụ LaMotte , rằng khả năng A ′ Y , trong đó A là bất kỳ ma trận bán trực giao nào sao cho có thể được viết
khi là thứ hạng cột đầy đủ .
Vấn đề của tôi là đối với một số hoàn toàn hợp lý, và khoa học thú vị, ma trận X ( α ) không phải là cấp bậc cột đầy đủ. Tất cả các dẫn xuất mà tôi đã thấy về khả năng bị hạn chế ở trên sử dụng các đẳng thức xác định không áp dụng được khi | X ′ X | = 0 , tức là họ giả định thứ hạng cột đầy đủ của X . Điều này có nghĩa là khả năng bị hạn chế ở trên chỉ đúng với cài đặt của tôi trên các phần của không gian tham số và do đó không phải là điều tôi muốn tối ưu hóa.
Câu hỏi: Có khả năng hạn chế chung hơn, xuất phát, trong tài liệu thống kê hoặc ở nơi khác, mà không có giả định rằng là thứ hạng cột đầy đủ? Nếu vậy, họ trông như thế nào?
Một số quan sát:
- Lấy phần số mũ không có vấn đề gì với bất kỳ và nó có thể được viết theo nghĩa nghịch đảo Moore-Penrose như trên
- Các cột của là một (bất kỳ) trực giao cơ sở cho C ( X ) ⊥
- Đối với biết , khả năng A ′ Y có thể dễ dàng được viết ra cho mọi α , nhưng tất nhiên số lượng vectơ cơ sở, tức là các cột, trong A phụ thuộc vào thứ hạng cột của X
Nếu bất cứ ai quan tâm đến câu hỏi này tin rằng việc tham số chính xác của sẽ giúp đỡ, cho tôi biết và tôi sẽ viết chúng ra. Tuy nhiên, tại thời điểm này, tôi chủ yếu quan tâm đến một REML cho một X chung về kích thước chính xác.
Một mô tả chi tiết hơn của mô hình sau đây. Hãy để là một r chiều thứ tự đầu tiên Vector Autoregression [VAR (1)] nơi v t i i d ~ N ( 0 , Ω ) . Giả sử quá trình được bắt đầu ở một số giá trị cố định y 0 tại thời điểm t = 0 .
Define . The model may be written in the linear model form using the following definitions and notation:
where denotes a dimensional vector of ones and the first standard basis vector of .
Denote . Notice that if is not full rank then is not full column rank. This includes, for example, cases where one of the components of does not depend on the past.
The idea of estimating VARs using REML is well known in, for example, the predictive regressions literature (see e.g. Phillips and Chen and the references therein.)
It may be worthwhile to clarify that the matrix is not a design matrix in the usual sense, it just falls out of the model and unless there is a priori knowledge about there is, as far as I can tell, no way to reparameterize it to be full rank.
I have posted a question on math.stackexchange that is related to this one in the sense that an answer to the math question may help in deriving a likelihood that would answer this question.