Điều gì phá vỡ sự so sánh của các mô hình liên quan đến AIC?


9

Giả sử tôi đã phù hợp với một số mô hình bằng cách sử dụng các yếu tố dự đoán (và biến phản hồi) từ cùng một bộ dữ liệu.

Những thay đổi nào đối với mô hình sẽ khiến tôi không hợp lý khi so sánh các mô hình trên cơ sở AIC?

1) Giả sử, nếu tôi đăng nhập biến đổi biến phụ thuộc, có công bằng không khi so sánh nó với một mô hình không có biến đổi?

2) Nếu tôi loại bỏ các yếu tố dự đoán khỏi mô hình, tôi có thể so sánh nó với các mô hình với tất cả các yếu tố dự đoán được thêm vào nó không?

3) Nếu tôi phù hợp với hai glms với các gia đình khác nhau cho hai người, tôi vẫn có thể so sánh chúng trên cơ sở AIC chứ? Còn với các chức năng liên kết khác nhau thì sao?

Cảm ơn về thông tin bạn vừa nhập.


Có vẻ như bạn đã bỏ qua một từ trong "Nếu tôi phù hợp với hai glms với [cái gì đó] khác nhau"
Juho Kokkala

Câu trả lời:


4

Nếu bạn có hai mô hình M1M2 cho một mẫu (y1,,yn), sau đó, miễn là các mô hình hợp lý, bạn có thể sử dụng AIC để so sánh chúng. Tất nhiên, điều này không có nghĩa là AIC sẽ chọn mô hình gần với sự thật nhất, trong số các đối thủ cạnh tranh, vì AIC dựa trên kết quả tiệm cận. Trong một kịch bản cực đoan, giả sử rằng bạn muốn so sánh hai mô hình, một mô hình với 1 tham số duy nhất và mô hình khác với 100 tham số và kích thước mẫu là101. Sau đó, dự kiến ​​sẽ quan sát độ chính xác rất thấp trong ước tính của mô hình với 100 tham số, trong khi trong mô hình có 1 tham số có khả năng tham số được ước tính chính xác. Đây là một trong những lý lẽ chống lại việc sử dụng AIC để so sánh các mô hình mà các công cụ ước tính khả năng có tỷ lệ hội tụ rất khác nhau. Điều này có thể xảy ra ngay cả trong các mô hình có cùng số lượng tham số.

  1. Có, bạn có thể sử dụng AIC để so sánh hai mô hình trong đó bạn đã chuyển đổi biến trả lời trong một trong số chúng miễn là mô hình vẫn có ý nghĩa . Tuy nhiên, đây không phải là luôn luôn như vậy. Nếu bạn có một mô hình tuyến tính

yi=xiTβ+ei,
Ở đâu eiN(0,σ), điều này ngụ ý rằng biến yicó thể lấy bất kỳ giá trị thực. Do đó, một chuyển đổi log không có ý nghĩa từ góc độ lý thuyết, ngay cả khi mẫu chỉ chứa các giá trị dương.
  1. Điều này được gọi là lựa chọn biến AIC từng bước. Đã thực hiện trong lệnh R stepAIC().

  2. Một lần nữa, miễn là nó hợp lý để mô hình hóa dữ liệu với loại mô hình đó.

Một số thảo luận thú vị về việc sử dụng AIC có thể được tìm thấy ở đây:

AIC MYTHS VÀ MISUNDERSTANDING

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.