Một câu giải thích của AIC cho các loại phi kỹ thuật


8

Tôi cần một lời giải thích một câu về việc sử dụng AIC trong xây dựng mô hình. Cho đến nay tôi đã "Nói một cách đơn giản, AIC là thước đo tương đối của lượng biến thể quan sát được chiếm bởi các mô hình khác nhau và cho phép hiệu chỉnh độ phức tạp của mô hình."

Lời khuyên nào cũng đánh giá cao.

R

Câu trả lời:


11

AIC là một con số hữu ích để so sánh các mô hình vì nó bao gồm các biện pháp về cả mức độ phù hợp của mô hình với dữ liệu và mức độ phức tạp của mô hình.


8

Điều gì sẽ là lời giải thích tốt nhất phụ thuộc vào chính xác ý nghĩa của "các loại phi kỹ thuật". Tôi thích những tuyên bố đã được đưa ra cho đến nay, nhưng tôi có một điểm yếu: Họ có xu hướng sử dụng thuật ngữ "phức tạp", và chính xác những gì được hiểu có nghĩa là có thể khác nhau. Hãy để tôi cung cấp biến thể này:

AIC là thước đo mức độ phù hợp của một mô hình, trong khi điều chỉnh khả năng của mô hình đó phù hợp với bất kỳ tập dữ liệu nào cho dù nó có liên quan hay không.


+1. Tôi nghĩ rằng đây là chìa khóa: khi nào linh hoạt hơn quá linh hoạt? Có lẽ "điều chỉnh cho" có thể bị khiển trách "phạt"? Vì vậy, nó giống nhưThe AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.
Wayne

Tôi đồng ý rằng nó phụ thuộc vào ý nghĩa của "các loại phi kỹ thuật". Hầu hết những người tôi làm việc cùng là tiến sĩ về khoa học xã hội, y tế hoặc hành vi; họ được giáo dục, nhưng không biết số liệu thống kê. Nhưng tôi không chắc là tôi thích một vài từ cuối cùng trong định nghĩa của bạn, vì không rõ "liên quan" nghĩa là gì ở đây. Có lẽ trong định nghĩa của tôi, tôi có thể thay thế "số lượng biến độc lập" cho "phức tạp". Tôi nghĩ rằng rất nhiều người biết IV là gì ... Câu hỏi thú vị!
Peter Flom

@PeterFlom, bạn nói đúng - chúng tôi sắp xếp một sự nhầm lẫn có thể xảy ra cho người khác. Cá nhân, khi bạn biết bạn đang nói chuyện với ai, tôi nghi ngờ một trong hai chúng tôi sẽ có bất kỳ vấn đề nào. Yêu cầu 1 câu là khá chặt chẽ, quá; cho tôi một vài con số & 5 phút và tôi có thể đưa bất cứ ai lên máy bay. Và để rõ ràng, đó không phải là một lời chỉ trích, tôi thích câu trả lời của bạn và nâng cao nó.
gung - Phục hồi Monica

5

Đây là một định nghĩa xác định vị trí AIC trong các kỹ thuật được sử dụng để lựa chọn mô hình. AIC chỉ là một trong một số cách hợp lý để nắm bắt sự đánh đổi giữa mức độ phù hợp (được cải thiện bằng cách thêm độ phức tạp của mô hình dưới dạng các biến giải thích thêm hoặc thêm cảnh báo như "nhưng chỉ vào thứ năm, khi trời mưa") (đơn giản hơn == tốt hơn) trong việc so sánh các mô hình không lồng nhau. Đây là bản in đẹp:

  1. Tôi tin rằng định nghĩa của OP chỉ áp dụng cho các mô hình tuyến tính. Đối với những thứ như thăm dò, AIC thường được xác định theo khả năng đăng nhập.
  2. R2
  3. Một cách hay để bỏ qua việc tham gia Tiêu chí thông tin hàng đầu của Mỹ, là thừa nhận rằng các tiêu chí này là tùy ý và các xấp xỉ đáng kể có liên quan đến việc lấy chúng, đặc biệt là trong trường hợp phi tuyến tính. Trong thực tế, việc lựa chọn một mô hình từ một tập hợp các mô hình có lẽ nên phụ thuộc vào mục đích sử dụng của mô hình đó. Nếu mục đích là để giải thích các tính năng chính của một vấn đề phức tạp, thì sự khôn ngoan đáng giá bằng trọng lượng của nó bằng vàng. Nếu dự đoán là tên của trò chơi, thì sự khôn ngoan sẽ ít thân thương hơn. Một số thậm chí sẽ thêm rằng kiến ​​thức lý thuyết / tên miền cũng sẽ đóng một vai trò lớn hơn. Trong mọi trường hợp, những gì bạn dự định làm với mô hình sẽ xác định tiêu chí nào bạn có thể sử dụng.
  4. Đối với các mô hình lồng nhau , kiểm tra giả thuyết tiêu chuẩn giới hạn các tham số về 0 là đủ.

3

Làm thế nào về:

AIC giúp bạn tìm ra mô hình phù hợp nhất sử dụng ít biến nhất.

Nếu đó là quá xa theo hướng phi kỹ thuật, hãy cho tôi biết trong các bình luận và tôi sẽ đưa ra một ý kiến ​​khác.


2
AIC thực hiện dao cạo của Occam?
Dilip Sarwate

@Dilip - cho đến nay đã qua dòng, bạn thậm chí không thể nhìn thấy dòng nữa - lol, cảm ơn. Tôi nghĩ rằng tôi sẽ sử dụng một cái gì đó giữa Peter's và của riêng tôi.
ross

3

AIC là thước đo mức độ giải thích của dữ liệu bởi mô hình được sửa cho mức độ phức tạp của mô hình.


2

Mặt trái của câu trả lời xuất sắc của @ gung:

AIC là một con số đo lường mức độ phù hợp của một mô hình dữ liệu, trên thang trượt yêu cầu các mô hình phức tạp hơn phải chính xác hơn đáng kể để đánh giá cao hơn.

BIÊN TẬP:

AIC là một con số đo lường mức độ phù hợp của một mô hình dữ liệu, trên thang trượt yêu cầu các mô hình phức tạp hơn hoặc linh hoạt hơn cũng chính xác hơn đáng kể.


+1, điều này là tốt, nhưng thành thật mà nói, tôi thích đề xuất "phạt" của bạn hơn. Tôi có thể tưởng tượng những người không hiểu ý của bạn bằng cách "trau chuốt".
gung - Phục hồi Monica

@gung: Tôi đồng ý rằng điều này không hoàn toàn làm được, nhưng tôi đã cố gắng thu hẹp khoảng cách từ "mô hình" sang "giải thích", nơi mọi người có thể tưởng tượng rằng một lời giải thích phức tạp hơn sẽ cần chính xác hơn để biện minh cho các từ thêm.
Wayne

-1

AIC=2k2ln(MaxL)

Với định nghĩa này, AIC là một tiêu chí được sử dụng để chọn mô hình mang lại sự thỏa hiệp tốt nhất giữa độ thưa về số lượng tham số và khả năng tối đa để ước tính các tham số đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.