Giá trị R bình phương có thích hợp để so sánh các mô hình không?


17

Tôi đang cố gắng xác định mô hình tốt nhất để dự đoán giá ô tô, sử dụng giá và tính năng có sẵn trên các trang web quảng cáo phân loại ô tô.

Để làm điều này, tôi đã sử dụng một vài mô hình từ thư viện scikit-learn và các mô hình mạng thần kinh từ pybrain và neurolab. Cách tiếp cận tôi đã sử dụng cho đến nay là chạy một lượng dữ liệu cố định thông qua một số mô hình (thuật toán học máy) và so sánh có các giá trị được tính toán với mô đun số liệu scikit-learn.R2

  1. Là là một phương pháp tốt để so sánh hiệu suất của các mô hình khác nhau?R2
  2. Mặc dù tôi nhận được kết quả khá chấp nhận được đối với các mô hình như Mạng đàn hồi và Rừng ngẫu nhiên, tôi nhận được các giá trị rất kém cho các mô hình mạng thần kinh, vậy có phải là một phương pháp thích hợp để đánh giá các mạng thần kinh (hoặc phương pháp phi tuyến tính) không?R 2R2R2

2
Câu trả lời ngắn gọn là không . Nó có thể giúp bạn đọc câu trả lời của tôi ở đây: Đánh giá và so sánh mô hình để chọn mô hình tốt nhất , liên quan khá chặt chẽ đến câu hỏi của bạn. Một giải pháp ứng cử viên được mô tả ở đây . Để hiểu tổng quát hơn, bạn có thể thử đọc một số chủ đề trên trang web được phân loại theo thẻ chọn mô hình .
gung - Phục hồi Monica

@gung Cảm ơn bạn! Tôi có thể hỏi điều gì sẽ là một mức độ phù hợp của biện pháp phù hợp cho hồi quy sử dụng mạng thần kinh?
Manik

Câu trả lời:


18

Tôi nghĩ phần quan trọng cần xem xét khi trả lời câu hỏi của bạn là

Tôi đang cố gắng xác định mô hình tốt nhất để dự đoán giá ô tô

bởi vì câu lệnh này ngụ ý điều gì đó về lý do tại sao bạn muốn sử dụng mô hình. Lựa chọn và đánh giá mô hình nên dựa trên những gì bạn muốn đạt được với các giá trị được trang bị của bạn.

Đầu tiên, hãy tóm tắt lại những gì thực hiệnR2 : Nó tính toán một tỷ lệ dựa trên hàm mất bậc hai, mà tôi chắc chắn rằng bạn đã biết. Để thấy điều này, xác định dư cho thứ i quan sát của bạn y i và giá trị được trang bị tương ứng y i . Sử dụng các ký hiệu thuận tiện S S R : = Σ N i = 1 e 2 i , S S T : = ΣeTôi= =yTôi-y^TôiyTôiy^TôiSSR: =ΣTôi= =1NeTôi2,R2chỉ đơn giản là định nghĩa làR2=1-SSR/SST.SST: =ΣTôi= =1N(yTôi-y¯)2R2R2= =1-SSR/SST

Thứ hai, chúng ta hãy xem R 2 sử dụng cho lựa chọn / đánh giá mô hình nghĩa là gìR2 . Giả sử chúng ta chọn từ một tập hợp các dự đoán đã được tạo ra bằng cách sử dụng mô hình M : M M , nơi M là bộ sưu tập các mô hình đang được xem xét (trong ví dụ của bạn, bộ sưu tập này sẽ chứa Mạng nơ-ron, rừng ngẫu nhiên, lưới đàn hồi, ...). Kể từ khi S S T sẽ vẫn không đổi trong tất cả các mô hình, nếu giảm thiểu R 2 bạn sẽ chọn chính xác các mô hình giảm thiểu S S R . Nói cách khác, bạn sẽ chọnY¯MM:MMMSSTR2SSR tạo ra mất bình phương sai số tối thiểu!MM

R2SSR L2L1

R2Lp1p<2p= =1LpLp

Tóm lại, lựa chọn / đánh giá mô hình không thể được xem xét độc lập với mục tiêu của mô hình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.