Trong các số liệu thống kê, chúng tôi đang thực hiện hồi quy tuyến tính, sự khởi đầu của chúng. Nói chung, chúng ta biết rằng càng cao càng tốt, nhưng có bao giờ một kịch bản mà sẽ là một mô hình vô dụng?
Trong các số liệu thống kê, chúng tôi đang thực hiện hồi quy tuyến tính, sự khởi đầu của chúng. Nói chung, chúng ta biết rằng càng cao càng tốt, nhưng có bao giờ một kịch bản mà sẽ là một mô hình vô dụng?
Câu trả lời:
Vâng. Các tiêu chí để đánh giá một mô hình thống kê phụ thuộc vào vấn đề cụ thể và không có chức năng cơ học nào của hoặc ý nghĩa thống kê (mặc dù chúng quan trọng). Câu hỏi liên quan là "mô hình có giúp bạn hiểu dữ liệu không?"
Cách đơn giản nhất để có được là thực hiện một số tương đương với việc thoái bộ giày phải trên giày trái. Hãy cho tôi biết kích cỡ của giày bên phải của bạn và tôi có thể dự đoán kích thước của giày bên trái của bạn với độ chính xác cao. R 2 khổng lồ ! Thật là một mô hình thống kê tuyệt vời! Ngoại trừ nó có nghĩa là poolyly poo. Bạn có thể nhận được R 2 tuyệt vời bằng cách đặt cùng một biến ở bên trái và bên phải của hồi quy, nhưng hồi quy R 2 khổng lồ này gần như chắc chắn sẽ vô dụng.
Có những trường hợp khác trong đó bao gồm một biến ở phía bên tay phải về mặt khái niệm là điều sai trái (ngay cả khi nó tăng ). Giả sử bạn đang cố gắng ước tính nếu một số nhóm thiểu số bị phân biệt đối xử và ít có khả năng có việc làm. Bạn không nên kiểm soát xem công ty có gọi lại sau khi xin việc hay không vì khả năng đáp ứng đơn xin việc của người thiểu số có thể là kênh thông qua phân biệt đối xử xảy ra! Thêm điều khiển sai có thể khiến hồi quy của bạn trở nên vô nghĩa.
Bạn luôn có thể tăng bằng cách thêm nhiều biến hồi quy! Tôi có thể tiếp tục thêm các biến hồi quy vào phía bên tay phải cho đến khi tôi nhận được bất cứ thứ gì R 2 tôi thích. Để dự đoán thu nhập lao động, tôi có thể thêm kiểm soát giáo dục, kiểm soát độ tuổi, hiệu ứng cố định quý, hiệu ứng cố định mã zip, hiệu ứng cố định nghề nghiệp, hiệu ứng cố định công ty, hiệu ứng cố định gia đình, hiệu ứng cố định vật nuôi, độ dài tóc, v.v ... không còn ý nghĩa nhưng R 2 tiếp tục tăng. Thêm tất cả mọi thứ như một hồi quy được gọi là hồi quy "bồn rửa nhà bếp". Bạn có thể nhận được R 2 cao nhưng có thể vượt quá dữ liệu một cách ồ ạt: mô hình của bạn dự đoán hoàn hảo mẫu được sử dụng để ước tính mô hình (có R cao ) nhưng mô hình ước tính thất bại khủng khiếp trên dữ liệu mới.
Ý tưởng tương tự có thể hiển thị trong phù hợp đường cong đa thức. Cung cấp cho tôi dữ liệu ngẫu nhiên và tôi có thể có được tuyệt vời bằng cách lắp đa thức 200 độ. Mặc dù trên dữ liệu mới, đa thức ước tính sẽ không hoạt động vì quá nhiều. Một lần nữa, R 2 cao cho mô hình ước tính nhưng mô hình ước tính là vô dụng.
Điểm (3-4) là lý do tại sao chúng tôi đã điều chỉnh , cung cấp một số hình phạt cho việc thêm nhiều biến hồi quy, nhưng R 2 được điều chỉnh thường vẫn có thể được xử lý bằng cách ghi đè dữ liệu. Nó cũng có tính năng vô nghĩa tuyệt vời mà nó có thể đi tiêu cực.
Tôi cũng có thể đưa ra các ví dụ trong đó thấp chỉ tốt (ví dụ: ước tính betas trong các mô hình định giá tài sản) nhưng bài đăng này đã nhận được khá lâu. Tóm lại, câu hỏi tổng thể nên là một cái gì đó như, "biết những gì tôi biết về vấn đề và về thống kê, mô hình này có giúp tôi hiểu / giải thích dữ liệu không?" R 2 có thể là một công cụ giúp trả lời câu hỏi này, nhưng nó không đơn giản vì các mẫu có R 2 cao hơn luôn tốt hơn.
"Cao hơn là tốt hơn" là một quy tắc xấu cho R-vuông.
Don Morrison đã viết một số bài báo nổi tiếng một vài năm trước đây chứng minh rằng bình phương R tiến gần đến 0 vẫn có thể hoạt động và có lợi nhuận, tùy thuộc vào ngành. Chẳng hạn, trong phản hồi dự đoán tiếp thị trực tiếp đối với việc đăng ký tạp chí gửi tới 10 triệu hộ gia đình, bình phương R ở các chữ số thấp có thể tạo ra các chiến dịch có lợi nhuận (trên cơ sở ROI) nếu việc gửi thư dựa trên 2 hoặc 3 câu trả lời hàng đầu khả năng
Một nhà xã hội học khác (có tên thoát khỏi tôi) đã phân chia bình phương R theo kiểu dữ liệu lưu ý rằng nghiên cứu khảo sát wrt, bình phương R trong phạm vi 10-20% là chuẩn, trong khi đối với dữ liệu kinh doanh, bình phương R trong phạm vi 40-60% đã được dự kiến. Họ tiếp tục nhận xét rằng bình phương R từ 80-90% trở lên có thể vi phạm các giả định hồi quy cơ bản. Tuy nhiên, tác giả này không có kinh nghiệm về hỗn hợp tiếp thị, dữ liệu chuỗi thời gian hoặc mô hình có chứa một bộ đầy đủ các tính năng "nhân quả" (ví dụ: 4 "Ps" cổ điển về giá, khuyến mãi, địa điểm và sản phẩm) có thể và sẽ tạo ra R- hình vuông tiếp cận 100%.
Điều đó nói rằng, ngay cả những quy tắc chuẩn, hợp lý, chẳng hạn như những quy tắc này không hữu ích lắm khi đối phó với người mù chữ về mặt kỹ thuật mà câu hỏi đầu tiên về một mô hình dự đoán sẽ luôn là "Hình vuông R là gì?"
Các câu trả lời khác đưa ra những giải thích lý thuyết tuyệt vời về nhiều cách mà các giá trị R bình phương có thể được cố định / làm giả / gây hiểu lầm / v.v .. Dưới đây là một minh chứng thực hành luôn bị mắc kẹt với tôi, được mã hóa trong r
:
y <- rnorm(10)
x <- sapply(rep(10,8),rnorm)
summary(lm(y~x))
Điều này có thể cung cấp các giá trị bình phương R> 0,90. Thêm đủ các biến hồi quy và thậm chí các giá trị ngẫu nhiên có thể "dự đoán" các giá trị ngẫu nhiên.
set.seed(1)
và set.seed(2)
.