Cách đánh giá kết quả hồi quy tuyến tính


8

Tôi có một vấn đề hồi quy tuyến tính. Tóm lại, tôi có một bộ dữ liệu, tôi chia nó thành hai tập con. Một tập hợp con được sử dụng để tìm hồi quy tuyến tính (tập con đào tạo), một tập hợp con khác được sử dụng để đánh giá nó (tập con đánh giá). Câu hỏi của tôi là làm thế nào để đánh giá kết quả của hồi quy tuyến tính này sau khi áp dụng nó vào tập hợp con đánh giá của dữ liệu?

Đây là những thông tin chi tiết:

Trong tập con đào tạo, tôi thực hiện hồi quy tuyến tính: , trong đó là groundtruth (còn được gọi là đích), là một biến độc lập. Sau đó tôi tìm thấy và . ( và được đưa ra trong tập con đào tạo).y x a b x yy=ax+byxabxy

Bây giờ, sử dụng và được tìm thấy ở trên từ tập con đào tạo, áp dụng chúng cho tập con đánh giá, tôi thấy . Nói cách khác, các này được tìm thấy từ hồi quy tuyến tính với . Bây giờ, ngoài , tôi cũng có từ bộ đánh giá. Làm cách nào để đánh giá kết quả của tôi (bao nhiêu khác với )? Bất kỳ mô hình toán học chung để làm điều đó? Nó cần phải là một số loại mô hình / công thức toán học. Tôi có thể nghĩ ra nhiều cách khác nhau để làm điều đó, nhưng tất cả chúng đều đặc biệt hoặc đơn giản, nhưng đây là một công việc khoa học, vì vậy những thứ nghe có vẻ không thể sử dụng ở đây, thật không may.b y = a x + b y x y y y yaby=ax+byxyyyy

Bất kỳ ý tưởng?


6
Tôi không nghĩ loại đánh giá này thường được sử dụng với các mô hình hồi quy đơn giản. Điều gì sẽ cho bạn biết rằng bạn sẽ không phát hiện ra việc sử dụng toàn bộ dữ liệu để tạo các tham số hồi quy của mình? Thông thường lý do để sử dụng bộ dữ liệu đánh giá là để ngăn chặn quá mức, nhưng đó không phải là vấn đề khi bạn đã biết rằng mô hình của bạn sẽ chỉ chứa một biến độc lập.
octern

Để rõ ràng, @octern đã nói về hồi quy tuyến tính. Phân chia kiểm tra đào tạo là thực hành hoàn toàn tốt để làm điều này với hồi quy logistic. Nó thậm chí có thể có ý nghĩa trong hồi quy tuyến tính nếu tập kiểm thử có phân phối khác / không cố định so với đào tạo hoặc đến từ một khoảng thời gian khác (ví dụ: chiến dịch quảng cáo, hành vi mua sắm).
smci

Câu trả lời:


11

Tôi đồng ý với @Octern rằng người ta hiếm khi thấy mọi người sử dụng phân tách kiểm tra / thử nghiệm (hoặc thậm chí những thứ như xác thực chéo) cho các mô hình tuyến tính. Quá mức là (gần như) chắc chắn không phải là một vấn đề với một mô hình rất đơn giản như mô hình này.

Nếu bạn muốn hiểu về "chất lượng" của mô hình, bạn có thể muốn báo cáo khoảng tin cậy (hoặc tương đương Bayes của chúng) xung quanh các hệ số hồi quy của bạn. Có nhiều hướng khác nhau để làm điều đó. Nếu bạn biết / có thể cho rằng lỗi của bạn thường được phân phối, thì có một công thức đơn giản (và hầu hết các gói phân tích dữ liệu phổ biến sẽ cung cấp cho bạn các giá trị này). Một cách khác phổ biến là tính toán chúng thông qua việc lấy mẫu lại (ví dụ: bootstrapping hoặc jackknifing), điều này làm cho ít giả định hơn về việc phân phối lỗi. Trong cả hai trường hợp, tôi đều sử dụng bộ dữ liệu hoàn chỉnh để tính toán.


1
Bạn cũng nên làm phân tích dư bằng cách vẽ.
kjetil b halvorsen

1

nếu bạn thực sự ổn với mô hình trainig tuyến tính của mình và muốn biết nó dự đoán dữ liệu thử nghiệm của bạn tốt đến mức nào, thì tất cả những gì bạn cần làm là sử dụng công thức mô hình tuyến tính mà bạn đã có và bao gồm các hệ số ước tính a (= chặn) và b (hệ số hồi quy, còn được gọi là độ dốc) do mô hình đầu tiên.

nên trông giống như y = a + b * X ở đây một số số ảo ... y = 2 + 0,5 * X

Bạn đang sử dụng phần mềm nào? Bạn đang sử dụng R? nếu vậy, bạn có thể sử dụng hàm dự đoán.lm () và áp dụng nó trên tập dữ liệu thứ 2 của bạn.


1

Mặc dù điều này phần lớn phụ thuộc vào chính xác mục tiêu của bạn là gì, một cách đơn giản và tiêu chuẩn để thực hiện điều này sẽ là đo lỗi bình phương trung bình (MSE) . Vì vậy, nếu bạn có tập dữ liệu thử nghiệm bao gồm các cặp đầu vào / đầu ra, và các tham số của bạn và , sau đó MSE có thể được tính làD = { ( x 1 , y 1 ) , ( x 2 , y 2 ) , Hoài , ( x n , y n ) } a bDD={(x1,y1),(x2,y2),,(xn,yn)}ab

MSEa,b=1ni=1n(yi(axi+b))2.

Đây có lẽ là một cách hợp lý để đo lường lỗi của bạn vì đây có thể là tiêu chí bạn đã sử dụng để tìm tham số và . Nếu bạn muốn có được một ý tưởng tốt hơn về việc các tham số ước tính của bạn khái quát tốt như thế nào, bạn nên xem xét một cái gì đó như xác nhận chéo .bab

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.