Là một


19

Tôi đã ước tính một mô hình tuyến tính mạnh mẽ Rvới trọng số MM bằng cách sử dụng rlm()gói MASS. `R`` không cung cấp giá trị cho mô hình, nhưng tôi muốn có một giá trị nếu đó là một đại lượng có ý nghĩa. Tôi cũng muốn biết liệu có bất kỳ ý nghĩa nào trong việc có giá trị R 2 cân bằng phương sai tổng và dư giống như cách các quan sát được cân trong hồi quy mạnh hay không. Suy nghĩ chung của tôi là, nếu, vì mục đích của hồi quy, về cơ bản, chúng ta với các trọng số cho một số ước tính ít ảnh hưởng hơn bởi vì chúng là các ngoại lệ theo một cách nào đó, thì có lẽ vì mục đích tính r 2, chúng ta cũng nên đưa ra các ước tính đó. Ước tính ít ảnh hưởng?R2R2r2

Tôi đã viết hai hàm đơn giản cho R 2 có trọng số , chúng ở bên dưới. Tôi cũng bao gồm các kết quả của việc chạy các chức năng này cho mô hình của tôi được gọi là HI9. EDIT: Tôi đã tìm thấy trang web của Adelle Coster của UNSW đưa ra một công thức bao gồm vectơ trọng số trong việc tính toán cả hai và giống như tôi đã làm, và yêu cầu cô ấy tham khảo chính thức hơn: http: //web.maths. unsw.edu.au/~adelle/Garvan/Assays/GoodnessOfFit.html (vẫn đang tìm kiếm sự giúp đỡ từ Hội Chữ thập Validated về cách giải thích có trọng này r 2 .)R2R2R2SSeSStr2

#I used this function to calculate a basic r-squared from the robust linear model
r2 <- function(x){  
+ SSe <- sum((x$resid)^2);  
+ observed <- x$resid+x$fitted;  
+ SSt <- sum((observed-mean(observed))^2);  
+ value <- 1-SSe/SSt;  
+ return(value);  
+ }  
r2(HI9)  
[1] 0.2061147

#I used this function to calculate a weighted r-squared from the robust linear model
> r2ww <- function(x){
+ SSe <- sum((x$w*x$resid)^2); #the residual sum of squares is weighted
+ observed <- x$resid+x$fitted;
+ SSt <- sum((x$w*(observed-mean(observed)))^2); #the total sum of squares is weighted      
+ value <- 1-SSe/SSt;
+ return(value);
+ }
 > r2ww(HI9)
[1] 0.7716264

Cảm ơn bất cứ ai dành thời gian trả lời này. Vui lòng chấp nhận lời xin lỗi của tôi nếu đã có một số tài liệu tham khảo rất tốt về điều này mà tôi đã bỏ lỡ, hoặc nếu mã của tôi ở trên khó đọc (tôi không phải là một người viết mã).


đặt trọng lượng bên trong lm () và lấy bình phương r từ đó (tại sao lại phát minh ra bánh xe?)
user603

1
cảm ơn vì lời khuyên về cách làm những gì tôi đã làm hiệu quả hơn. bất cứ ai có thể nhận xét về ý nghĩa của bình phương r mà tôi đã mô tả / đề xuất?
CraigMilligan

@ user603: Làm thế nào bạn thực sự sẽ đưa trọng lượng vào trong lm ()?
histelheim

Chỉ cần một lời khen, hình vuông nhỏ nhất có trọng số được trang bị trong R là bằng cách giảm thiểu tổng (w * e ^ 2), trong đó e là phần dư. Vì vậy, đối với bạn mã tính toán, tất cả trọng lượng w nên được lấy một căn bậc hai.
Yuanhao Lai

Tôi muốn nhấn mạnh rằng chúng ta không có nghĩa là có trọng số, ít nhất tôi tin rằng bởi vì một chương trình tôi đã viết đưa ra một bình phương gần bằng 1 với: bình phương r bình phương trọng số r nhưng bình phương với trọng số r- bình phương nơi trung bình cũng có trọng số, tôi thấy -6 nó phản trực giác ngay cả đối với tôi, nhưng tôi tin rằng trải nghiệm mặc dù
pierre

Câu trả lời:


22

Câu trả lời sau đây dựa trên: (1) cách giải thích của tôi về Willett và Ca sĩ (1988) Một lưu ý thận trọng khác về R bình phương: Nó được sử dụng trong phân tích hồi quy bình phương nhỏ nhất có trọng số. Nhà thống kê người Mỹ. 42 (3). pp236-238 và (2) tiền đề rằng hồi quy tuyến tính mạnh về cơ bản là hồi quy bình phương nhỏ nhất có trọng số với các trọng số được ước tính bởi một quá trình lặp.

Công thức tôi đưa ra trong câu hỏi cho r2w cần một hiệu chỉnh nhỏ để tương ứng với phương trình 4 trong Willet và Singer (1988) cho r2wls: phép tính SSt cũng nên sử dụng giá trị trung bình có trọng số:

the correction is SSt <- sum((x$w*observed-mean(x$w*observed))^2)].

Ý nghĩa của trọng số r (bình phương) này là gì? Willett và Singer giải thích nó là: "hệ số xác định trong tập dữ liệu [có trọng số] đã chuyển đổi. Đây là thước đo tỷ lệ của biến thể trong trọng số Y có thể được tính bằng trọng số X và là đại lượng được tính là R2 bởi các gói máy tính thống kê chính khi thực hiện hồi quy WLS ".

Là nó có ý nghĩa như một thước đo của sự tốt đẹp của phù hợp? Điều này phụ thuộc vào cách nó được trình bày và giải thích. Willett và Singer cảnh báo rằng nó thường cao hơn một chút so với bình phương r thu được trong hồi quy bình phương nhỏ nhất bình thường và giá trị cao khuyến khích hiển thị nổi bật ... nhưng màn hình này có thể bị đánh lừa NẾU nó được hiểu theo nghĩa thông thường của r -squared (như tỷ lệ không cânbiến thể được giải thích bởi một mô hình). Willett và Singer đề xuất rằng một phương án ít 'lừa đảo' hơn là pseudoR2wls (phương trình 7 của chúng), tương đương với hàm r2 của tôi trong câu hỏi ban đầu. Nói chung, Willett và Ca sĩ cũng cảnh báo rằng không nên dựa vào bất kỳ r2 nào (thậm chí cả pseudor2wls của họ) như là một thước đo duy nhất về sự phù hợp. Bất chấp những cảnh báo này, toàn bộ tiền đề của hồi quy mạnh mẽ là một số trường hợp được đánh giá là 'không tốt' và không được tính nhiều trong sự phù hợp mô hình, và có thể tốt khi phản ánh điều này trong một phần của quy trình đánh giá mô hình. Mô hình r bình phương được mô tả, có thể là một thước đo tốt về mức độ phù hợp - miễn là giải thích chính xác được đưa ra rõ ràng trong bài thuyết trình và nó không dựa vào đánh giá duy nhất về mức độ phù hợp.


1
(+1). Cảm ơn vì đã dành thời gian để đưa ra câu trả lời.
user603

1

@CraigMilligan. Không nên:

  • trọng số nằm ngoài dấu ngoặc vuông
  • trung bình có trọng số được tính theo đó chúng ta cũng có thể sử dụngsum(x$w*observed)/sum(x$w)weighted.mean(observed,x$w)

Một cái gì đó như thế này:

r2ww <- function(x){
  SSe <- sum(x$w*(x$resid)^2)
  observed <- x$resid+x$fitted
  SSt <- sum(x$w*(observed-weighted.mean(observed,x$w))^2)
  value <- 1-SSe/SSt;
  return(value);
}
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.