RMSE so với hệ số xác định


21

Tôi đang đánh giá một mô hình vật lý và muốn biết một trong những phương pháp tôi nên sử dụng ở đây (giữa RMSE và Hệ số xác định R2)

Vấn đề như sau: Tôi có một hàm đưa ra dự đoán cho giá trị đầu vào x, . Tôi cũng có quan sát thực tế cho giá trị mà tôi gọi là .yxyx¯=f(x)yx

Câu hỏi của tôi là những ưu và nhược điểm của RMSE hoặc . Tôi đã thấy cả hai đều được sử dụng trong các bài báo cho vấn đề mà tôi đang làm việc.R2

Câu trả lời:


16

Tôi đã sử dụng cả hai, và có một vài điểm để thực hiện.

  • Rmse rất hữu ích vì nó đơn giản để giải thích. Mọi người đều biết nó là gì.
  • Rmse không hiển thị giá trị tương đối. Nếu , bạn phải biết cụ thể phạm vi . Nếu , thì 0,2 là một giá trị tốt. Nếu , có vẻ như nó không còn tốt nữa.α < y x < β α = 1 , β = 1000 α = 0 , β = 1rmse=0.2α<yx<βα=1,β=1000α=0,β=1
  • Theo cách tiếp cận trước đây, rmse là một cách tốt để che giấu sự thật rằng những người bạn đã khảo sát hoặc các phép đo bạn thực hiện hầu hết đều thống nhất (mọi người đánh giá sản phẩm có 3 sao) và kết quả của bạn có vẻ tốt vì dữ liệu đã giúp bạn. Nếu dữ liệu là một chút ngẫu nhiên, bạn sẽ tìm thấy mô hình của bạn quay quanh Sao Mộc.
  • Sử dụng hệ số xác định đã điều chỉnh, thay vì thông thườngR2
  • Hệ số xác định rất khó giải thích. Ngay cả những người trong lĩnh vực này cũng cần một mẹo ghi chú như \ footnote {Hệ số xác định được điều chỉnh là tỷ lệ biến thiên trong một tập dữ liệu có thể được giải thích bằng mô hình thống kê. Giá trị này cho thấy kết quả trong tương lai có thể được dự đoán bởi mô hình. có thể lấy 0 là tối thiểu và 1 là tối đa.}R2
  • Tuy nhiên, hệ số xác định rất chính xác trong việc cho biết mô hình của bạn giải thích hiện tượng tốt như thế nào. nếu , bất kể giá trị , mô hình của bạn là xấu. Tôi tin rằng điểm giới hạn cho một mô hình tốt bắt đầu từ 0,6 và nếu bạn có thứ gì đó trong khoảng 0,7-0,8, mô hình của bạn là một mô hình rất tốt.y xR2=0.2yx
  • Tóm lại, nói rằng, với mô hình của bạn, bạn có thể giải thích 70% những gì đang diễn ra trong dữ liệu thực. 30% còn lại, là điều bạn không biết và bạn không thể giải thích. Có thể là do có các yếu tố gây nhiễu, hoặc bạn đã mắc một số sai lầm khi xây dựng mô hình.R2= =0,7
  • Trong khoa học máy tính, hầu hết mọi người đều sử dụng rmse. Khoa học xã hội sử dụng thường xuyên hơn.R2
  • Nếu bạn không cần phải chứng minh các tham số trong mô hình của mình, chỉ cần sử dụng rmse. Tuy nhiên, nếu bạn cần đưa vào, xóa hoặc thay đổi các tham số trong khi xây dựng mô hình của mình, bạn cần sử dụng để cho thấy các tham số này có thể giải thích dữ liệu tốt nhất.R2
  • Nếu bạn sẽ sử dụng , hãy viết mã bằng ngôn ngữ R. Nó có thư viện và bạn chỉ cần cung cấp cho nó dữ liệu để có tất cả kết quả.R2

Đối với một nhà khoa học máy tính đầy tham vọng, thật tuyệt vời khi viết về thống kê. Trân trọng.


8
This value shows how well future outcomes can be predicted by the model- điều này là vô cùng sai lệch và nghiêng về phía sai lầm . Không có gì đảm bảo rằng một hệ số xác định cao trong một mô hình nhất định liên quan đến kết quả trong tương lai sẽ được dự đoán như thế nào.
Tiên tri60091

5
Tôi nghĩ các câu như " nếu mô hình của bạn là xấuR2= =0,2 ", " mô hình của bạn rất tốt " là những khái quát chung. Nếu bất cứ điều gì cho một vấn đề trong thế giới thực, trên 0,8 sẽ khiến nghi ngờ quá mức xảy ra ...R2= =0,7-0,8R2
usεr11852 nói rằng Rebstate Monic

3
nếu = 0,2, bất kể giá trị yx, mô hình của bạn là xấu. Tôi tin rằng điểm giới hạn cho một mô hình tốt bắt đầu từ 0,6 và nếu bạn có thứ gì đó trong khoảng 0,7-0,8, mô hình của bạn là một mô hình rất tốt. Điều này phụ thuộc rất nhiều vào lĩnh vực bạn đang làm việc. Hãy tưởng tượng rằng bạn cố gắng dự đoán các chỉ số liên quan đến trao đổi ngăn xếp cho năm tới. Bạn sẽ là người đàn ông giàu nhất thế giới với là 0,2. R 2R2R2
Jan Hackenberg

Tôi đồng ý với Jan Hackenberg và Prophet60091. Các phần trong câu trả lời của bạn chắc chắn sai và tôi không hiểu tại sao đây là câu trả lời được chấp nhận và mọi người đang ủng hộ. Trên thực tế điều này có thể có nghĩa là mọi người đang sử dụng số liệu của họ mà không biết cách diễn giải chúng ..
Cord Kaldemeyer

9

Bất kể bạn đo lường Errror là gì, hãy xem xét đưa ra vectơ kết quả hoàn chỉnh của bạn trong một phụ lục. Những người thích so sánh với phương pháp của bạn nhưng thích một phép đo lỗi khác có thể lấy được giá trị như vậy từ bảng của bạn.

R2 :

  • Không phản ánh lỗi hệ thống. Hãy tưởng tượng bạn đo đường kính thay vì bán kính của các vật thể tròn. Bạn có một sự đánh giá quá cao dự kiến ​​là 100%, nhưng vẫn có thể đạt tới gần bằng 1.R2

  • Không đồng ý với những bình luận trước đó rằng rất khó hiểu. Giá trị càng cao, mô hình của bạn càng chính xác, nhưng nó có thể bao gồm các lỗi hệ thống.R2

  • Có thể được biểu thị bằng công thức dễ hiểu khi bạn xây dựng tỷ lệ tổng của phần dư bình phương và chia cho trung bình:

R2= =1-SSEmemộtn= =1-Σ(yTôi-yTôi¯)2Σ(yTôi-y¯)2

  • nên được thể hiện trong phiên bản nâng cao hơn của . Ở đây nhiều người dự đoán sẽ trừng phạt mô hình. Dự kiến ​​sẽ mạnh mẽ hơn chống lại quá mức.Rmộtdj.2

RMSE :

  • Bạn chỉ có thể đạt thấp bằng cách có cả độ chính xác cao (các ngoại lệ đơn lẻ nhưng lớn bị trừng phạt nặng) và không có lỗi hệ thống. Vì vậy, theo một cách nào đó, thấp đảm bảo chất lượng tốt hơn .RMSERMSER2

  • Số này có một đơn vị và dành cho những người không quen thuộc với dữ liệu của bạn không dễ hiểu. Ví dụ, nó có thể được chia theo giá trị trung bình của dữ liệu để tạo ra một . Hãy cẩn thận, đây không phải là định nghĩa duy nhất của . Một số người thích chia theo phạm vi dữ liệu của họ thay vì chia cho giá trị trung bình.retôi.RMSEretôi.RMSE

Như những người khác đã đề cập, sự lựa chọn có thể phụ thuộc vào lĩnh vực và trạng thái nghệ thuật của bạn. Có một phương pháp cực kỳ được chấp nhận để so sánh quá? Sử dụng phép đo giống như họ làm và bạn có thể liên kết trực tiếp các lợi ích phương pháp của mình một cách dễ dàng trong cuộc thảo luận.


7

Cả Root-mean-Square-Error (RMSE)hệ số xác định ( ) đềuR2 cung cấp thông tin khác nhau, nhưng bổ sung, cần được đánh giá khi đánh giá mô hình vật lý của bạn. Không phải là "tốt hơn", nhưng một số báo cáo có thể tập trung nhiều hơn vào một số liệu tùy thuộc vào ứng dụng cụ thể.

Tôi sẽ sử dụng những điều sau đây như một hướng dẫn rất chung để hiểu sự khác biệt giữa cả hai số liệu:

Các RMSE mang đến cho bạn một cảm giác khoảng cách giữa (hoặc xa) giá trị dự đoán của bạn là từ dữ liệu thực tế bạn đang cố gắng mô hình. Điều này hữu ích trong nhiều ứng dụng mà bạn muốn hiểu tính chính xác và chính xác của các dự đoán của mô hình của bạn (ví dụ: mô hình chiều cao của cây).

Ưu

  1. Nó tương đối dễ hiểu và giao tiếp vì các giá trị được báo cáo nằm trong cùng đơn vị với biến phụ thuộc được mô hình hóa.

Nhược điểm

  1. Nó nhạy cảm với các lỗi lớn (phạt các lỗi dự đoán lớn hơn các lỗi dự đoán nhỏ hơn).

Các hệ số xác định ( )R2 rất hữu ích khi bạn đang cố gắng để hiểu như thế nào lựa chọn biến độc lập của bạn (s) giải thích sự thay đổi trong biến phụ thuộc của bạn (s). Điều này hữu ích khi bạn đang cố gắng giải thích những yếu tố nào có thể thúc đẩy quá trình quan tâm cơ bản (ví dụ: các biến khí hậu và điều kiện đất đai liên quan đến chiều cao của cây).

Ưu

  1. Cung cấp một ý nghĩa tổng thể về mức độ các biến được chọn của bạn phù hợp với dữ liệu.

Nhược điểm

  1. Như các biến độc lập hơn được thêm vào mô hình của bạn, tăng (xem adj. hoặc Thông tin Tiêu chuẩn Akaike của như giải pháp thay thế tiềm năng).R2R2

Tất nhiên, ở trên sẽ phải tuân theo kích thước mẫu và thiết kế lấy mẫu, và một sự hiểu biết chung rằng mối tương quan không ngụ ý nhân quả.


1

Ngoài ra còn có MAE, có nghĩa là lỗi tuyệt đối. Không giống như RMSE, nó không quá nhạy cảm với các lỗi lớn. Từ những gì tôi đã đọc, một số lĩnh vực thích RMSE, những lĩnh vực khác MAE. Tôi thích sử dụng cả hai.


0

Trên thực tế, đối với các nhà khoa học thống kê nên biết sự phù hợp nhất của mô hình, thì RMSE rất quan trọng đối với những người trong nghiên cứu mạnh mẽ của mình. Nếu RMSE rất gần với 0, thì mô hình được trang bị tốt nhất.

Hệ số xác định là tốt cho các nhà khoa học khác như nông nghiệp và các lĩnh vực khác. Đó là một giá trị từ 0 đến 1. Nếu là 1, 100% giá trị khớp với các tập dữ liệu được quan sát. Nếu là 0, thì dữ liệu hoàn toàn không đồng nhất. Dr.SK.Khadar Babu, Đại học VIT, Vellore, TamilNadu, Ấn Độ.


0

Nếu một số số được thêm vào mỗi phần tử của một trong các vectơ, RMSE thay đổi. Tương tự nếu tất cả các phần tử trong một hoặc cả hai vectơ được nhân với một số. Mã R theo sau;

#RMSE vs pearson's correlation
one<-rnorm(100)
two<-one+rnorm(100)

rumis<-(two - one)^2
(RMSE<-sqrt(mean(rumis)))
cor(one,two)

oneA<-one+100

rumis<-(two - oneA)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneA,two)

oneB<-one*10
twoB<-two*10

rumis<-(twoB - oneB)^2
(RMSE<-sqrt(mean(rumis)))
cor(oneB,twoB)
cor(oneB,twoB)^2

0

Cuối cùng, sự khác biệt chỉ là tiêu chuẩn hóa vì cả hai đều dẫn đến sự lựa chọn của cùng một mô hình, bởi vì RMSE nhân số lần quan sát trong tử số hoặc bình phương R, và mẫu số của sau này là không đổi trên tất cả các mô hình (chỉ vẽ một số đo so với khác cho 10 mô hình khác nhau).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.