Hồi quy thông qua nguồn gốc


9

Chúng tôi có các điểm sau: Làm thế nào chúng ta có thể tìm thấy đường phù hợp nhất y = a x qua các điểm? Máy tính của tôi có tùy chọn để tìm dòng phù hợp nhất y = a x + b thông qua các điểm này, đó là:

(0,0)(1,51.8)(1.9,101.3)(2.8,148.4)(3.7,201.5)(4.7,251.1)(5.6,302.3)(6.6,350.9)(7.5,397.1)(8.5,452.5)(9.3,496.3)
y= =mộtxy= =mộtx+b

y= =53,28x+0,37

Làm thế nào tôi có thể tìm thấy sự phù hợp tốt nhất ? Dường như với tôi, chúng ta không thể loại bỏ 0,37 mà không bù vào a ?y= =mộtx0,37một


2
Có một số lý do tại sao bạn muốn? Việc ngăn chặn việc chặn dẫn đến một mô hình sai lệch trừ khi việc chặn chính xác bằng 0 đến các vị trí thập phân vô hạn. Thậm chí sau đó, bạn không đạt được nhiều hiệu quả.
gung - Phục hồi Monica

1
Đây là kết quả của một thí nghiệm vật lý. Nếu nó có y-chặn, Nó sẽ dẫn đến những thứ hoàn toàn không chính xác.
EdwardHarrison

@gung Điều đó có nghĩa là chúng ta chỉ cần loại bỏ ? 0,37
EdwardHarrison

5
"Loại bỏ chặn" không có nghĩa là chỉ cần xóa ước tính khỏi mô hình của bạn, nó có nghĩa là khớp một mô hình thông qua một công thức khác để ép buộc dòng đi qua gốc.
gung - Phục hồi Monica

6
"thí nghiệm vật lý. [...] y-chặn [...] sẽ dẫn đến những thứ hoàn toàn không chính xác." Nhưng nếu dữ liệu thử nghiệm chỉ ra một phần chặn (btw, bạn có thể kiểm tra xem khoảng tin cậy của dòng có bao gồm nguồn gốc hay không), điều này sẽ khiến tôi suy nghĩ rất kỹ về việc phần bị chặn xuất phát từ đâu. Tôi là nhà hóa học phân tích. Trong hóa học phân tích, chúng ta cũng có một loạt các mối quan hệ nên tuyến tính mà không bị chặn. Nhưng họ hầu như không bao giờ trong thực tế, bởi vì các chi tiết khó chịu của các dụng cụ và phép đo. Vì vậy, chúng tôi thường thấy việc ngăn chặn việc đánh chặn là một ý tưởng rất tồi.
cbeleites không hài lòng với SX

Câu trả lời:



10

@gung đã đưa ra ước tính OLS. Đó là những gì bạn đang tìm kiếm.

Tuy nhiên, khi xử lý các đại lượng vật lý mà dòng phải đi qua gốc tọa độ, thì tỷ lệ lỗi sẽ thay đổi theo các giá trị x (có, khoảng, không đổi, không đổi lỗi tương đối ). Trong tình huống đó, bình phương tối thiểu không trọng số thông thường sẽ không phù hợp.

Trong tình huống đó, một cách tiếp cận (trong một số khả năng) sẽ là lấy nhật ký, trừ đi x của y và ước tính độ dốc log (của các biến ban đầu) bằng giá trị trung bình của các khác biệt.

Ngoài ra, bình phương tối thiểu có thể được sử dụng. Trong trường hợp sai số tương đối không đổi, nó sẽ làm giảm việc sử dụng các ước lượng β = 1β^= =1NΣTôi= =1NyTôixTôi (trung bình của tất cả các độ dốc thông qua gốc tọa độ).

Có nhiều cách tiếp cận khác (ví dụ GLM), nhưng nếu bạn đang thực hiện nó trên máy tính, tôi sẽ nghiêng về đề xuất đầu tiên của tôi.

Bạn cũng nên xem xét sự phù hợp của bất kỳ giả định nào bạn đưa ra.


Tôi nghĩ rằng có thể được hướng dẫn để thêm đạo hàm của dòng WLS thông qua nguồn gốc và sau đó "trung bình của độ dốc" và gungs OLS là những trường hợp đặc biệt:

yTôi= =βxTôi+εTôi,Var(εTôi)= =wTôiσ2

S= =ΣTôiwTôi(yTôi-βxTôi)2

Sβ= =-ΣTôi2xTôi.wTôi(yTôi-βxTôi)

Đặt bằng 0 để có được giải pháp LS β^ΣwTôixTôiyTôi= =β^ΣwTôixTôi2β^= =ΣwTôixTôiyTôiΣwTôixTôi2 .

wTôiα1Tôi

wTôiα1/xTôi2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.