Lỗi cộng gộp hay lỗi nhân?


13

Tôi còn khá mới với số liệu thống kê và sẽ đánh giá cao việc giúp hiểu điều này tốt hơn.

Trong lĩnh vực của tôi có một mô hình thường được sử dụng của mẫu:

Pt= =Po(Vt)α

Khi mọi người phù hợp với mô hình với dữ liệu, họ thường tuyến tính hóa nó và phù hợp với những điều sau đây

đăng nhập(Pt)= =đăng nhập(Po)+αđăng nhập(Vt)+ε

Được không Tôi đọc được ở đâu đó rằng do nhiễu trong tín hiệu, mô hình thực tế phải là

Pt= =Po(Vt)α+ε

và điều này không thể được tuyến tính hóa như trên. Điều này có đúng không? Nếu vậy, có ai biết về một tài liệu tham khảo tôi có thể đọc và tìm hiểu thêm về nó và có thể trích dẫn trong một báo cáo?


Tôi định dạng phương trình của bạn. Vui lòng kiểm tra xem nội dung có còn như bạn dự định không (đặc biệt là về các mục đăng ký).
Andy

Bạn đã đánh dấu câu hỏi của mình bằng "lỗi đo lường" và + e trong phương trình 3 dường như là do lỗi đo lường phụ gia ngoài biến đổi ngẫu nhiên / ngẫu nhiên nhân trong phản hồi, đại loại như P * (V ^ alpha) * điểm kinh nghiệm Điều này có đúng không? Các mô hình lỗi đo lường (còn gọi là các mô hình "lỗi trong biến") thường yêu cầu một loại quy trình gồm hai bước, trong trường hợp của bạn có thể yêu cầu dữ liệu xác nhận riêng để mô tả lỗi phụ gia do "nhiễu", trong trường hợp đó có thể không có cần tuyến tính hóa phương trình.
N Brouwer

Câu trả lời:


14

Mô hình nào là phù hợp phụ thuộc vào cách biến đổi xung quanh giá trị trung bình đi vào các quan sát. Nó cũng có thể đến theo cấp số nhân hoặc cộng ... hoặc theo một cách khác.

Thậm chí có thể có một số nguồn của biến thể này, một số nguồn có thể nhập theo cấp số nhân và một số nguồn nhập phụ gia và một số theo cách không thể được mô tả là một trong hai.

Đôi khi có lý thuyết rõ ràng để thiết lập đó là phù hợp. Đôi khi cân nhắc các nguồn biến thể chính về giá trị trung bình sẽ tiết lộ một lựa chọn thích hợp. Mọi người thường không có ý tưởng rõ ràng nên sử dụng hoặc nếu một số nguồn biến thể của các loại khác nhau có thể cần thiết để mô tả đầy đủ quá trình.

Với mô hình log-linear, trong đó hồi quy tuyến tính được sử dụng:

đăng nhập(Pt)= =tôiog(Po)+αđăng nhập(Vt)+ε

mô hình hồi quy OLS giả định phương sai quy mô log không đổi, và nếu đó là trường hợp, thì dữ liệu gốc sẽ hiển thị mức tăng lan rộng về giá trị trung bình khi giá trị trung bình tăng.

Mặt khác, loại mô hình này:

Pt= =Po(Vt)α+ε

thường được trang bị bởi các bình phương tối thiểu phi tuyến và một lần nữa, nếu phương sai không đổi (mặc định cho NLS) được trang bị, thì sự chênh lệch về giá trị trung bình phải là hằng số.

nhập mô tả hình ảnh ở đây

[Bạn có thể có ấn tượng thị giác rằng mức chênh lệch đang giảm khi tăng trung bình trong hình ảnh cuối cùng; đó thực sự là một ảo ảnh gây ra bởi độ dốc ngày càng tăng - chúng ta có xu hướng đánh giá sự lan truyền trực giao với đường cong hơn là theo chiều dọc để chúng ta có ấn tượng bị bóp méo.]

Nếu bạn có mức độ lây lan gần như liên tục trên thang đo ban đầu hoặc tỷ lệ nhật ký, điều đó có thể gợi ý mô hình nào trong hai mô hình phù hợp, không phải vì nó chứng minh nó là phụ gia hay nhân, mà vì nó dẫn đến một mô tả thích hợp về mức độ lây lan cũng như nghĩa là.

Tất nhiên người ta cũng có thể có khả năng lỗi phụ gia có phương sai không đổi.

Tuy nhiên, vẫn có những mô hình khác vẫn có thể gắn các mối quan hệ chức năng như vậy có mối quan hệ khác nhau giữa giá trị trung bình và phương sai (như Poisson hoặc quasi-Poisson GLM, đã lan truyền tỷ lệ thuận với căn bậc hai của giá trị trung bình).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.