Số điểm tối thiểu cho hồi quy tuyến tính


15

Điều gì sẽ là một số lượng quan sát tối thiểu "hợp lý" để tìm kiếm một xu hướng theo thời gian với hồi quy tuyến tính? Điều gì về việc phù hợp với một mô hình bậc hai?

Tôi làm việc với các chỉ số tổng hợp bất bình đẳng về sức khỏe (SII, RII) và chỉ có 4 đợt khảo sát, vì vậy 4 điểm (1997,2001,2004,2008).

Tôi không phải là thống kê, nhưng tôi có ấn tượng trực quan 4 điểm là không đủ. Bạn có câu trả lời, và / hoặc tài liệu tham khảo không?

Cảm ơn rất nhiều,

Tiếng Pháp


4
Quy tắc thông thường là 10 điểm cho mỗi biến độc lập.
Peter Flom - Tái lập Monica

1
Chỉ số của bạn được đo như thế nào? Nếu chúng bao gồm các ước tính về tính biến thiên, thì hai có thể là đủ (sử dụng phép thử t hoặc phép thử tương tự). Nguyên tắc thống kê cơ bản được áp dụng ở đây là khi biến thể ngẫu nhiên là một lời giải thích không chắc chắn về những gì bạn đang quan sát, thì bạn có quyền quy bất kỳ xu hướng rõ ràng nào cho các nguyên nhân không ngẫu nhiên. Khi xu hướng mạnh, rất ít giá trị dữ liệu có thể cần thiết để đi đến kết luận như vậy, tất cả các "quy tắc ngón tay cái" chung chung đều không có.
whuber

Câu trả lời:


11

Quy tắc Peters của ngón tay cái 10 mỗi đồng biến là một quy tắc hợp lý. Một đường thẳng có thể phù hợp hoàn hảo với bất kỳ hai điểm nào, bất kể lượng nhiễu trong các giá trị đáp ứng và một phương trình bậc hai có thể phù hợp hoàn hảo chỉ với 3 điểm. Vì vậy, rõ ràng trong hầu hết mọi trường hợp, sẽ là đúng khi nói rằng 4 điểm là không đủ. Tuy nhiên, giống như hầu hết các quy tắc của ngón tay cái, nó không bao gồm mọi tình huống. Các trường hợp thuật ngữ nhiễu trong mô hình có phương sai lớn sẽ yêu cầu nhiều mẫu hơn so với trường hợp tương tự có phương sai sai số nhỏ.

Số lượng điểm mẫu yêu cầu không phụ thuộc vào đối tượng. Nếu bạn đang thực hiện phân tích thăm dò chỉ để xem liệu một mô hình (nói tuyến tính trong một hiệp phương sai) trông tốt hơn mô hình khác (giả sử một hàm bậc hai của hiệp phương sai) có thể đủ dưới 10 điểm. Nhưng nếu bạn muốn ước tính rất chính xác về các hệ số tương quan và hồi quy cho các hiệp phương sai, bạn có thể cần nhiều hơn 10 cho mỗi hiệp phương sai. Độ chính xác của tiêu chí dự đoán có thể yêu cầu nhiều mẫu hơn so với ước tính tham số chính xác. Lưu ý rằng phương sai của các ước tính và dự đoán đều liên quan đến phương sai của thuật ngữ lỗi mô hình.


Điểm tốt, Michael; Tôi đã cố gắng để giữ cho nó đơn giản. :-). Với chủ đề của câu hỏi ban đầu, tôi sẽ rất ngạc nhiên nếu dưới 10 điểm là đủ. Các biện pháp bất bình đẳng về sức khỏe dường như có rất nhiều lỗi và mối quan hệ với thời gian dường như không có tính tuyến tính cao. Bạn có biết bất kỳ bài viết về điều này? Đó là một chủ đề thú vị xuất hiện rất nhiều.
Peter Flom - Tái lập Monica

@PeterFlom Tôi không có. Tôi sẽ xem cuốn sách của van Belle'a về các quy tắc thống kê để xem liệu anh ta có sử dụng quy tắc như quy tắc mà bạn đã đề cập hay không. Điều tốt đẹp về cuốn sách của ông là ông giải thích lý do căn bản đằng sau mọi quy tắc. Tôi đồng ý với bạn rằng một quy tắc nói rằng mất ít nhất 10 mỗi đồng biến là khá tốt và sử dụng ít hơn sẽ hiếm khi an toàn trừ một số trường hợp thăm dò. Trong các ngành khoa học sức khỏe nơi tôi làm việc, thuật ngữ tiếng ồn dường như luôn lớn nhưng có lẽ một số thí nghiệm vật lý hoặc kỹ thuật được kiểm soát chặt chẽ có thể có các phép đo rất chính xác và do đó sai số ngẫu nhiên nhỏ.
Michael R. Chernick

Tôi chỉ cố gắng chỉ ra khả năng có tiếng ồn nhỏ dẫn đến cần ít hơn 10 điểm mặc dù khả năng đó có thể là từ xa.
Michael R. Chernick

R2

+1, thông tin tốt, nhưng cũng cần đề cập rằng nếu công cụ ước tính của bạn không thiên vị, bạn có thể có một mô hình bão hòa và vẫn có ước tính các tham số, nếu đó là tất cả những gì bạn cần. Bạn sẽ không có ước tính về tính biến đổi hoặc có thể suy luận. Tuy nhiên, trong một số trường hợp có nhiều hiệu ứng để ước tính & dữ liệu đủ khó để có được, các mô hình bão hòa đôi khi được sử dụng. Vì vậy, ví dụ, trong trường hợp này, bạn có thể có được ước tính của hàm w / bậc hai w / 3 điểm. Tôi không nhất thiết có nghĩa rằng đó là một điều tốt, nhưng đó là giới hạn thực sự thấp hơn & lý do tại sao.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.