Đây là một số bối cảnh. Tôi quan tâm đến việc xác định hai biến môi trường (nhiệt độ, mức dinh dưỡng) ảnh hưởng đến giá trị trung bình của biến phản ứng trong khoảng thời gian 11 năm. Trong mỗi năm, có dữ liệu từ hơn 100 nghìn địa điểm.
Mục tiêu là để xác định xem, trong khoảng thời gian 11 năm, giá trị trung bình của các biến phản ứng có phản ứng với những thay đổi của các biến môi trường hay không (ví dụ nhiệt độ ấm hơn + nhiều chất dinh dưỡng hơn = phản ứng lớn hơn).
Thật không may, vì đáp ứng là giá trị trung bình (không nhìn vào giá trị trung bình, chỉ cần biến đổi giữa các năm thông thường sẽ tràn vào tín hiệu), hồi quy sẽ là 11 điểm dữ liệu (1 giá trị trung bình mỗi năm), với 2 biến giải thích. Đối với tôi, ngay cả một hồi quy dương tuyến tính cũng khó có thể coi là có ý nghĩa khi bộ dữ liệu quá nhỏ (thậm chí không đáp ứng được 40 điểm / biến danh nghĩa trừ khi mối quan hệ là siêu mạnh).
Tôi có đúng không khi đưa ra giả định này? Bất cứ ai có thể đưa ra bất kỳ suy nghĩ / quan điểm khác mà tôi có thể bị mất?
PS: Một số cảnh báo: Không có cách nào để có được nhiều dữ liệu hơn mà không phải chờ thêm năm. Vì vậy, dữ liệu có sẵn là những gì chúng ta thực sự phải làm việc với.