Câu trả lời tầm thường là nhiều dữ liệu luôn được ưu tiên hơn ít dữ liệu hơn.
Vấn đề kích thước mẫu nhỏ là rõ ràng. Trong hồi quy tuyến tính (OLS) về mặt kỹ thuật, bạn có thể phù hợp với một mô hình như OLS trong đó n = k + 1 nhưng bạn sẽ nhận được rác từ đó tức là các lỗi tiêu chuẩn rất lớn. Có một bài viết tuyệt vời của Arthur Goldberger có tên là Micronumerocity về chủ đề này được tóm tắt trong chương 23 của cuốn sách A Course in Kinh tế lượng .
Một heuristic phổ biến là bạn nên có 20 quan sát cho mỗi tham số bạn muốn ước tính. Nó luôn luôn là một sự đánh đổi giữa kích thước của các lỗi tiêu chuẩn của bạn (và do đó kiểm tra ý nghĩa) và kích thước của mẫu của bạn. Đây là một lý do khiến một số người trong chúng ta ghét thử nghiệm ý nghĩa vì bạn có thể nhận được một lỗi tiêu chuẩn cực kỳ nhỏ (tương đối) với một mẫu rất lớn và do đó tìm thấy ý nghĩa thống kê vô nghĩa đối với các thử nghiệm ngây thơ như liệu hệ số hồi quy có bằng không.
Mặc dù cỡ mẫu là quan trọng, chất lượng mẫu của bạn quan trọng hơn, ví dụ mẫu có thể chung cho dân số hay không, đó là Mẫu ngẫu nhiên đơn giản hay một số phương pháp lấy mẫu thích hợp khác (và đã được tính đến trong quá trình phân tích), có phải là lỗi đo lường không , phản ứng thiên vị, lựa chọn thiên vị, vv