Giả sử người ta thực hiện cái gọi là bootstrap không tham số bằng cách vẽ các mẫu có kích thước n mỗi mẫu từ các quan sát n ban đầu với sự thay thế. Tôi tin rằng thủ tục này tương đương với việc ước tính hàm phân phối tích lũy theo cdf theo kinh nghiệm:
http://en.wikipedia.org/wiki/Empirical_distribution_feft
và sau đó lấy các mẫu bootstrap bằng cách mô phỏng quan sát từ cdf B ước tính liên tiếp.
Nếu tôi đúng trong vấn đề này, thì người ta phải giải quyết vấn đề quá mức, bởi vì cdf thực nghiệm có khoảng N tham số. Tất nhiên, không có triệu chứng, nó hội tụ đến cdf dân số, nhưng còn các mẫu hữu hạn thì sao? Ví dụ nếu tôi nói với bạn rằng tôi có 100 quan sát và tôi sẽ ước tính lũy như với hai tham số, bạn sẽ không lo lắng. Tuy nhiên, nếu số lượng tham số lên tới 100, có vẻ như không hợp lý chút nào.
Tương tự như vậy, khi một người sử dụng một bội số hồi quy tuyến tính tiêu chuẩn, sự phân bố của số hạng sai số được ước tính như . Nếu một người quyết định chuyển sang bootstrapping phần dư, anh ta phải nhận ra rằng bây giờ có khoảng n tham số được sử dụng chỉ để xử lý phân phối thuật ngữ lỗi.
Bạn có thể vui lòng hướng dẫn tôi đến một số nguồn giải quyết vấn đề này một cách rõ ràng hoặc cho tôi biết lý do tại sao nó không phải là vấn đề nếu bạn nghĩ rằng tôi đã hiểu sai.