Các phương pháp tập hợp dựa trên cây như Rừng ngẫu nhiên và các dẫn xuất tiếp theo (ví dụ, rừng có điều kiện), tất cả các mục đích đều hữu ích trong các vấn đề được gọi là "nhỏ n , p lớn ", để xác định tầm quan trọng của biến tương đối. Thật vậy, điều này dường như là trường hợp, nhưng câu hỏi của tôi là khả năng này có thể được thực hiện bao xa? Một người có thể có, nói 30 quan sát và 100 biến? Điểm đột phá của một cách tiếp cận như vậy là gì, và có bất kỳ quy tắc ngón tay cái nào tồn tại? Tôi thích và sẽ chấp nhận câu trả lời được hỗ trợ bởi các liên kết đến bằng chứng thực tế (không phải phỏng đoán), bằng cách sử dụng bộ dữ liệu mô phỏng hoặc dữ liệu thực. Tôi đã không tìm thấy nhiều về sau này ( ở đây và ở đây), vì vậy những suy nghĩ / lời khuyên của bạn / (về chủ đề) đề xuất tham khảo được hoan nghênh nhất!