Có ai có kinh nghiệm với các cách tiếp cận để chọn số lượng các thành phần chính thưa thớt để đưa vào mô hình hồi quy không?
Có ai có kinh nghiệm với các cách tiếp cận để chọn số lượng các thành phần chính thưa thớt để đưa vào mô hình hồi quy không?
Câu trả lời:
Trong khi tôi không có cái nhìn sâu sắc trực tiếp về câu hỏi của bạn, tôi đã xem qua một số tài liệu nghiên cứu , có thể là mối quan tâm của bạn. Tất nhiên, đó là, nếu tôi hiểu chính xác rằng bạn đang nói về PCA thưa thớt , hồi quy thành phần chính và các chủ đề liên quan. Trong trường hợp đó, đây là các giấy tờ:
Các kết quả xác thực chéo cũng được sử dụng để xác định số lượng kích thước tối ưu cho không gian LSI. Quá ít kích thước không tận dụng được sức mạnh dự đoán của dữ liệu; trong khi quá nhiều kích thước dẫn đến phù hợp quá mức. Hình. 4 cho thấy sự phân phối các lỗi trung bình cho các mô hình có số lượng kích thước LSI khác nhau. Các mô hình có không gian LSI bốn chiều tạo ra cả số lỗi trung bình ít nhất và số lỗi trung bình ít nhất, do đó mô hình cuối cùng được xây dựng bằng không gian LSI bốn chiều.
Tôi có thể đăng một bản sao nếu bạn không phải là thành viên ieee.
Đây là từ một bài báo tôi đã viết trong sinh viên. Tôi gặp vấn đề khi cần quyết định có bao nhiêu thứ nguyên (Lập chỉ mục ngữ nghĩa tiềm ẩn tương tự PCA) để sử dụng trong mô hình hồi quy logistic của tôi. Những gì tôi đã làm là chọn một số liệu (tức là tỷ lệ lỗi khi sử dụng xác suất gắn cờ là 0,5) và xem xét phân phối cho tỷ lệ lỗi này cho các mô hình khác nhau được đào tạo trên số lượng kích thước khác nhau. Sau đó tôi chọn mô hình với tỷ lệ lỗi thấp nhất. Bạn có thể sử dụng các số liệu khác như diện tích dưới đường cong ROC.
Bạn cũng có thể sử dụng một cái gì đó như hồi quy từng bước để chọn số lượng kích thước cho bạn. Loại hồi quy nào bạn đang tạo mẫu cụ thể?
Bạn có ý nghĩa gì bởi btw thưa thớt?