Sự khác biệt giữa một mã hóa nóng và loại bỏ một mã hóa là gì?


13

Tôi đang đọc một bài thuyết trình và nó khuyên bạn không nên sử dụng một mã hóa ngoài, nhưng nó ổn với một mã hóa nóng. Tôi nghĩ cả hai đều giống nhau. Bất cứ ai có thể mô tả sự khác biệt giữa chúng là gì?


1
Không rõ ràng (chỉ từ câu hỏi của bạn) ngay cả khi rời khỏi là gì. Bạn nên chỉnh sửa điều này để đưa ra một con trỏ và giải thích ngắn gọn sự hiểu biết của bạn về hai người, và tại sao bạn nghĩ rằng chúng giống nhau.
Sean Owen

Câu trả lời:


15

Có lẽ họ đang sử dụng "bỏ một mã hóa" để chỉ chiến lược của Owen Zhang.

Từ: https://www.kaggle.com/c/caterpillar-Tube-pricing/forums/t/15748/strargeties-to-encode-c sortical-biến-with-many-c chuyên mục

Cột được mã hóa không phải là một biến giả thông thường, mà thay vào đó là phản hồi trung bình trên tất cả các hàng cho cấp độ phân loại này, ngoại trừ chính hàng đó. Điều này mang lại cho bạn lợi thế của việc có một đại diện một cột của phân loại trong khi tránh rò rỉ phản hồi trực tiếp

Bức tranh này thể hiện ý tưởng tốt. nhập mô tả hình ảnh ở đây


Lời giải thích của bạn tốt hơn wacax trong liên kết được giới thiệu, cảm ơn bạn
Allan Ruin

Xin chào @Dex Groves, vậy mã hóa left_one thừng cho bài kiểm tra luôn là 0,5?
dùng7117436

3
Chào! Như được thấy từ hình ảnh, ví dụ paticular này liên quan đến vấn đề phân loại. Có ai có kinh nghiệm về mã hóa LOO trong vấn đề hồi quy không? Câu hỏi chính là làm thế nào để tổng hợp các biến mục tiêu. Bây giờ tôi đang thực hiện các thí nghiệm và nhận được quá nhiều với giá trị trung bình (y).
Alexey Trofimov

1
đối với một vấn đề phân cụm (không được giám sát), có thể sử dụng loại mã hóa này không?
enneppi

@AlexeyTrofimov - thử tổng hợp với phương sai thấp hơn. Tôi muốn bắt đầu với di chuyển chuột khác nhau (như 1K, 2K, 2M, .. cho các giá trị lớn y int, hoặc một số làm tròn đến một nơi thập phân cho các giá trị float y) => bình (bin_f (y))
Mork
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.