Bây giờ, tôi hiểu rằng điều này phụ thuộc vào phân phối và tính quy tắc trong các yếu tố dự đoán
chuyển đổi bản ghi làm cho dữ liệu thống nhất hơn
Như một tuyên bố chung, điều này là sai --- nhưng ngay cả khi đó là trường hợp, tại sao tính đồng nhất lại quan trọng?
Hãy xem xét, ví dụ,
i) một công cụ dự đoán nhị phân chỉ lấy các giá trị 1 và 2. Lấy nhật ký sẽ để nó như một công cụ dự đoán nhị phân chỉ lấy các giá trị 0 và nhật ký 2. Nó không thực sự ảnh hưởng đến bất cứ điều gì ngoại trừ việc chặn và chia tỷ lệ các thuật ngữ liên quan đến công cụ dự đoán này. Ngay cả giá trị p của bộ dự đoán cũng sẽ không thay đổi, cũng như các giá trị được trang bị.
ii) xem xét một công cụ dự đoán lệch trái. Bây giờ lấy nhật ký. Nó thường trở nên lệch trái hơn.
iii) dữ liệu thống nhất trở nên lệch trái
(mặc dù thường không phải lúc nào cũng cực kỳ thay đổi)
ít bị ảnh hưởng bởi các ngoại lệ
Như một tuyên bố chung, điều này là sai. Xem xét các ngoại lệ thấp trong một công cụ dự đoán.
Tôi nghĩ về việc chuyển đổi nhật ký tất cả các biến liên tục của tôi không phải là mối quan tâm chính
Để kết thúc? Nếu ban đầu các mối quan hệ là tuyến tính, chúng sẽ không còn.
Và nếu chúng đã bị cong, làm điều này tự động có thể làm cho chúng tệ hơn (cong hơn), không tốt hơn.
-
Ghi nhật ký của một người dự đoán (dù có quan tâm chính hay không) đôi khi có thể phù hợp, nhưng không phải lúc nào cũng như vậy.