Vì vậy, tôi đã đọc một vài bài viết về việc tại sao di chuyển chuột nên luôn luôn phải tránh. Một tài liệu tham khảo phổ biến cho tuyên bố đó là liên kết này .
Nơi nghỉ ngơi chính là các điểm tạo thùng (hoặc các điểm cắt) khá tùy tiện cũng như việc mất thông tin, và nên ưu tiên các spline đó.
Tuy nhiên, tôi hiện đang làm việc với API Spotify, có một loạt các biện pháp tự tin liên tục cho một số tính năng của chúng.
Nhìn vào một tính năng, "tính công cụ", trạng thái tham chiếu:
Dự đoán liệu một bài hát không có giọng hát. Âm thanh của âm thanh trẻ em và âm thanh của người Hồi giáo được coi là công cụ trong bối cảnh này. Bản nhạc rap hay lời nói rõ ràng là giọng hát của người Viking. Giá trị của nhạc cụ càng gần với 1.0, khả năng bản nhạc không chứa nội dung giọng hát càng lớn. Các giá trị trên 0,5 được dự định đại diện cho các bản nhạc cụ , nhưng độ tin cậy cao hơn khi giá trị tiếp cận 1.0.
Do phân phối dữ liệu của tôi rất sai lệch (khoảng 90% số mẫu chỉ trên 0, tôi thấy việc chuyển đổi tính năng này thành hai tính năng phân loại: "công cụ" (tất cả các mẫu có giá trị trên 0,5) và "không_instrumental" "(Cho tất cả các mẫu có giá trị dưới 0,5).
Điều này có sai không? Và điều gì sẽ là sự thay thế, khi gần như tất cả dữ liệu (liên tục) của tôi đang xoay quanh một giá trị duy nhất? Từ những gì tôi hiểu về spline, chúng cũng sẽ không hoạt động với các vấn đề phân loại (những gì tôi đang làm).