Chúng ta hãy xem xét hai biến ( , Y i ). Khi bạn nói bin dữ liệu, và bạn "bin" trên X i , làm bạn có nghĩa là lặp lại phép đo cho chính xác giống X i để có được tương ứng Y ' i giá trị? Nếu bạn lặp lại các phép đo như thế này, thì lỗi trên mức trung bình sẽ giảm với √XTôiYTôiXTôiXTôiY'Tôi , và tôi nghĩ bạn có thể tự do làm bất cứ điều gì bạn muốn với nó. Chỉ cần đảm bảo rằng bạn đang sử dụng hệ số tương quan trọng số nếu bạn xem xét các điểm dữ liệu với các thanh lỗi rất khác nhau.n--√
Bây giờ chúng ta hãy nói rằng bạn đang không lặp lại phép đo của , nhưng thay vì xem xét X i ± δ và tương ứng Y i ± δ ' và di chuyển chuột trên δ và có được giá trị binned trong δ . Tôi nghĩ trong tình huống này, giải pháp sẽ phụ thuộc vào mối quan hệ giữa kích thước của thùng, sai số trên phép đo và độ dốc của mối tương quan. Tôi hy vọng rằng nếu cả hai δ và nhỏ, tình hình sẽ tương tự như đoạn trước. Mặt khác, nó có thể có lợi cho bin hoặc không; nó sẽ thay đổi kết quả vì cov (XTôiXTôi± deltaYTôi± delta'δδδX i , b i n Y i , b i nδỎiXi , b i n, ) sẽ khác với các giá trị không được lưu trữ, nhưng tôi nghĩ rằng nó vẫn hợp lệ để làm điều đó. Tôi nghĩ rằng bạn không phá vỡ bất kỳ giả định nào; Tôi chỉ chắc chắn rằng sẽ thuận lợi khi làm như vậy và tôi sẽ kiểm tra tầm quan trọng của nó thông qua thử nghiệm hoán vị (để tránh đưa ra bất kỳ giả định nào về phân phối hệ số).Yi , b i n