Tập dữ liệu của tôi chứa hai biến (tương quan mạnh) (thời gian chạy của thuật toán) và (số nút được kiểm tra, bất cứ điều gì). Cả hai đều có mối tương quan mạnh mẽ bởi thiết kế, bởi vì thuật toán có thể quản lý khoảng nút mỗi giây.n c
Thuật toán được chạy trên một số vấn đề, nhưng nó đã bị chấm dứt nếu một giải pháp chưa được tìm thấy sau khi một số thời gian chờ . Vì vậy, dữ liệu được kiểm duyệt đúng về biến thời gian.
Tôi vẽ hàm mật độ tích lũy ước tính (hoặc số tích lũy) của biến cho các trường hợp thuật toán đã chấm dứt với . Điều này cho thấy có bao nhiêu vấn đề có thể được giải quyết bằng cách mở rộng tại hầu hết nút và rất hữu ích để so sánh các cấu hình khác nhau của thuật toán. Nhưng trong cốt truyện cho , có những cái đuôi ngộ nghĩnh ở phía trên sẽ rất sắc nét, như có thể thấy trong hình ảnh dưới đây. So sánh ecdf cho biến , trên đó kiểm duyệt đã được thực hiện.t < T n n t
Số lượng tích lũy của
Số lượng tích lũy của
Mô phỏng
Tôi hiểu tại sao điều này xảy ra và có thể tái tạo hiệu ứng trong một mô phỏng bằng mã R sau đây . Nó gây ra bởi sự kiểm duyệt đối với một biến tương quan mạnh dưới sự bổ sung của một số nhiễu.
qplot(
Filter(function(x) (x + rnorm(1,0,1)[1]) < 5,
runif(10000,0,10)),
stat="ecdf",geom="step")
Hiện tượng này được gọi như thế nào? Tôi cần nêu trong một ấn phẩm rằng những người hâm mộ này là hiện vật của thí nghiệm và không phản ánh sự phân phối thực sự.