Sửa lỗi cho đồng hồ phân phối bình thường


10

Tôi có một thí nghiệm được thực hiện trên hàng trăm máy tính được phân phối trên toàn thế giới để đo lường sự xuất hiện của một số sự kiện. Các sự kiện phụ thuộc vào nhau để tôi có thể sắp xếp chúng theo thứ tự tăng dần và sau đó tính toán chênh lệch thời gian.

Các sự kiện nên được phân phối theo cấp số nhân nhưng khi vẽ biểu đồ thì đây là những gì tôi nhận được:

Biểu đồ sự kiện

Sự không chính xác của đồng hồ tại các máy tính khiến một số sự kiện được chỉ định dấu thời gian sớm hơn so với sự kiện mà chúng phụ thuộc.

Tôi đang tự hỏi liệu đồng bộ hóa đồng hồ có thể bị đổ lỗi cho thực tế là đỉnh PDF không phải là 0 (mà họ đã chuyển toàn bộ sang bên phải)?

Nếu sự khác biệt của đồng hồ được phân phối bình thường, tôi có thể giả sử rằng các hiệu ứng sẽ bù cho nhau và do đó chỉ sử dụng thời gian tính toán khác nhau?

Câu trả lời:


13

Các vấn đề đồng bộ hóa đồng hồ thực sự có thể khiến đỉnh bị dịch chuyển sang phải. Các mô phỏng sau trong R cho thấy hiện tượng này. Tôi đã sử dụng thời gian theo cấp số nhân và chênh lệch đồng hồ bình thường để có được hình dạng gần giống với hình ảnh của bạn:

Đồng hồ

Phân phối ở bên trái (chênh lệch thực tế, được đo không có lỗi) có cực đại bằng 0, trong khi phân phối ở bên phải (chênh lệch đo bằng sai số) có cực đại khoảng 100.

Mã R:

set.seed(20120904)

# Generate exponential time differences:
x<-rexp(100000,1/900)

# Generate normal clock differences:
y<-rnorm(100000,0,50)

# Resulting observations:
xy<-x+y

# Truncate at 500:
xy<-xy[xy<=500]

# Plot histograms:
par(mfrow=c(1,2))
hist(x[x<=500],breaks=100,col="blue",main="Actual differences")
hist(xy,breaks=100,col="blue",main="Observed differences")
lines(c(0,0),c(0,550),col="red")

Nếu sự khác biệt đồng hồ là bình thường với trung bình 0, sự khác biệt sẽ bị loại bỏ theo nghĩa là giá trị trung bình của sự khác biệt quan sát được sẽ bằng với sự khác biệt thực tế. Đây có phải là trường hợp hay không phụ thuộc vào việc có sự khác biệt có hệ thống giữa các máy tính nơi xảy ra sự kiện đầu tiên và các máy tính xảy ra sự kiện thứ hai hay không.


4
+1 Minh họa độc đáo. Về mặt toán học, dữ liệu được rút ra từ tổng phân phối lỗi và phân phối hàm mũ (giả định). Việc ước tính phân phối lỗi và giải mã dữ liệu để ước tính phân phối thực sự là rất hấp dẫn .
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.