Giả sử tôi có dữ liệu của một số lượng nhất định , được cho bởi . Bây giờ, tôi lấy chữ số đầu tiên của mỗi đại lượng và tôi muốn nghiên cứu mối quan hệ giữa phân phối theo kinh nghiệm của các chữ số đầu tiên trong đó là tần số bình thường hóa của là chữ số đầu tiên và định luật benford Bây giờ, tôi đã đọc bài báo này
Tôi nghĩ rằng các phương pháp này có thể được áp dụng để so sánh theo thời gian thực với luật benford theo cách sau: trong một khoảng thời gian (nhỏ) (giả sử là 3 giây), chúng tôi tính toán các kết quả kinh nghiệm của các chữ số đầu tiên và sau đó chúng tôi tính toán khoảng tin cậy đồng thời và giá trị của các thống kê được hiển thị trong tài liệu tham khảo mà tôi đã đề cập trước đây (chúng tôi phải đảm bảo có cỡ mẫu ít nhất là 60 dữ liệu, do đó việc phân phối các số liệu thống kê nên được tương đối gần với phân phối tiệm cận, do đó tính -values nên đáng tin cậy).
Câu hỏi của tôi là, đây có phải là một thủ tục hợp lệ? Liệu nó có ý nghĩa? Nếu không, có một số phương pháp hợp lý để so sánh phân phối chữ số đầu tiên theo kinh nghiệm với luật benford trong thời gian thực?
Một vấn đề tiềm năng tôi thấy là phân phối cơ bản của các chữ số đầu tiên có thể thay đổi trong một cửa sổ thời gian nhất định (thậm chí nhiều hơn một lần). Đó là lý do tại sao tôi nghĩ nên sử dụng các cửa sổ thời gian tương đối nhỏ để có kích thước mẫu khá, đồng thời giảm tỷ lệ phân phối cơ bản của các chữ số đầu tiên có thể thay đổi.