Thử nghiệm cho Luật Benford trong thời gian thực


7

Giả sử tôi có dữ liệu của một số lượng nhất định , được cho bởi . Bây giờ, tôi lấy chữ số đầu tiên của mỗi đại lượng và tôi muốn nghiên cứu mối quan hệ giữa phân phối theo kinh nghiệm của các chữ số đầu tiên trong đó là tần số bình thường hóa của là chữ số đầu tiên và định luật benford Bây giờ, tôi đã đọc bài báo nàyXx1,...,xndixip^=(p^1,...,p^n)pi^i

pi=log10(1+1/i)
về vấn đề so sánh tần số thực nghiệm của các chữ số đầu tiên so với luật benford. Tuy nhiên, họ không đề cập đến việc liệu các phương pháp mà họ đề cập có thể được sử dụng để có thể từ chối luật benford với độ tin cậy nhất định trong thời gian thực hay không, nơi dữ liệu đến với tần suất nhất định (như, giả sử, 50 dữ liệu mỗi giây).

Tôi nghĩ rằng các phương pháp này có thể được áp dụng để so sánh theo thời gian thực với luật benford theo cách sau: trong một khoảng thời gian (nhỏ) (giả sử là 3 giây), chúng tôi tính toán các kết quả kinh nghiệm của các chữ số đầu tiên và sau đó chúng tôi tính toán khoảng tin cậy đồng thời và giá trị của các thống kê được hiển thị trong tài liệu tham khảo mà tôi đã đề cập trước đây (chúng tôi phải đảm bảo có cỡ mẫu ít nhất là 60 dữ liệu, do đó việc phân phối các số liệu thống kê nên được tương đối gần với phân phối tiệm cận, do đó tính -values nên đáng tin cậy).p^=(p^1,...,p^n)pp

Câu hỏi của tôi là, đây có phải là một thủ tục hợp lệ? Liệu nó có ý nghĩa? Nếu không, có một số phương pháp hợp lý để so sánh phân phối chữ số đầu tiên theo kinh nghiệm với luật benford trong thời gian thực?

Một vấn đề tiềm năng tôi thấy là phân phối cơ bản của các chữ số đầu tiên có thể thay đổi trong một cửa sổ thời gian nhất định (thậm chí nhiều hơn một lần). Đó là lý do tại sao tôi nghĩ nên sử dụng các cửa sổ thời gian tương đối nhỏ để có kích thước mẫu khá, đồng thời giảm tỷ lệ phân phối cơ bản của các chữ số đầu tiên có thể thay đổi.


3
+1 Đó là một câu hỏi hay - nhưng quy trình đề xuất không hợp lệ. Khoảng tin cậy không thể được sử dụng cho các bài kiểm tra tuần tự; họ sẽ đưa ra quá nhiều báo động sai.
whuber

@ xin cảm ơn! Vì vậy, tôi cho rằng sự tốt đẹp của các bài kiểm tra phù hợp cũng sẽ không hợp lệ trong trường hợp này, vì lý do tương tự?
Sông Nate

Vâng, tôi nghĩ điều đó đúng.
whuber

1
Trực giác ban đầu của tôi là một cách tiếp cận Bayes nào đó sẽ tự nhiên nhất? Ví dụ. Các kỹ thuật Bayes đã được Jean Baptiste Eugène Estienne sử dụng để thử các lô đạn trong khi lãng phí ít đạn hơn. Ít hộp mực bị lãng phí sẽ tương ứng lỏng lẻo với ít thời gian hơn trong vấn đề của bạn.
Matthew Gunn

Bạn có thể tìm thấy một số giá trị trong việc khám phá phân tích tuần tự , liên quan đến các vấn đề kiểm tra nối tiếp.
Glen_b -Reinstate Monica

Câu trả lời:


0

Sambridge và cộng sự. (2010) phác thảo một phương pháp đánh giá sự phù hợp của dữ liệu chuỗi thời gian theo luật của Benford. Mặc dù trường hợp sử dụng của bạn hơi khác một chút, nhưng nó cũng có thể phù hợp với bạn.

Phương pháp của họ hoạt động như bạn mô tả về cơ bản: nhóm dữ liệu của bạn vào các cửa sổ quan sát và kiểm tra từng cửa sổ về sự phù hợp. Phương pháp này đã được sử dụng (và xuất bản) bởi cùng các tác giả trong các bài viết khác, vì vậy ít nhất nó cũng đủ âm thanh để vượt qua đánh giá ngang hàng một vài lần.

Mặc dù họ có những biện pháp phù hợp riêng, nhưng tôi không thấy bất kỳ lý do nào khiến bạn không thể sử dụng bất kỳ biện pháp nào thường hoạt động để phân tích benford. Bạn sẽ muốn chắc chắn rằng thước đo của bạn có các thuộc tính tốt cho cửa sổ hoặc cỡ mẫu bạn đã chọn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.