Có một trường hợp tốt để có số lượng thùng lớn, ví dụ như thùng cho mọi giá trị có thể, bất cứ khi nào người ta nghi ngờ rằng chi tiết của biểu đồ sẽ không bị nhiễu, nhưng cấu trúc tốt thú vị hoặc quan trọng.
Điều này không liên quan trực tiếp đến động lực chính xác cho câu hỏi này, muốn có một quy tắc tự động cho một số thùng tối ưu, nhưng nó có liên quan đến toàn bộ câu hỏi.
Hãy để chúng tôi nhảy ngay lập tức để ví dụ. Trong vòng tròn nhân khẩu học của các lứa tuổi được báo cáo là phổ biến, đặc biệt nhưng không chỉ ở các quốc gia có trình độ hiểu biết hạn chế. Điều có thể xảy ra là nhiều người không biết ngày sinh chính xác của họ, hoặc có những lý do xã hội hoặc cá nhân hoặc vì nói quá hoặc để phóng đại tuổi của họ. Lịch sử quân sự có đầy đủ các ví dụ về những người nói dối về tuổi của họ hoặc để tránh hoặc tìm kiếm sự phục vụ trong các lực lượng vũ trang. Thật vậy, nhiều độc giả sẽ biết ai đó rất nhút nhát hoặc nói cách khác là không hoàn toàn trung thực về tuổi của họ, ngay cả khi họ không nói dối về điều tra dân số. Kết quả thực tế khác nhau nhưng như đã ngụ ý thường là làm tròn, ví dụ: độ tuổi kết thúc bằng 0 và 5 phổ biến hơn nhiều so với độ tuổi một năm trở lên.
∘⋯
Ngẫu nhiên, nhìn vào các chữ số cuối cùng của dữ liệu được báo cáo là một phương pháp đơn giản và tốt để kiểm tra dữ liệu bịa đặt, một cách dễ hiểu và ít vấn đề hơn so với việc xem xét kỹ lưỡng các chữ số đầu tiên hiện nay có kháng cáo với Luật Benford.
Kết quả cuối cùng cho biểu đồ nên rõ ràng. Một bài thuyết trình giống như đột biến có thể phục vụ để hiển thị, hoặc nói chung hơn để kiểm tra, loại cấu trúc tốt này. Đương nhiên, nếu không có gì đáng quan tâm, biểu đồ có thể ít được sử dụng.
Một ví dụ cho thấy tuổi tác tăng lên từ cuộc điều tra dân số Ghana năm 1960. Xem http://www.stata.com/manuals13/rspikeplot.pdf
Đã có một đánh giá tốt về phân phối các chữ số cuối cùng trong
Preece, DA 1981. Phân phối các chữ số cuối cùng trong dữ liệu. Thống kê 30: 31-60.
Một lưu ý về thuật ngữ: một số người viết về các giá trị duy nhất của một biến khi họ sẽ nói tốt hơn về các giá trị riêng biệt của một biến. Từ điển và hướng dẫn sử dụng vẫn khuyên rằng "duy nhất" có nghĩa là chỉ xảy ra một lần. Do đó, độ tuổi được báo cáo riêng biệt của một dân số có thể là, trong các năm, 0, 1, 2, v.v. nhưng phần lớn các độ tuổi đó sẽ không phải là duy nhất đối với một người.