pi∑pai[ln(1/pi)]b
a=0,b=0
a=2,b=01−∑p2i1/∑p2ik1/k∑p2i=k(1/k)2=1/kk
a=1,b=1Hexp(H)kH=∑k(1/k)ln[1/(1/k)]=lnkexp(H)=exp(lnk)k
Công thức được tìm thấy trong IJ Good. 1953. Tần số dân số của loài và ước tính các thông số dân số. Biometrika 40: 237-264.
www.jstor.org/urdy/2333344 .
Các cơ sở khác cho logarit (ví dụ 10 hoặc 2) đều có thể như nhau theo sở thích hoặc tiền lệ hoặc sự thuận tiện, chỉ với các biến thể đơn giản ngụ ý cho một số công thức ở trên.
Tái khám phá độc lập (hoặc sáng chế lại) biện pháp thứ hai được thể hiện qua một số nguyên tắc và các tên ở trên nằm cách xa danh sách đầy đủ.
Liên kết các biện pháp phổ biến trong một gia đình không chỉ hấp dẫn về mặt toán học. Nó nhấn mạnh rằng có một sự lựa chọn về biện pháp tùy thuộc vào các trọng số tương đối được áp dụng cho các mặt hàng khan hiếm và phổ biến, và do đó làm giảm bất kỳ ấn tượng nào về việc quảng cáo được tạo ra bởi một sự gợi ý nhỏ về các đề xuất rõ ràng tùy tiện. Tài liệu trong một số lĩnh vực bị suy yếu bởi các bài báo và thậm chí các cuốn sách dựa trên những tuyên bố khó hiểu rằng một số biện pháp được tác giả ủng hộ là biện pháp tốt nhất mà mọi người nên sử dụng.
Tính toán của tôi chỉ ra rằng các ví dụ A và B không quá khác nhau ngoại trừ biện pháp đầu tiên:
----------------------------------------------------------------------
| Shannon H exp(H) Simpson 1/Simpson #items
----------+-----------------------------------------------------------
A | 0.656 1.927 0.643 1.556 14
B | 0.684 1.981 0.630 1.588 9
----------------------------------------------------------------------
(Một số người có thể thích thú lưu ý rằng Simpson được đặt tên ở đây (Edward Hugh Simpson, 1922-) giống như được tôn vinh bởi nghịch lý của Simpson. Anh ấy đã làm rất tốt, nhưng anh ấy không phải là người đầu tiên khám phá ra điều gì anh ta được đặt tên, đến lượt nó là nghịch lý của Stigler, đến lượt nó ....)