Tôi đang cố gắng đưa ra một số liệu để đo lường sự không đồng đều của phân phối cho một thử nghiệm tôi đang chạy. Tôi có một biến ngẫu nhiên nên được phân phối đồng đều trong hầu hết các trường hợp và tôi muốn có thể xác định (và có thể đo lường mức độ) của các tập dữ liệu trong đó biến không được phân phối đồng đều trong một số lề.
Một ví dụ về ba chuỗi dữ liệu, mỗi chuỗi có 10 phép đo đại diện cho tần suất xuất hiện của thứ gì đó mà tôi đang đo có thể giống như thế này:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
Tôi muốn có thể phân biệt các phân phối như c với các phân phối như a và b và đo độ lệch của c so với phân phối đồng đều. Tương tự, nếu có một số liệu về mức độ phân phối đồng đều (độ lệch chuẩn gần bằng 0?), Có lẽ tôi có thể sử dụng số liệu đó để phân biệt các phân phối có phương sai cao. Tuy nhiên, dữ liệu của tôi có thể chỉ có một hoặc hai ngoại lệ, như ví dụ c ở trên và không chắc chắn liệu điều đó có dễ dàng phát hiện theo cách đó hay không.
Tôi có thể hack một cái gì đó để làm điều này trong phần mềm, nhưng đang tìm kiếm các phương pháp / phương pháp thống kê để biện minh cho việc này một cách chính thức. Tôi đã tham gia một lớp học nhiều năm trước, nhưng số liệu thống kê không phải là lĩnh vực của tôi. Điều này có vẻ như một cái gì đó nên có một cách tiếp cận nổi tiếng. Xin lỗi nếu bất kỳ điều này là hoàn toàn đầu xương. Cảm ơn trước!