Có bất kỳ chuỗi số được tạo trước với các thuộc tính thống kê đã biết?


8

Tôi đang cố gắng kiểm tra một chương trình tuyên bố để tính toán một số thuộc tính thống kê của một chuỗi số (như trung bình, trung bình, độ lệch chuẩn, v.v.). Trình tự đơn giản và ngắn vượt qua bài kiểm tra tốt, nhưng tôi muốn thử thách chương trình với trình tự dài hoặc trình tự có giá trị lớn và nhỏ (để kiểm tra tràn / tràn), v.v., vậy, có phần mềm hoặc tài nguyên trực tuyến nào khác không nguồn của các chuỗi số khác nhau với các thuộc tính thống kê đã biết?

Câu trả lời:


9

Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ có một bộ Dữ liệu Tham chiếu Thống kê "cung cấp các bộ dữ liệu tham chiếu với các giá trị được chứng nhận cho nhiều phương pháp thống kê", bao gồm một bộ có nhãn 'thống kê tóm tắt đơn biến' với các giá trị được chứng nhận cho giá trị trung bình, độ lệch chuẩn và độ trễ tự động 1.

Nó dường như không bao gồm các giá trị của trung vị, nhưng tính toán chính xác của trung vị không phải là một vấn đề. Tính toán hiệu quả của trung vị mẫu khó hơn một chút.


Những bộ dữ liệu đó dường như khá ngắn - nhiều nhất là hàng ngàn giá trị. Có các chuỗi dài và các chuỗi với một số giá trị cực đoan để kiểm tra độ tràn và mất độ chính xác không? Ngoài ra, có các thuộc tính thống kê của "thứ tự cao hơn" có sẵn cho các bộ này, như độ lệch, kurtosis, vv?
mbaitoff

1

Bạn có thể lấy hộp công cụ thống kê yêu thích của mình (của tôi là R) và sử dụng nó để bắt đầu tạo thời gian dài của dữ liệu. Trong R chẳng hạn, có thể tạo dữ liệu từ tất cả các loại phân phối. Bằng cách này, bạn có thể xác nhận rằng chương trình này bạn đang kiểm tra phù hợp với chương trình thống kê khác của bạn. Điều đó chỉ so sánh hiệu suất với ví dụ R, nhưng tôi tin tưởng R về vấn đề này :).


Tôi đang tìm kiếm không chỉ các chuỗi, mà còn cho các chuỗi với những cạm bẫy có thể. Các loại phân phối không liên quan nhiều ở đây.
mbaitoff
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.