Tôi có một mẫu có trọng số, mà tôi muốn tính toán lượng tử. 1
Lý tưởng nhất, trong đó các trọng đều bình đẳng (cho dù = 1 hay cách khác), kết quả sẽ là phù hợp với những người trong scipy.stats.scoreatpercentile()
và R của quantile(...,type=7)
.
Một cách tiếp cận đơn giản là "nhân ra" mẫu bằng cách sử dụng các trọng số đã cho. Điều đó thực sự mang lại một ecdf "phẳng" cục bộ trong các khu vực có trọng lượng> 1, theo trực giác có vẻ như là cách tiếp cận sai khi mẫu thực sự là một mẫu phụ. Cụ thể, điều đó có nghĩa là một mẫu có trọng số đều bằng 1 có lượng tử khác nhau so với mẫu có trọng số đều bằng 2 hoặc 3. (Tuy nhiên, lưu ý rằng bài báo được tham chiếu trong [1] dường như sử dụng phương pháp này.)
http://en.wikipedia.org/wiki/Percentile# Weighted_percentile đưa ra một công thức thay thế cho tỷ lệ phần trăm có trọng số. Trong công thức này, không rõ liệu các mẫu liền kề có giá trị giống hệt nhau trước tiên phải được kết hợp và trọng số của chúng được tính tổng hay không, và trong mọi trường hợp, kết quả của nó dường như không phù hợp với loại 7 mặc định của R quantile()
trong trường hợp không có trọng số / trọng số bằng nhau. Trang wikipedia về lượng tử hoàn toàn không đề cập đến trường hợp có trọng số.
Có sự khái quát hóa trọng số của hàm lượng tử "loại 7" của R không?
[sử dụng Python, nhưng chỉ tìm kiếm một thuật toán, thực sự, vì vậy bất kỳ ngôn ngữ nào cũng sẽ làm được]
M
[1] Trọng số là số nguyên; các trọng số là các bộ đệm được kết hợp trong các hoạt động "thu gọn" và "đầu ra" như được mô tả trong http://infolab.stanford.edu/~manku/ con / 98sigmod -quantiles.pdf . Về cơ bản, mẫu có trọng số là mẫu phụ của mẫu không có trọng số đầy đủ, với mỗi phần tử x (i) trong mẫu phụ đại diện cho các phần tử trọng lượng (i) trong mẫu đầy đủ.