Tính toán lượng tử gần đúng cho một luồng số nguyên bằng khoảnh khắc?


20

di chuyển từ math.stackexchange .

Tôi đang xử lý một luồng số nguyên dài và đang xem xét theo dõi một vài khoảnh khắc để có thể tính toán xấp xỉ các phần trăm khác nhau cho luồng mà không lưu trữ nhiều dữ liệu. Cách đơn giản nhất để tính phần trăm từ một vài khoảnh khắc. Có cách tiếp cận nào tốt hơn chỉ liên quan đến việc lưu trữ một lượng nhỏ dữ liệu?


2
Bạn có biết bất cứ điều gì cụ thể về các thuộc tính phân phối của luồng của bạn không? Ví dụ, họ, nói, tích cực? Bị ràng buộc? Bất kỳ chi tiết khác bạn có thể cung cấp sẽ hữu ích. Khoảnh khắc khá dễ dàng để tính toán và lưu trữ cho một luồng. Cũng có những câu hỏi trước đây ở đây về việc ước tính trực tiếp lượng tử từ một luồng, nghe có vẻ giống như những gì bạn thực sự đang cố gắng thực hiện. Bạn có thể tìm kiếm và xem qua những cái đó.
Đức hồng y

Chúng đại diện cho thời gian xử lý, vì vậy chúng là tích cực và chủ yếu được phân cụm chặt chẽ trừ khi có một số vấn đề kỹ thuật hoặc quá tải trong hệ thống. Tôi sẽ tìm kiếm các câu hỏi định lượng; họ có thể đủ tốt Tôi vẫn tò mò làm thế nào để đi từ khoảnh khắc đến tính toán giá trị liên quan đến một tỷ lệ phần trăm tùy ý. Tôi biết lưu trữ khoảnh khắc rất dễ dàng, đó là cách sử dụng chúng mà tôi không biết.
jonderry

Bạn đã thấy câu hỏi này ?
Đức hồng y

Câu trả lời:


15

Bạn không nói rõ điều này, nhưng từ mô tả của bạn về vấn đề, có vẻ như bạn đang ở sau một tập hợp lượng tử thiên vị cao (ví dụ: phần trăm thứ 50, 90, 95 và 99).

Nếu đó là trường hợp, tôi đã có rất nhiều thành công với phương pháp được mô tả trong "Tính toán hiệu quả của các lượng tử thiên vị trên các luồng dữ liệu" của Cormode et al. Đây là một thuật toán nhanh đòi hỏi ít bộ nhớ và dễ thực hiện.

Phương pháp này dựa trên thuật toán trước đó của Greenwald và Khanna, duy trì một mẫu nhỏ của luồng đầu vào cùng với giới hạn trên và dưới trên thứ hạng của các giá trị trong mẫu. Nó đòi hỏi nhiều không gian hơn một bộ sưu tập vài khoảnh khắc, nhưng sẽ tốt hơn nhiều khi mô tả chính xác vùng đuôi thú vị của phân phối.


1
εnn

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.