Có vấn đề như thế nào bạn lấy mẫu dân số?


9

Tôi có một thùng hỗn hợp tốt chứa vô số viên bi. Có một số lượng vô hạn của viên bi trong vat, nhưng họ chỉ đến trong một số số không rõ nhưng hữu hạn các giống : không xác định và đối với , việc vẽ một viên -type có thể có nhiều khả năng hơn là vẽ một viên -type.

V={v1,v2,v3,...,vk}
kijvivj

Trong một thí nghiệm, một máy lấy mẫu thùng bằng một số quy trình chưa biết. Máy báo cáo một bộ mô tả các loại bi của từ mẫu của nó: Xqk

XV;|X|=q

Các thử nghiệm của thí nghiệm này được lặp lại ( được cố định trong các thử nghiệm) và chúng tôi nhận được một chuỗi các tập hợp con , .qV(X1,X2,)

Những điều khác chúng ta biết là:

  • các thử nghiệm là độc lập và giống hệt nhau
  • Máy báo cáo các hàng đầu xảy ra thường xuyên nhất trong mẫu của nóq

Chúng tôi không biết chính xác làm thế nào các mẫu máy bi. Nó có thể chọn một số lượng lớn các viên bi, sau đó báo cáo thường xuyên nhất. Ngoài ra, nó có thể tiếp tục nhặt viên bi cho đến khi có giống. Có những thứ khác nó có thể làm quá.qq

Việc phân phối các thử nghiệm của chúng tôi có bị ảnh hưởng bởi quy trình lấy mẫu của máy không?(X1,X2,)


3
+1 Đây là một câu hỏi hay vì nó đánh giá cao việc lấy mẫu ngẫu nhiên nhiều hơn một số hình thức tùy tiện mơ hồ hoặc thiếu kiến ​​thức về quy trình lấy mẫu.
whuber

Quy tắc lấy mẫu chắc chắn sẽ có vấn đề. Mặt khác, hãy xem xét quy trình này: máy, ở mỗi thử nghiệm, luôn chọn một viên bi loại 1 (loại đầu tiên). Mỗi lần rút sẽ độc lập và có phân phối giống hệt nhau (tầm thường) và bạn sẽ nhận được q = 1, một kết quả hoàn toàn không hữu ích.
AlaskaRon

Câu trả lời:


9

Một cách đơn giản để xác minh rằng phương pháp quan trọng là chọn xác suất cụ thể cho các loại viên bi và tính toán cơ hội của mỗi tập hợp con theo một số phương pháp. Điều này không thể chứng minh rằng phương pháp không quan trọng, mặc dù.

Giả sử có loại và cơ hội của mỗi loại lần lượt là , và . Giả sử bạn đang chọn loại bi.31/21/41/42

Giả sử sau khi chọn một viên bi, bạn bỏ qua phần còn lại của loại. Cơ hội bạn nhận được là .{v2,v3}21/41/3=1/6

Giả sử bạn từ chối các cặp với các loại lặp đi lặp lại. Cơ hội của là{v2,v3}

21/41/421/41/4+21/21/4+21/21/4=1/81/8+1/4+1/4=1/5.

Vì đây là khác nhau, phương pháp máy sử dụng vấn đề. Từ chối các cặp với các loại lặp đi lặp lại có xu hướng trọng số các cặp với các loại phổ biến ít hơn.

Hai trong số các phương pháp bạn đề cập là tương đương. Bỏ qua phần còn lại của loại này sau khi chọn một viên bi cũng giống như chọn cho đến khi bạn có loại khác nhau.q

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.