Mẫu phụ của một mẫu ngẫu nhiên: mẫu ngẫu nhiên?


8

Giả sử bạn có một mẫu cầu thủ bóng đá lớn ở châu Âu nhưng bạn chỉ quan tâm đến những gì xảy ra ở Tây Ban Nha. Bạn có thể giảm mẫu của mình cho người chơi ở Tây Ban Nha và vẫn gọi đó là mẫu ngẫu nhiên (nhưng thuộc một dân số khác)? Nếu không, bạn sẽ gọi mẫu đó như thế nào và bạn nên thực hiện các biện pháp phòng ngừa cụ thể nào để có thể đưa ra suy luận về dân số của các cầu thủ bóng đá Tây Ban Nha?

Cảm giác của tôi là sử dụng mẫu phụ đó sẽ ổn miễn là nó đủ lớn, nhưng có lẽ tôi đang thiếu thứ gì đó.


3
Lưu ý rằng điều này mơ hồ tương tự như lấy mẫu từ chối. Tuy nhiên, trong phương pháp bạn mô tả, lưu ý rằng kích thước mẫu kết quả của bạn thực sự là một biến ngẫu nhiên. Tùy thuộc vào loại phân tích bạn có trong tâm trí, điều này có thể hoặc không thể đưa ra một số biến chứng. Ví dụ, trong nhiều (nhưng không phải tất cả) GLM, cỡ mẫu có hiệu quả ngẫu nhiên, nhưng suy luận được thực hiện một cách có điều kiện (và cách tiếp cận này có thể được biện minh chặt chẽ).
hồng y

@cardinal Cảm ơn bạn đã tham khảo lấy mẫu từ chối. Tôi đang tự hỏi loại biến chứng nào sẽ được giới thiệu? Nếu mẫu mới có thể được mô tả như một mẫu ngẫu nhiên của một dân số khác, tôi có thể "hầu như" bỏ qua thực tế rằng nó đã thu được thông qua việc lấy mẫu lại không?
Antoine Vernet

Câu trả lời:


2

Nói chung, những gì bạn thực sự muốn từ một mẫu, là "đại diện". Lấy mẫu ngẫu nhiên là một cách tốt để đi vì nó cho phép tất cả các đối tượng có cùng xác suất được lấy mẫu; Với hy vọng rằng tất cả các thuộc tính và quan hệ thuộc tính tồn tại trong dân số sẽ tồn tại trong mẫu. Làm cho nó trở thành "đại diện". Trong trường hợp của bạn, nếu bạn tin rằng tất cả người chơi Tây Ban Nha có cơ hội được rút thăm bằng nhau trong mẫu (phụ), thì đó là "ngẫu nhiên".

Về cân nhắc kích thước: Một quan sát duy nhất vẫn có thể là một "mẫu ngẫu nhiên". Các mẫu lớn hơn là cần thiết khi bạn muốn độ chính xác cao hơn, và đặc biệt là khi bạn đang tìm kiếm các mối quan hệ hiếm trong dân số, có thể không có trong một mẫu nhỏ.


3
Sự ngẫu nhiên là nhiều hơn cơ hội trước bằng nhau. Ví dụ, một đội ở Tây Ban Nha có thể được chọn ngẫu nhiên. Giả sử kích thước đội bằng nhau, điều này mang lại cho tất cả các cầu thủ bóng đá cơ hội được đưa vào mẫu, nhưng thật khó để cho rằng một đội duy nhất thực sự là đại diện cho tất cả các cầu thủ trong nước.
whuber

2
(...) Nhưng thật khó để cho rằng một đội duy nhất thực sự là đại diện cho tất cả người chơi trong nước ... đặc biệt nếu quốc gia đó là Tây Ban Nha ! :)
hồng y

2
@ whuber- bạn nói đúng. Nói chính xác, không chỉ các cơ hội trước bằng nhau , mà cả các cơ hội bằng nhau được đưa ra cho phần còn lại của mẫu. Điều này sẽ loại trừ sơ đồ lấy mẫu nhóm.
JohnRos

@ JohnRos. Cảm ơn sự chính xác về mối quan hệ giữa tính ngẫu nhiên và tính đại diện.
Antoine Vernet

@whuber Cảm ơn bạn đã chỉ ra rằng cơ hội trước bằng nhau là cần thiết nhưng không đủ.
Antoine Vernet

1

Giả sử không có sai lệch trong kỹ thuật lấy mẫu, điều này sẽ ổn. Một số câu hỏi có thể là:

-> Cuộc khảo sát được thực hiện bằng tiếng Tây Ban Nha nếu được yêu cầu? (Sai lệch ngôn ngữ) -> Cuộc khảo sát được thực hiện qua điện thoại hay gặp trực tiếp? Nếu qua điện thoại và điện thoại di động bị loại trừ, người chơi Tây Ban Nha có ít nhiều khả năng sở hữu điện thoại di động hơn người chơi ở phần còn lại của châu Âu không, và vì lý do gì? -> Tỷ lệ người chơi Tây Ban Nha từ chối trả lời các câu hỏi khảo sát khác với tỷ lệ dành cho người chơi nói chung? -> Nhìn chung, tỷ lệ người chơi Tây Ban Nha được lấy mẫu là bao nhiêu?

Không biết thành phần chính xác của dữ liệu, thật khó để nói thêm. Có bất kỳ vấn đề cụ thể mà bạn quan tâm?


Tôi đồng ý với những điểm bạn đưa ra , nhưng nó nói rằng những người chơi đã được liên lạc hoặc cố gắng liên lạc ở đâu? OP có thể có một số thống kê tóm tắt cho một tập hợp người chơi ngẫu nhiên từ Châu Âu.
hồng y

@ John Doucette Cảm ơn bạn. Những biện pháp phòng ngừa này có ý nghĩa với tôi, nhưng nói đúng ra, chúng không phải là biện pháp phòng ngừa thống kê mà là thiết kế, điều này khiến tôi nghĩ rằng giả sử không có sự thiên vị nào cho việc phân nhóm, chọn những người trong phân nhóm đó trong mẫu của bạn để lại cho bạn một mẫu ngẫu nhiên . Đối với dữ liệu, ví dụ này là hư cấu, tôi chỉ cố gắng tránh xa những đứa trẻ trong lớp học trong trường mẫu.
Antoine Vernet
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.