Tại sao các cuộc thăm dò chính trị có kích thước mẫu lớn như vậy?


32

Khi tôi xem tin tức tôi đã nhận thấy rằng các cuộc thăm dò của Gallup cho những thứ như bầu cử tổng thống có cỡ mẫu [tôi giả sử ngẫu nhiên] hơn 1.000. Từ những gì tôi nhớ từ thống kê đại học là cỡ mẫu 30 là mẫu "lớn đáng kể". Nó đã được thực hiện để dường như một kích thước mẫu trên 30 là vô nghĩa do lợi nhuận giảm dần.


9
Cuối cùng, ai đó ở đây để nói về quần áo mới của Hoàng đế dữ liệu lớn. Ai cần người dùng Tweeter 600M nếu bạn có thể nhận được tất cả các câu trả lời từ cỡ mẫu thống kê đại học là 30.
StasK

1
StasK, đó là vui nhộn.
Aaron Hall

Nhận xét tốt nhất @StasK
Brennan

Câu trả lời:


36

Wayne đã giải quyết vấn đề "30" đủ tốt (quy tắc ngón tay cái của riêng tôi: đề cập đến số 30 liên quan đến thống kê có khả năng là sai).

Tại sao các số trong vùng lân cận 1000 thường được sử dụng

Số lượng khoảng 1000-2000 thường được sử dụng trong các cuộc khảo sát, ngay cả trong trường hợp tỷ lệ đơn giản (" Bạn có ủng hộ bất cứ điều gì><> ?").

Điều này được thực hiện để có được ước tính chính xác hợp lý của tỷ lệ.

Nếu lấy mẫu nhị thức, sai số chuẩn * của tỷ lệ mẫu là lớn nhất khi tỷ lệ này là - nhưng giới hạn trên vẫn là một xấp xỉ khá tốt cho tỷ lệ giữa khoảng 25% và 75%.12

* "lỗi tiêu chuẩn" = "độ lệch chuẩn của phân phối"

Mục đích chung là ước tính tỷ lệ phần trăm trong khoảng với tỷ lệ phần trăm thực, khoảng thời gian. Đó là được gọi là ' lề của lỗi '.95 % 3 %±3%95%3%

Trong đó, lỗi tiêu chuẩn 'trường hợp xấu nhất' trong lấy mẫu nhị thức, điều này dẫn đến:

1.96×12(112)/n0.03

0.98×1/n0.03

n0.98/0.03

n1067.11

... Hoặc 'hơn một chút'.

Vì vậy, nếu bạn khảo sát 1000 người một cách ngẫu nhiên từ dân số bạn muốn đưa ra suy luận và 58% mẫu ủng hộ đề xuất, bạn có thể chắc chắn chắc chắn tỷ lệ dân số nằm trong khoảng từ 55% đến 61%.

(Đôi khi các giá trị khác cho lề lỗi, chẳng hạn như 2,5% có thể được sử dụng. Nếu bạn giảm một nửa lề lỗi, kích thước mẫu sẽ tăng lên bội số của 4.)

Trong các cuộc điều tra phức tạp, trong đó cần có ước tính chính xác về tỷ lệ trong một số dân số phụ (ví dụ: tỷ lệ sinh viên tốt nghiệp đại học da đen ở Texas ủng hộ đề xuất), các con số có thể đủ lớn để nhóm đó có kích thước vài trăm, có lẽ kéo theo hàng chục ngàn phản hồi trong tổng số.

Vì điều đó có thể nhanh chóng trở nên không thực tế, nên việc chia dân số thành các nhóm dân cư (tầng lớp) và lấy mẫu riêng biệt từng nhóm một cách phổ biến. Mặc dù vậy, bạn có thể kết thúc với một số khảo sát rất lớn.

Nó đã được thực hiện để dường như một kích thước mẫu trên 30 là vô nghĩa do lợi nhuận giảm dần.

Nó phụ thuộc vào kích thước hiệu ứng, và sự thay đổi tương đối. Hiệu ứng trên phương sai có nghĩa là bạn có thể cần một số mẫu khá lớn trong một số trường hợp.n

Tôi đã trả lời một câu hỏi ở đây (tôi nghĩ đó là từ một kỹ sư) đang xử lý các cỡ mẫu rất lớn (trong khoảng một triệu nếu tôi nhớ đúng) nhưng anh ta đang tìm kiếm các hiệu ứng rất nhỏ.

Chúng ta hãy xem những gì một mẫu ngẫu nhiên với kích thước mẫu là 30 để lại cho chúng ta khi ước tính tỷ lệ mẫu.

Hãy tưởng tượng chúng tôi hỏi 30 người xem họ có chấp thuận địa chỉ của Liên bang hay không (đồng ý, đồng ý, không đồng ý, không đồng ý mạnh mẽ). Hơn nữa hãy tưởng tượng rằng sự quan tâm nằm ở tỷ lệ đồng ý hoặc đồng ý mạnh mẽ.

Nói 11 trong số những người được phỏng vấn đồng ý và 5 người đồng ý mạnh mẽ, với tổng số 16.

16/30 là khoảng 53%. Giới hạn của chúng tôi đối với tỷ lệ trong dân số là bao nhiêu (với khoảng 95%)?

Chúng ta có thể xác định tỷ lệ dân số xuống khoảng 35% đến 71% (khoảng), nếu các giả định của chúng ta giữ vững.

Không phải tất cả đều hữu ích.


+1. Toàn bộ câu trả lời là tuyệt vời, nhưng dòng đầu tiên có giá trị upvote của chính nó.
Matt Krause

1
Và dĩ nhiên, sau đó bạn có thể đảo ngược phép tính và tính toán sai số với mẫu là 30 ...
Calimo

Đoạn cuối cùng của bạn là nơi lấy mẫu phân tầng đến, tôi tin. Như những người khác đã nói, việc lấy mẫu ngẫu nhiên đơn giản từ dân số cử tri đủ điều kiện không thực sự được thực hiện ở quy mô quốc gia.
Wayne

@Wayne cảm ơn; Tôi đã quay lại và thêm một chút vào cuối.
Glen_b -Reinstate Monica

2
+1, và tôi cũng thích ý nghĩa nghịch lý của quy tắc ngón tay cái của bạn.
James Stanley

10

Quy tắc cụ thể đó cho thấy 30 điểm là đủ để giả định rằng dữ liệu được phân phối bình thường (nghĩa là trông giống như một đường cong hình chuông), nhưng, tốt nhất, đây là một hướng dẫn sơ bộ. Nếu vấn đề này, hãy kiểm tra dữ liệu của bạn! Điều này cho thấy rằng bạn muốn có ít nhất 30 người trả lời cho cuộc thăm dò của mình nếu phân tích của bạn phụ thuộc vào các giả định này, nhưng cũng có các yếu tố khác.

Một yếu tố chính là "kích thước hiệu ứng." Hầu hết các chủng tộc có xu hướng khá gần nhau, vì vậy các mẫu khá lớn được yêu cầu để phát hiện những sự khác biệt này một cách đáng tin cậy. (Nếu bạn quan tâm đến việc xác định cỡ mẫu "đúng", bạn nên xem xét phân tích công suất ). Nếu bạn có một biến ngẫu nhiên Bernoulli (thứ gì đó có hai kết quả) xấp xỉ 50:50, thì bạn cần khoảng 1000 thử nghiệm để giảm sai số chuẩn xuống 1,5%. Điều đó có lẽ đủ chính xác để dự đoán kết quả của một cuộc đua (4 cuộc bầu cử Tổng thống Mỹ gần đây nhất có biên độ trung bình ~ 3,2%), phù hợp với quan sát của bạn.

Dữ liệu thăm dò ý kiến ​​thường được cắt và xắt nhỏ theo nhiều cách khác nhau: "Ứng cử viên hàng đầu với những người đàn ông sở hữu súng trên 75 tuổi?" hay bất cứ cái gì. Điều này đòi hỏi các mẫu thậm chí lớn hơn bởi vì mỗi người trả lời chỉ phù hợp với một vài trong số các loại này.

Các cuộc thăm dò của tổng thống đôi khi cũng bị "bó" với các câu hỏi khảo sát khác (ví dụ, các cuộc đua của Quốc hội). Vì chúng khác nhau tùy theo từng tiểu bang, một kết thúc với một số dữ liệu bỏ phiếu "phụ".


Phân phối Bernoulli là phân phối xác suất rời rạc chỉ có hai kết quả: Tùy chọn 1 được chọn với xác suất , trong khi tùy chọn 2 được chọn với xác suất .1 - pp1p

Phương sai của phân phối bernoulli là , do đó, lỗi tiêu chuẩn của giá trị trung bình là . Cắm (cuộc bầu cử là hòa), đặt sai số chuẩn thành 1,5% (0,015) và giải quyết. Bạn sẽ cần nhận được 1.11 môn học để đạt 1,5% SEp(1p) p=0,5p(1p)np=0.5


4
Tuy nhiên, +1, "30 điểm là đủ để cho rằng dữ liệu được phân phối bình thường" là không đúng. Mọi người có thể tin điều này, nhưng CLT cần bao nhiêu dữ liệu để phân phối lấy mẫu hội tụ đầy đủ đến mức bình thường tùy thuộc vào bản chất của phân phối dữ liệu (xem tại đây ). Thay vào đó, 30 (có thể) xấp xỉ đủ nếu dữ liệu đã bình thường, nhưng SD được ước tính từ cùng một bộ dữ liệu (cf, phân phối t).
gung - Phục hồi Monica

@Gung, hoàn toàn đồng ý, nhưng tôi không muốn đi quá xa đường ray. Hãy thoải mái chỉnh sửa nhiều hơn nếu bạn nghĩ rằng điểm cần được thực hiện mạnh mẽ hơn nữa.
Matt Krause

8

Đã có một số câu trả lời tuyệt vời cho câu hỏi này, nhưng tôi muốn trả lời tại sao lỗi tiêu chuẩn là gì, tại sao chúng ta sử dụng là trường hợp xấu nhất và lỗi tiêu chuẩn thay đổi như thế nào với .np=0.5n

Giả sử chúng tôi thực hiện một cuộc thăm dò chỉ một cử tri, hãy gọi anh ấy hoặc cô ấy là cử tri 1, và hỏi "bạn sẽ bỏ phiếu cho Đảng Tím?" Chúng ta có thể mã câu trả lời là 1 cho "có" và 0 cho "không". Hãy nói rằng xác suất của "có" là . Bây giờ chúng ta có một biến ngẫu nhiên nhị phân là 1 với xác suất và 0 với xác suất . Chúng tôi nói rằng là biến Bernouilli có xác suất thành công , chúng tôi có thể viết . Dự kiến, hoặc có nghĩa là,pX1p1pX1pX1Bernouilli(p)X1E(X1)=xP(X1=x)xX1. Nhưng chỉ có hai kết quả, 0 với xác suất và 1 với xác suất , do đó tổng chỉ là . Dừng lại và suy nghĩ. Điều này thực sự có vẻ hoàn toàn hợp lý - nếu có 30% cơ hội cử tri 1 ủng hộ Đảng Tím và chúng tôi đã mã hóa biến thành 1 nếu họ nói "có" và 0 nếu họ nói "không", thì chúng tôi sẽ mong đợi là 0,3 trên trung bình.1ppE(X1)=0(1p)+1(p)=pX1

Chúng ta hãy nghĩ những gì xảy ra chúng ta vuông . Nếu thì và nếu thì . Vì vậy, trên thực tế trong cả hai trường hợp. Vì chúng giống nhau, nên chúng phải có cùng giá trị mong đợi, vì vậy . Điều này cho tôi một cách dễ dàng để tính toán phương sai của biến Bernouilli: Tôi sử dụng và do đó độ lệch chuẩn là .X1X1=0X12=0X1=1X12=1X12=X1E(X12)=pVar(X1)=E(X12)E(X1)2=pp2=p(1p)σX1=p(1p)

Rõ ràng tôi muốn nói chuyện với các cử tri khác - hãy gọi họ là cử tri 2, cử tri 3, thông qua cử tri . Giả sử tất cả họ đều có cùng xác suất hỗ trợ Đảng tím. Bây giờ chúng ta có biến Bernouilli, , cho đến , với mỗi cho từ 1 đến . Chúng đều có cùng một giá trị trung bình, và phương sai, .npnX1X2XnXiBernoulli(p)inpp(1p)

Tôi muốn tìm xem có bao nhiêu người trong mẫu của tôi nói "có" và để làm điều đó tôi chỉ có thể thêm tất cả . Tôi sẽ viết . Tôi có thể tính giá trị trung bình hoặc giá trị mong đợi của bằng cách sử dụng quy tắc nếu những kỳ vọng đó tồn tại và mở rộng rằng . Nhưng tôi đang cộng thêm những kỳ vọng đó và mỗi kỳ vọng là , vì vậy tôi nhận được tổng cộngXiX=i=1nXiXE(X+Y)=E(X)+E(Y)E(X1+X2++Xn)=E(X1)+E(X2)++E(Xn)npE(X)=np. Dừng lại và suy nghĩ. Nếu tôi thăm dò ý kiến ​​200 người và mỗi người có 30% cơ hội nói rằng họ ủng hộ Đảng Tím, tất nhiên tôi mong đợi 0,3 x 200 = 60 người sẽ nói "có". Vì vậy, công thức vẻ đúng. Ít "rõ ràng" là làm thế nào để xử lý phương sai.np

một quy tắc mà nói nhưng tôi chỉ có thể sử dụng nó nếu các biến ngẫu nhiên của tôi là độc lập với nhau . Rất tốt, hãy đưa ra giả định đó và bằng một logic tương tự trước khi tôi có thể thấy rằng . Nếu một biến là tổng của thử nghiệm Bernoulli độc lập , với xác suất thành công giống hệt nhau , thì chúng ta nói rằng có phân phối nhị thức, . Chúng tôi đã chỉ ra rằng giá trị trung bình của phân phối nhị thức như vậy là và phương sai là .

Var(X1+X2++Xn)=Var(X1)+Var(X2)++Var(Xn)
Var(X)=np(1p)Xn pXXBinomial(n,p)npnp(1p)

Vấn đề ban đầu của chúng tôi là làm thế nào để ước tính từ mẫu. Cách hợp lý để xác định công cụ ước tính của chúng tôi là . Ví dụ, 64 trong số 200 người của chúng tôi nói "có", chúng tôi ước tính rằng 64/200 = 0,32 = 32% số người nói rằng họ ủng hộ Đảng Tím. Bạn có thể thấy rằng là một "thu nhỏ" phiên bản của tổng số của chúng tôi vâng-cử tri, . Điều đó có nghĩa là nó vẫn là một biến ngẫu nhiên, nhưng không còn tuân theo phân phối nhị thức. Chúng ta có thể tìm giá trị trung bình và phương sai của nó, bởi vì khi chúng ta chia tỷ lệ một biến ngẫu nhiên theo một yếu tố không đổi thì nó tuân theo các quy tắc sau: (vì vậy thang đo trung bình bởi cùng một yếu tố ) vàpp^=X/np^XkE(kX)=kE(X)kVar(kX)=k2Var(X) . Lưu ý cách thay đổi tỷ lệ theo . Điều đó có ý nghĩa khi bạn biết rằng nói chung, phương sai được đo bằng bình phương của bất kỳ đơn vị nào mà biến được đo bằng: không áp dụng ở đây, nhưng nếu biến ngẫu nhiên của chúng tôi có chiều cao tính bằng cm thì phương sai sẽ tính bằng tỷ lệ khác nhau - nếu bạn tăng gấp đôi chiều dài, bạn tăng gấp bốn lần diện tích.k2cm2

Ở đây hệ số tỷ lệ của chúng tôi là . Điều này mang lại cho chúng tôi . Điều đó thật tuyệt! Trung bình, công cụ ước tính của chúng tôi chính xác là "nên", xác suất (hoặc dân số) thực sự mà một cử tri ngẫu nhiên nói rằng họ sẽ bỏ phiếu cho Đảng Tím. Chúng tôi nói rằng công cụ ước tính của chúng tôi là không thiên vị . Nhưng trong khi nó là chính xác trung bình, đôi khi nó sẽ quá nhỏ, và đôi khi quá cao. Chúng ta có thể thấy nó có khả năng sai như thế nào bằng cách nhìn vào phương sai của nó. . Độ lệch chuẩn là căn bậc hai,1nE(p^)=1nE(X)=npn=pp^Var(p^)=1n2Var(X)=np(1p)n2=p(1p)np(1p)nvà bởi vì nó cho chúng ta biết được công cụ ước tính của chúng ta sẽ bị tắt như thế nào (đó thực sự là một lỗi bình phương gốc , một cách tính sai số trung bình xử lý các lỗi tích cực và tiêu cực như nhau, bằng cách bình phương chúng trước khi tính trung bình) , nó thường được gọi là lỗi tiêu chuẩn . Một nguyên tắc nhỏ, hoạt động tốt đối với các mẫu lớn và có thể được xử lý chặt chẽ hơn bằng cách sử dụng Định lý giới hạn trung tâm nổi tiếng , là hầu hết thời gian (khoảng 95%) ước tính sẽ sai dưới hai lỗi tiêu chuẩn.

Vì nó xuất hiện trong mẫu số của phân số, giá trị cao hơn của - mẫu lớn hơn - làm cho sai số chuẩn nhỏ hơn. Đó là một tin tuyệt vời, như thể tôi muốn một lỗi tiêu chuẩn nhỏ, tôi chỉ làm cho cỡ mẫu đủ lớn. Tin xấu là nằm trong một căn bậc hai, vì vậy nếu tôi tăng gấp bốn lần kích thước mẫu, tôi sẽ chỉ giảm một nửa lỗi tiêu chuẩn. Các lỗi tiêu chuẩn rất nhỏ sẽ liên quan đến các mẫu rất rất lớn, do đó đắt tiền. Có một vấn đề khác: nếu tôi muốn nhắm mục tiêu một lỗi tiêu chuẩn cụ thể, giả sử là 1%, thì tôi cần biết giá trị của để sử dụng trong tính toán của mình. Tôi có thể sử dụng các giá trị lịch sử nếu tôi có dữ liệu bỏ phiếu trước đây, nhưng tôi muốn chuẩn bị cho trường hợp xấu nhất có thể xảy ra. Giá trị nào củannppcó vấn đề nhất? Một biểu đồ là hướng dẫn.

đồ thị của sqrt (p (1-p))

Lỗi tiêu chuẩn trong trường hợp xấu nhất (cao nhất) sẽ xảy ra khi . Để chứng minh rằng tôi có thể sử dụng phép tính, nhưng một số đại số trung học sẽ thực hiện thủ thuật, miễn là tôi biết cách " hoàn thành hình vuông ". p=0.5

p(1p)=pp2=14(p2p+14)=14(p12)2

Biểu thức là dấu ngoặc vuông, vì vậy sẽ luôn trả về câu trả lời bằng 0 hoặc dương, sau đó sẽ bị lấy đi từ một phần tư. Trong trường hợp xấu nhất (lỗi tiêu chuẩn lớn) càng ít càng tốt bị lấy đi. Tôi biết ít nhất có thể bị trừ là 0 và điều đó sẽ xảy ra khi , vì vậy khi . Kết quả cuối cùng là tôi nhận được các lỗi tiêu chuẩn lớn hơn khi cố gắng ước tính hỗ trợ cho các đảng chính trị gần 50% phiếu bầu và các lỗi tiêu chuẩn thấp hơn để ước tính hỗ trợ cho các đề xuất về cơ bản ít phổ biến hơn hoặc ít phổ biến hơn thế. Trên thực tế, tính đối xứng của biểu đồ và phương trình của tôi cho tôi thấy rằng tôi sẽ nhận được cùng một lỗi tiêu chuẩn cho các ước tính hỗ trợ của tôi về Đảng Tím, cho dù họ có hỗ trợ phổ biến 30% hay 70%.p12=0p=12

Vậy tôi cần bao nhiêu người để thăm dò ý kiến ​​để giữ sai số chuẩn dưới 1%? Điều này có nghĩa là, phần lớn thời gian, ước tính của tôi sẽ nằm trong 2% của tỷ lệ chính xác. Bây giờ tôi biết rằng lỗi tiêu chuẩn trường hợp xấu nhất là mang lại cho tôi và vì vậy . Điều đó sẽ giải thích tại sao bạn nhìn thấy số liệu bỏ phiếu trong hàng ngàn.0.25n=0.5n<0.01n>50n>2500

Trong thực tế, lỗi tiêu chuẩn thấp không phải là sự đảm bảo cho một ước tính tốt. Nhiều vấn đề trong bỏ phiếu là có tính chất thực tế hơn là lý thuyết. Ví dụ, tôi giả định rằng mẫu là của các cử tri ngẫu nhiên, mỗi người có cùng xác suất , nhưng lấy một mẫu "ngẫu nhiên" trong cuộc sống thực là khó khăn. Bạn có thể thử bỏ phiếu qua điện thoại hoặc trực tuyến - nhưng không chỉ mọi người không có điện thoại hoặc truy cập internet, mà những người không có thể có nhân khẩu học rất khác nhau (và ý định bỏ phiếu) cho những người thực hiện. Để tránh đưa ra sự thiên vị cho kết quả của họ, các công ty bỏ phiếu thực sự thực hiện tất cả các loại trọng số phức tạp của các mẫu của họ, chứ không phải trung bình đơn giảnpXinmà tôi đã lấy. Ngoài ra, mọi người nói dối với người gây ô nhiễm! Những cách khác nhau mà những người gây ô nhiễm đã bù đắp cho khả năng này, rõ ràng là gây tranh cãi. Bạn có thể thấy một loạt các cách tiếp cận trong cách các công ty bỏ phiếu đã đối phó với cái gọi là Yếu tố Shy Tory ở Anh. Một phương pháp sửa chữa liên quan đến việc xem xét cách mọi người bỏ phiếu trong quá khứ để đánh giá mức độ hợp lý của ý định bỏ phiếu của họ, nhưng hóa ra ngay cả khi họ không nói dối, nhiều cử tri chỉ đơn giản là không nhớ lịch sử bầu cử của họ . Khi bạn có những thứ này đang diễn ra, thực sự có rất ít điểm nhận được "lỗi tiêu chuẩn" xuống 0,00001%.

Để kết thúc, đây là một số biểu đồ cho thấy kích thước mẫu được yêu cầu - theo phân tích đơn giản của tôi - bị ảnh hưởng bởi lỗi tiêu chuẩn mong muốn và giá trị "trường hợp xấu nhất" của so với tỷ lệ dễ điều chỉnh hơn. Hãy nhớ rằng đường cong cho sẽ giống hệt với đường cong cho do tính đối xứng của đồ thị trước đó của p = 0,7 p = 0.3 p=0.5p=0.7p=0.3p(1p)

Đồ thị kích thước mẫu yêu cầu cho các lỗi tiêu chuẩn mong muốn khác nhau


thang đo log10 trong trục y có thể giúp ở đây.
EngrStudent - Phục hồi Monica

7

Quy tắc "ít nhất 30" được đề cập trong một bài đăng khác trên Xác thực chéo. Đó là một quy tắc của ngón tay cái, tốt nhất.

Khi bạn nghĩ về một mẫu được cho là đại diện cho hàng triệu người, bạn sẽ phải có một mẫu lớn hơn nhiều so với chỉ 30. Theo trực giác, 30 người thậm chí không thể bao gồm một người từ mỗi tiểu bang! Sau đó, hãy nghĩ rằng bạn muốn đại diện cho đảng Cộng hòa, Dân chủ và Độc lập (ít nhất) và cho mỗi người trong số họ sẽ muốn đại diện cho một vài loại tuổi khác nhau và cho mỗi một vài loại thu nhập khác nhau.

Chỉ với 30 người được gọi, bạn sẽ bỏ lỡ một lượng lớn nhân khẩu học bạn cần lấy mẫu.

EDIT2: [Tôi đã xóa đoạn mà abaumann và StasK phản đối. Tôi vẫn không bị thuyết phục 100%, nhưng đặc biệt là lập luận của StasK mà tôi không thể không đồng ý.] Nếu 30 người thực sự được chọn hoàn toàn ngẫu nhiên trong số tất cả các cử tri đủ điều kiện, thì một số mẫu sẽ có giá trị, nhưng quá nhỏ cho phép bạn phân biệt xem câu trả lời cho câu hỏi của bạn là thực sự đúng hay sai (trong số tất cả các cử tri đủ điều kiện). StasK giải thích nó sẽ tệ như thế nào trong bình luận thứ ba của mình, bên dưới.

EDIT: Trả lời nhận xét của sampleize999, có một phương pháp chính thức để xác định mức độ lớn đủ lớn, được gọi là " phân tích công suất ", cũng được mô tả ở đây . Nhận xét của abaumann minh họa cách có sự đánh đổi giữa khả năng phân biệt sự khác biệt và lượng dữ liệu bạn cần để thực hiện một số cải tiến nhất định. Như ông minh họa, có một căn bậc hai trong tính toán, có nghĩa là lợi ích (về công suất tăng) tăng lên chậm hơn hoặc chi phí (về số lượng mẫu bạn cần) tăng lên nhanh chóng, vì vậy bạn muốn đủ mẫu, nhưng không nhiều hơn.


2
"Toàn bộ quan điểm của một mẫu - đó là toàn bộ giá trị - là nó phản ánh dân số, không phải là ngẫu nhiên." Đó là sai lầm một cách rõ ràng! Hiệu lực (theo nghĩa chung chung) bắt nguồn chính xác từ đặc tính ngẫu nhiên của quy trình lấy mẫu. Trường hợp khá là vì bạn quan tâm đến lợi nhuận rất nhỏ, bạn cần một ước tính chính xác, đòi hỏi một cỡ mẫu lớn.
abaumann

3
@abaumann: Theo như tôi hiểu, không có phép màu nào trong ngẫu nhiên: đó chỉ là cách khách quan nhất mà chúng ta có để tạo ra các mẫu phản ánh dân số. Đó là lý do tại sao chúng ta có thể sử dụng ngẫu nhiên trong các tầng, hoặc sử dụng phân tầng và trọng số để cố gắng bù cho ngẫu nhiên không quá lớn.
Wayne

2
samplesize: Điều này có ít hoặc không có gì để làm "chuyên gia". Chẳng hạn, các ứng cử viên tổng thống Mỹ điều hành các "cuộc thăm dò theo dõi" hàng tuần và hàng ngày trong các chiến dịch của họ và họ chỉ khảo sát khoảng 200-300 người. Những cỡ mẫu này cung cấp một sự cân bằng đầy đủ về chi phí và thông tin. Ở một thái cực khác, một số nghiên cứu liên quan đến sức khỏe như NHANES tuyển sinh hàng chục hoặc hàng trăm nghìn người vì điều đó là cần thiết để tạo ra thông tin có thể hành động có giá trị cao đến mức chi phí khổng lồ của các nghiên cứu này trở nên đáng giá. Trong cả hai trường hợp, các chuyên gia đang xác định kích thước mẫu.
whuber

2
Về mặt kỹ thuật, việc khái quát hóa sẽ có hiệu lực nếu mẫu là đại diện cho dân số. Ý tưởng là có một mẫu ngẫu nhiên đảm bảo mẫu sẽ là đại diện, nhưng điều này khó hơn (không nhất thiết là không thể) nếu mẫu không ngẫu nhiên. FWIW, không có cuộc thăm dò sử dụng lấy mẫu ngẫu nhiên đơn giản.
gung - Phục hồi Monica

1
@sashkello, có một nền tảng ở giữa: người ta có thể sử dụng một mẫu ngẫu nhiên phân tầng (về cơ bản là tùy chọn số 1 của bạn) hoặc cố gắng lấy lại / định chuẩn mẫu sau đó. Giống như Gung, tôi nghĩ rằng hầu hết các cuộc khảo sát lớn đều làm một cái gì đó phức tạp hơn một mẫu ngẫu nhiên đơn giản
Matt Krause

0

Rất nhiều câu trả lời tuyệt vời đã được đăng. Hãy để tôi đề xuất một khung khác nhau mang lại phản ứng tương tự, nhưng có thể thúc đẩy trực giác hơn nữa.

Giống như @Glen_b, giả sử chúng tôi yêu cầu độ tin cậy ít nhất 95% rằng tỷ lệ thực sự đồng ý với tuyên bố nằm trong phạm vi sai số 3%. Trong một mẫu cụ thể của dân số, tỷ lệ thực sự là không xác định. Tuy nhiên, sự không chắc chắn xung quanh tham số thành công này có thể được mô tả bằng phân phối Beta .pp

Chúng tôi không có bất kỳ thông tin trước nào về cách được phân phối, vì vậy chúng tôi sẽ nói rằng là một thông tin chưa được xác định trước. Đây là phân phối đồng đều của từ 0 đến 1.ppBeta(α=1,β=1)p

Khi chúng tôi nhận được thông tin từ những người trả lời từ cuộc khảo sát, chúng tôi có thể cập nhật niềm tin của chúng tôi về việc phân phối . Phân phối sau của khi chúng tôi nhận được phản hồi "có" và "không" là .ppδyδnpBeta(α=1+δy,β=1+δn)

Giả sử trường hợp xấu nhất có tỷ lệ thực là 0,5, chúng tôi muốn tìm số người trả lời sao cho chỉ 0,025 khối lượng xác suất dưới 0,47 và 0,025 khối lượng xác suất là trên 0,53 (vào tài khoản cho độ tin cậy 95% trong tỷ lệ sai sót 3% của chúng tôi). Cụ thể, trong một ngôn ngữ lập trình như R, chúng tôi muốn tìm ra sao cho mang lại giá trị 0,47.n=δy+δnnqbeta(0.025, n/2, n/2)

Nếu bạn sử dụng , bạn sẽ nhận được:n=1067

> qbeta(0.025, 1067/2, 1067/2) [1] 0.470019

đó là kết quả mong muốn của chúng tôi.

Tóm lại, 1.067 người trả lời chia đều giữa câu trả lời "có" và "không" sẽ cho chúng tôi niềm tin 95% rằng tỷ lệ thực sự của người trả lời "có" là từ 47% đến 53%.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.