Là số 20 ma thuật?


12

Tôi có tài liệu tham khảo khuyên nên xem xét cỡ mẫu tối thiểu 20 để phân phối dữ liệu phù hợp.

Có bất kỳ ý nghĩa trong điều này?

cảm ơn


3
Nói chung là không, trong các tình huống cụ thể có thể. Bạn có tài liệu tham khảo và mục tiêu của bạn là gì?
image_doctor

1
Tôi đồng ý với @image_doctor - không có lý do chung tại sao 20 quan sát nên được coi là tối thiểu; nó có thể là trường hợp trong những trường hợp rất đặc biệt
Glen_b -Reinstate Monica

3
Một giá trị duy nhất sẽ hoạt động trong một số trường hợp thực tế, chẳng hạn như khi phân phối được biết (với sự chắc chắn) là Poisson và quan sát là một số lượng lớn. Điều đó không chỉ cho phép phân phối phù hợp, nó còn cho phép đánh giá lỗi có thể xảy ra trong ước tính tham số của nó.
whuber

1
Tôi tin rằng tôi cũng đã đọc rằng đối với các bản phân phối bình thường, 30 là quy tắc chung. Dường như với tôi, đó là một cái gì đó liên quan đến mức độ gần gũi của một Học sinh với 30 độ tự do so với bình thường. Nhưng đó chỉ là một quy tắc của ngón tay cái. Đó không phải là phép thuật theo cùng nghĩa là giá trị của . e
Wayne

1
Có, 20 là một con số kỳ diệu: en.wikipedia.org/wiki/Magic_number_%28physics%29
Bitwise

Câu trả lời:


13

Rất nhiều điều này phụ thuộc vào phân phối dự kiến ​​và câu hỏi nghiên cứu của bạn là gì. Theo quy tắc của ngón tay cái, bạn nên cảnh giác với các quy tắc của ngón tay cái. Nếu bạn biết phân phối dự kiến, hãy chạy một số mô phỏng có kích thước khác nhau và xác định tần suất mô phỏng mẫu phản ánh phân phối thực tế. Điều này sẽ cung cấp cho bạn một số hướng dẫn như kích thước mẫu yêu cầu cuối cùng.


+1 cho chỉ đạo rõ ràng về các tuyên bố cực đoan và giáo điều.
whuber

1
+1 một phần do "Theo quy tắc của ngón tay cái, bạn nên cảnh giác với quy tắc của ngón tay cái".
Wolfgang

7

Tôi nghĩ số ma thuật cỡ mẫu là 1.000. Đó là điều mà hầu hết các cuộc thăm dò quốc gia Mỹ có, để tạo ra sai số khoảng 3%: Trong thực tế, các kích thước mẫu có hiệu quả thấp hơn so với 1000, giống như 700 hoặc lâu hơn, do khả năng không đồng đều lựa chọn và không đáp ứng điều chỉnh, dẫn đến sai số 3,7% .

z0.9750.50.5/1000=1.960.158=0.031

Chỉ với 20 quan sát, về mặt kỹ thuật, bạn không thể có được giá trị rất cao của độ lệch và kurtosis (tất nhiên là được chuẩn hóa bởi độ lệch chuẩn mẫu): Nếu bạn phù hợp với phân phối theo phương pháp nhất thời, rõ ràng bạn không thể nói phân phối hợp lý với phương sai hợp lý điển hình của các bản ghi bằng 1 (phân phối thu nhập ở các quốc gia bất bình đẳng thu nhập từ trung bình đến cao; Mỹ, Brazil, Nam Phi, Tất cả Nga đều có thu nhập log-log cao hơn), vì nó có mức độ tổn thương lớn đáng ngạc nhiên là 111. Tất nhiên sẽ thật ngớ ngẩn khi phù hợp với phân phối hợp lý theo phương pháp, nhưng tôi chỉ muốn chứng minh rằng một số phân phối trong thế giới thực sẽ có thể phức tạp hơn những gì có thể được mô tả với 20 quan sát.

|skewness|n2n1=4.58,|kurtosis|n23n+3n1=18.05.

Một góc nhìn khác về phù hợp phân phối có thể được thực hiện thông qua ước lượng mật độ hạt nhân: cho mẫu kích thước , các quy tắc phổ biến nhất cho băng thông của h = 1,06 σ n -n=20

h=1.06σ^n1/5=0.58σ^

ms(s/m)(3+(s/m)2)202

1
Liên kết bắt buộc với "Hội chứng sức mạnh mười" trong bối cảnh sử dụng 1000 làm cỡ mẫu (trong bối cảnh các số liệu thống kê liên quan đến lập trình, nhưng nó được áp dụng ở nơi khác): zedshaw.com/essays/programmer_stats.html
Gary S. Thợ dệt

1
@whuber, bạn quá thông minh, không có ý xúc phạm. Hầu hết mọi người sẽ tính toán độ lệch là thời điểm của dữ liệu, không thông qua giả định tham số như bạn vừa làm. Bây giờ, nếu tôi nói "Giả sử bạn phù hợp với phân phối Pearson theo phương pháp khoảnh khắc" - thì lập luận này có liên quan không?
StasK

Vâng, nó sẽ có liên quan trong nhiều trường hợp. Tôi đã làm theo đề xuất của bạn để phù hợp với phân phối hợp lý bằng phương pháp khoảnh khắc và thu được độ lệch lớn - không có gì ngạc nhiên ở đó. Điều này là do tôi chỉ khớp hai khoảnh khắc đầu tiên, để cho lần thứ ba là những gì nó có thể. Nếu tôi tuân theo cùng một quy trình với bất kỳ họ phân phối nào có hai hoặc ít tham số cho phép tùy ý giây thứ ba lớn, tôi nghĩ tôi sẽ thấy hiện tượng tương tự. Với gia đình Pearson, có nhiều hơn hai tham số, chúng tôi có thể sẽ cố gắng khớp với độ lệch thực nghiệm, do đó hạn chế giá trị của nó.
whuber

2

Không. Không từ xa.

Hãy nghĩ về nó như thế này: nếu bạn có một không gian tỷ (nhân loại) và bạn đã rút 20 mẫu ra bằng bất kỳ phương pháp nào (20 người), bạn có thể sử dụng thông tin thu được chúng để hiểu rõ mọi người trên hành tinh không? Không từ xa. Có 100 tỷ ngôi sao trong dải ngân hà. Bằng cách chọn (ngẫu nhiên) 20 trong số đó bạn có thể hiểu tất cả thiên văn học thiên hà không? Không đời nào.

Trong không gian 1-d có một số phương pháp phỏng đoán, chủ yếu là các quy tắc hợp lệ có thể giúp ích, mô tả số lượng phép đo bạn muốn thực hiện. Chúng bao gồm các mức độ khác nhau của tiện ích và biện minh nhưng về mặt nào đó được bảo vệ tốt hơn so với "20". Chúng bao gồm "5 phép đo cho mỗi biến trong phương trình phù hợp của bạn", "ít nhất 35 mẫu của hàm mật độ Gaussian" và "ít nhất 300 mẫu của hàm nhị thức". Các nhà thống kê thực sự và không phải là một kẻ đánh bom mọt sách như tôi sẽ có thể liên kết các khoảng tin cậy và sự không chắc chắn cụ thể từ các nguyên tắc đầu tiên và không có máy tính.

a3r3+a2r2+a1r+a0a1r+a0dr

Xin nhớ "tốt nhất" là một ý tưởng vô nghĩa mà không có "thước đo lòng tốt". Con đường tốt nhất là gì? Nếu bạn đang đi đến cam chịu của bạn, có thể là một cực kỳ dài và dễ chịu. Nếu bạn đang đi đến lễ đăng quang của riêng bạn, có thể là một ngắn và tráng lệ. Nếu bạn đang đi qua sa mạc, một bóng mát mát mẻ. Số lượng mẫu "tốt nhất" là gì? Nó phụ thuộc rất nhiều vào vấn đề của bạn đến nỗi nó không thể bắt đầu được trả lời với chính quyền trước đó. Tất cả bọn họ? Nhiều như bạn có thể? Những điều đó chỉ làm cho một chút ý nghĩa. Vâng, nó giống như là một phần chết hoặc mang thai. Vô lý một phần là hậu quả của một vấn đề rất chưa được xác định rõ ràng.

Nếu bạn đang cố gắng dự báo chính xác luồng không khí trên một mặt phẳng? Bạn có thể cần vài triệu phép đo để vào công viên bóng. Nếu bạn muốn biết bạn cao bao nhiêu, một hoặc hai người có thể thực hiện công việc.

Điều này không đưa ra các điểm quan trọng của "kéo dài không gian" và "lấy mẫu tại các vị trí giảm thiểu phương sai trong ước tính tham số" nhưng câu hỏi gợi ý câu trả lời ở cấp độ mới hơn có liên quan. Những điều này đòi hỏi phải biết nhiều hơn về bản chất của vấn đề trước khi chúng có thể được thực hiện.

Lưu ý: chỉnh sửa để cải thiện mỗi đề xuất.


1
Bạn dường như đã đọc "tối thiểu" trong câu hỏi là "tối đa" hoặc "đủ". Không có gì bạn đã viết dường như mâu thuẫn với quy tắc tối thiểu là 20.
whuber

2
@whuber, tôi làm việc giữa những người nghĩ rằng các phép đo bổ sung là đắt tiền và nếu tôi cung cấp cho họ "số lượng mẫu tối thiểu" thì họ không nghĩ đó là sự bất bình đẳng khi số lượng mẫu tiềm năng lớn hơn thế. Họ nghĩ đó là ranh giới cho một vấn đề tối ưu hóa để giảm thiểu chi phí và cố gắng vận hành chỉ với giá trị đó. Nó là một sản phẩm của môi trường của tôi.
EngrStudent - Phục hồi Monica

1

Có lẽ đối với bối cảnh bạn đang thực hiện kiểm tra t hoặc ANOVAR - bối cảnh khá phổ biến trong các ứng dụng thống kê cơ bản - đó là xung quanh kích thước mẫu bạn cần cho mỗi nhóm để có thể tin tưởng nhiều vào ý nghĩa của từng nhóm phân phối bình thường (theo định lý giới hạn trung tâm) khi phân phối có thể được giả định là ít nhiều không đồng nhất & không cực kỳ đỉnh. Hai mươi & không phải mười chín hay hai mươi mốt vì đó là số tròn.


0

Kiểm tra Trang sức mạnh và cỡ mẫu của Russ Lenth để biết một số bài viết về chủ đề này (trong phần Tư vấn ở giữa trang).

Số lượng cá thể tối thiểu trong mẫu của bạn thay đổi tùy theo kích thước dân số, số lượng kích thước (nếu bạn đang chia dữ liệu theo danh mục) và các biện pháp (nếu bạn đang thực hiện các biện pháp liên tục về các mẫu không rõ ràng) mà bạn đang thực hiện, kích thước của vũ trụ của bạn, kỹ thuật phân tích bạn định sử dụng (đây là một điểm rất quan trọng - kỹ thuật được xác định trong quá trình lập kế hoạch nghiên cứu hoặc trong quá trình thiết kế thử nghiệm , không bao giờ sau đó) và độ phức tạp được thể hiện bởi các nghiên cứu trước đó.

Và 20 là không đủ cho bất kỳ nghiên cứu nghiêm túc nào ngoài các chủ đề "bệnh hiếm gặp" và "tâm lý thực nghiệm" (tâm lý như Popper định nghĩa trong công việc của mình).

Tinh chỉnh câu trả lời dựa trên ý kiến ​​dưới đây:

Và 20 là không đủ cho bất kỳ nghiên cứu nghiêm túc nào ngoài các chủ đề "bệnh hiếm gặp" và "tâm lý thực nghiệm" (tâm lý như Popper định nghĩa trong công việc của mình) liên quan đến việc phân phối xác suất .

Và không, bạn không nên tiếp tục đầu độc mọi người để có kích thước mẫu lớn. Ý thức chung và các bài kiểm tra tuần tự yêu cầu bạn dừng lại.


3
Tôi nghĩ rằng nó quá cực đoan để đưa ra một tuyên bố chăn rằng một mẫu 20 là "không đủ cho bất kỳ nghiên cứu nghiêm túc nào." Điều này mâu thuẫn với tuyên bố trước đây của bạn rằng kích thước mẫu thích hợp thay đổi theo mục đích, dân số, v.v. Trong một số trường hợp, một kết quả sai lệch là đủ để giết chết toàn bộ lý thuyết.
whuber

1
Nghiên cứu trường hợp và nghiên cứu định tính có thể làm tốt với 1-5 người tham gia.
Behacad

Ok, thêm "nghiên cứu trường hợp" và "nhóm tập trung" vào danh sách :) Chúng được bao gồm trong những gì tôi nói Popper gọi là "tâm lý học thực nghiệm" tho.
Lucas Gallindo

4
Sau đó, bạn nên thêm vào thiên văn học, y học, sinh học, hóa học, ... Nói cách khác, thật tệ khi khẳng định rằng 20 là "không đủ" vì nó đủ để khẳng định rằng nó đủ tốt. Trên thực tế, nó có thể tồi tệ hơn. Hãy tưởng tượng một thử nghiệm an toàn thực phẩm trong đó tám đối tượng đầu tiên được bổ sung dinh dưỡng đã chết vì tác dụng phụ không lường trước được. Bạn có ủng hộ việc tiếp tục thử nghiệm trên cơ sở tuyên bố "20 là không đủ" không?
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.