Tôi có tài liệu tham khảo khuyên nên xem xét cỡ mẫu tối thiểu 20 để phân phối dữ liệu phù hợp.
Có bất kỳ ý nghĩa trong điều này?
cảm ơn
Tôi có tài liệu tham khảo khuyên nên xem xét cỡ mẫu tối thiểu 20 để phân phối dữ liệu phù hợp.
Có bất kỳ ý nghĩa trong điều này?
cảm ơn
Câu trả lời:
Rất nhiều điều này phụ thuộc vào phân phối dự kiến và câu hỏi nghiên cứu của bạn là gì. Theo quy tắc của ngón tay cái, bạn nên cảnh giác với các quy tắc của ngón tay cái. Nếu bạn biết phân phối dự kiến, hãy chạy một số mô phỏng có kích thước khác nhau và xác định tần suất mô phỏng mẫu phản ánh phân phối thực tế. Điều này sẽ cung cấp cho bạn một số hướng dẫn như kích thước mẫu yêu cầu cuối cùng.
Tôi nghĩ số ma thuật cỡ mẫu là 1.000. Đó là điều mà hầu hết các cuộc thăm dò quốc gia Mỹ có, để tạo ra sai số khoảng 3%: Trong thực tế, các kích thước mẫu có hiệu quả thấp hơn so với 1000, giống như 700 hoặc lâu hơn, do khả năng không đồng đều lựa chọn và không đáp ứng điều chỉnh, dẫn đến sai số 3,7% .
Chỉ với 20 quan sát, về mặt kỹ thuật, bạn không thể có được giá trị rất cao của độ lệch và kurtosis (tất nhiên là được chuẩn hóa bởi độ lệch chuẩn mẫu): Nếu bạn phù hợp với phân phối theo phương pháp nhất thời, rõ ràng bạn không thể nói phân phối hợp lý với phương sai hợp lý điển hình của các bản ghi bằng 1 (phân phối thu nhập ở các quốc gia bất bình đẳng thu nhập từ trung bình đến cao; Mỹ, Brazil, Nam Phi, Tất cả Nga đều có thu nhập log-log cao hơn), vì nó có mức độ tổn thương lớn đáng ngạc nhiên là 111. Tất nhiên sẽ thật ngớ ngẩn khi phù hợp với phân phối hợp lý theo phương pháp, nhưng tôi chỉ muốn chứng minh rằng một số phân phối trong thế giới thực sẽ có thể phức tạp hơn những gì có thể được mô tả với 20 quan sát.
Một góc nhìn khác về phù hợp phân phối có thể được thực hiện thông qua ước lượng mật độ hạt nhân: cho mẫu kích thước , các quy tắc phổ biến nhất cho băng thông của h = 1,06 σ n -
Không. Không từ xa.
Hãy nghĩ về nó như thế này: nếu bạn có một không gian tỷ (nhân loại) và bạn đã rút 20 mẫu ra bằng bất kỳ phương pháp nào (20 người), bạn có thể sử dụng thông tin thu được chúng để hiểu rõ mọi người trên hành tinh không? Không từ xa. Có 100 tỷ ngôi sao trong dải ngân hà. Bằng cách chọn (ngẫu nhiên) 20 trong số đó bạn có thể hiểu tất cả thiên văn học thiên hà không? Không đời nào.
Trong không gian 1-d có một số phương pháp phỏng đoán, chủ yếu là các quy tắc hợp lệ có thể giúp ích, mô tả số lượng phép đo bạn muốn thực hiện. Chúng bao gồm các mức độ khác nhau của tiện ích và biện minh nhưng về mặt nào đó được bảo vệ tốt hơn so với "20". Chúng bao gồm "5 phép đo cho mỗi biến trong phương trình phù hợp của bạn", "ít nhất 35 mẫu của hàm mật độ Gaussian" và "ít nhất 300 mẫu của hàm nhị thức". Các nhà thống kê thực sự và không phải là một kẻ đánh bom mọt sách như tôi sẽ có thể liên kết các khoảng tin cậy và sự không chắc chắn cụ thể từ các nguyên tắc đầu tiên và không có máy tính.
Xin nhớ "tốt nhất" là một ý tưởng vô nghĩa mà không có "thước đo lòng tốt". Con đường tốt nhất là gì? Nếu bạn đang đi đến cam chịu của bạn, có thể là một cực kỳ dài và dễ chịu. Nếu bạn đang đi đến lễ đăng quang của riêng bạn, có thể là một ngắn và tráng lệ. Nếu bạn đang đi qua sa mạc, một bóng mát mát mẻ. Số lượng mẫu "tốt nhất" là gì? Nó phụ thuộc rất nhiều vào vấn đề của bạn đến nỗi nó không thể bắt đầu được trả lời với chính quyền trước đó. Tất cả bọn họ? Nhiều như bạn có thể? Những điều đó chỉ làm cho một chút ý nghĩa. Vâng, nó giống như là một phần chết hoặc mang thai. Vô lý một phần là hậu quả của một vấn đề rất chưa được xác định rõ ràng.
Nếu bạn đang cố gắng dự báo chính xác luồng không khí trên một mặt phẳng? Bạn có thể cần vài triệu phép đo để vào công viên bóng. Nếu bạn muốn biết bạn cao bao nhiêu, một hoặc hai người có thể thực hiện công việc.
Điều này không đưa ra các điểm quan trọng của "kéo dài không gian" và "lấy mẫu tại các vị trí giảm thiểu phương sai trong ước tính tham số" nhưng câu hỏi gợi ý câu trả lời ở cấp độ mới hơn có liên quan. Những điều này đòi hỏi phải biết nhiều hơn về bản chất của vấn đề trước khi chúng có thể được thực hiện.
Lưu ý: chỉnh sửa để cải thiện mỗi đề xuất.
Có lẽ đối với bối cảnh bạn đang thực hiện kiểm tra t hoặc ANOVAR - bối cảnh khá phổ biến trong các ứng dụng thống kê cơ bản - đó là xung quanh kích thước mẫu bạn cần cho mỗi nhóm để có thể tin tưởng nhiều vào ý nghĩa của từng nhóm phân phối bình thường (theo định lý giới hạn trung tâm) khi phân phối có thể được giả định là ít nhiều không đồng nhất & không cực kỳ đỉnh. Hai mươi & không phải mười chín hay hai mươi mốt vì đó là số tròn.
Kiểm tra Trang sức mạnh và cỡ mẫu của Russ Lenth để biết một số bài viết về chủ đề này (trong phần Tư vấn ở giữa trang).
Số lượng cá thể tối thiểu trong mẫu của bạn thay đổi tùy theo kích thước dân số, số lượng kích thước (nếu bạn đang chia dữ liệu theo danh mục) và các biện pháp (nếu bạn đang thực hiện các biện pháp liên tục về các mẫu không rõ ràng) mà bạn đang thực hiện, kích thước của vũ trụ của bạn, kỹ thuật phân tích bạn định sử dụng (đây là một điểm rất quan trọng - kỹ thuật được xác định trong quá trình lập kế hoạch nghiên cứu hoặc trong quá trình thiết kế thử nghiệm , không bao giờ sau đó) và độ phức tạp được thể hiện bởi các nghiên cứu trước đó.
Và 20 là không đủ cho bất kỳ nghiên cứu nghiêm túc nào ngoài các chủ đề "bệnh hiếm gặp" và "tâm lý thực nghiệm" (tâm lý như Popper định nghĩa trong công việc của mình).
Và 20 là không đủ cho bất kỳ nghiên cứu nghiêm túc nào ngoài các chủ đề "bệnh hiếm gặp" và "tâm lý thực nghiệm" (tâm lý như Popper định nghĩa trong công việc của mình) liên quan đến việc phân phối xác suất .
Và không, bạn không nên tiếp tục đầu độc mọi người để có kích thước mẫu lớn. Ý thức chung và các bài kiểm tra tuần tự yêu cầu bạn dừng lại.