Tôi đã xem xét rất nhiều câu hỏi trên trang web này về khoảng thời gian khởi động và độ tin cậy, nhưng tôi vẫn bối rối. Một phần lý do cho sự nhầm lẫn của tôi có lẽ là tôi không đủ nâng cao về kiến thức thống kê để hiểu rất nhiều câu trả lời. Tôi mới đi được nửa chặng đường trong một khóa học thống kê giới thiệu và trình độ toán của tôi chỉ ở giữa Đại số II, vì vậy, bất cứ điều gì vượt qua mức đó chỉ khiến tôi bối rối. Nếu một trong những người có kiến thức trên trang web này có thể giải thích vấn đề này ở cấp độ của tôi thì nó sẽ vô cùng hữu ích.
Chúng tôi đã học trong lớp cách lấy các mẫu tương tự bằng phương pháp bootstrap và sử dụng chúng để xây dựng khoảng tin cậy cho một số thống kê mà chúng tôi muốn đo. Vì vậy, ví dụ, giả sử chúng tôi lấy một mẫu từ một dân số lớn và thấy rằng 40% nói rằng họ sẽ bỏ phiếu cho Ứng cử viên A. Chúng tôi cho rằng mẫu này là một phản ánh khá chính xác về dân số ban đầu, trong trường hợp đó chúng tôi có thể lấy mẫu từ nó để khám phá một cái gì đó về dân số. Vì vậy, chúng tôi lấy các mẫu và tìm (sử dụng mức tin cậy 95%) rằng khoảng tin cậy kết quả nằm trong khoảng từ 35% đến 45%.
Câu hỏi của tôi là, khoảng tin cậy này thực sự có nghĩa là gì?
Tôi tiếp tục đọc rằng có một sự khác biệt giữa Khoảng tin cậy (Thường xuyên) và Khoảng tin cậy (Bayesian). Nếu tôi hiểu chính xác, một khoảng tin cậy sẽ nói rằng có 95% khả năng trong tình huống của chúng tôi , tham số thực nằm trong khoảng cho trước (35% -45%), trong khi khoảng tin cậy sẽ nói rằng có 95% trong khoảng này loại tình huống (nhưng không nhất thiết trong tình huống của chúng tôi cụ thể) phương pháp chúng tôi đang sử dụng sẽ báo cáo chính xác rằng tham số thực nằm trong khoảng đã cho.
Giả sử định nghĩa này là chính xác, câu hỏi của tôi là: "Thông số thực" mà chúng ta đang nói đến khi sử dụng khoảng tin cậy được xây dựng bằng phương pháp bootstrap là gì? Chúng ta đang đề cập đến (a) tham số thực sự của dân số ban đầu , hay (b) tham số thực sự của mẫu ? Nếu (a), thì chúng ta sẽ nói rằng 95% thời gian phương thức bootstrap sẽ báo cáo chính xác các tuyên bố đúng về dân số ban đầu. Nhưng làm thế nào chúng ta có thể biết điều đó? Không phải toàn bộ phương thức bootstrap dựa trên giả địnhrằng mẫu ban đầu là một phản ánh chính xác của dân số được lấy từ đâu? Nếu (b) thì tôi không hiểu ý nghĩa của khoảng tin cậy. Chúng ta đã không biết thông số thực sự của mẫu? Đó là một phép đo đơn giản!
Tôi đã thảo luận điều này với giáo viên của tôi và cô ấy khá hữu ích. Nhưng tôi vẫn bối rối.