Ví dụ với 100 thử nghiệm Bernoulli
Việc xây dựng các khoảng tin cậy có thể được đặt trong một âm mưu của θ đấu với θ^ như ở đây:
Chúng ta có thể từ chối một giả thuyết null với các khoảng tin cậy được tạo ra thông qua lấy mẫu chứ không phải là giả thuyết null?
Trong câu trả lời của tôi cho câu hỏi đó, tôi sử dụng biểu đồ sau:
Lưu ý rằng hình ảnh này là một tác phẩm kinh điển và được chuyển thể từ The Use of Confidence hoặc Fiducial Limits Illustrated in the Case of the Binomial CJ Clopper và ES Pearson Biometrika Vol. 26, số 4 (tháng 12 năm 1934), trang 404-413
Bạn có thể định nghĩa một α-% độ tin cậy theo hai cách:
theo hướng dọc L(θ)<X<U(θ) xác suất cho dữ liệu X, có điều kiện về tham số thực sự θ, để rơi vào trong giới hạn này là α .
theo hướng ngang L(X)<θ<U(X) xác suất mà một thử nghiệm sẽ có tham số thực trong khoảng tin cậy là α%.
Sự tương ứng giữa hai hướng
Vì vậy, điểm chính là có sự tương ứng giữa các khoảngL(X),U(X) và các khoảng L(θ),U(θ). Đây là nơi mà hai phương pháp đến từ.
Khi bạn muốn L(X) và U(X)càng gần càng tốt ( "ngắn nhất có thể (1−α) khoảng tin cậy cấp độ " ) sau đó bạn đang cố gắng làm cho diện tích của toàn bộ khu vực càng nhỏ càng tốt và điều này tương tự như nhận đượcL(θ) và U(θ)càng gần càng tốt. (nhiều hơn hoặc ít hơn, không có cách duy nhất để có được khoảng thời gian ngắn nhất có thể, ví dụ: bạn có thể rút ngắn khoảng cách cho một loại quan sátθ^ với chi phí của một loại quan sát khác θ^)
Ví dụ vớiθ^∼N(μ=θ,σ2=1+θ2/3)
Để minh họa sự khác biệt giữa phương pháp đầu tiên và thứ hai chúng tôi điều chỉnh ví dụ một chút như vậy mà chúng ta có một trường hợp hai phương pháp làm khác nhau.
Để không phải là hằng số mà thay vào đó có một số mối quan hệ vớiσμ=θ θ^∼N(μ=θ,σ2=1+θ2/3)
thì hàm mật độ xác suất cho , có điều kiện trên làθ^θf(θ^,θ)=12π(1+θ2/3)−−−−−−−−−−√exp[−(θ−θ^)22(1+θ2/3)]
Hãy tưởng tượng hàm mật độ xác suất này vẽ như là hàm của và .f(θ^,θ)θθ^
Chú thích: Đường màu đỏ là ranh giới trên cho khoảng tin cậy và đường màu xanh là ranh giới dưới cho khoảng tin cậy. Khoảng tin cậy được rút ra cho (khoảng 68,3%). Các đường màu đen dày là pdf (2 lần) và hàm khả năng giao nhau trong các điểm và .±1σ(θ,θ^)=(−3,−1)(θ,θ^)=(0,−1)
PDF Theo hướng từ trái sang phải (không đổi ), chúng ta có pdf để quan sát đưa ra . Bạn thấy hai trong số này được chiếu (trong mặt phẳng ). Lưu ý rằng ranh giới -values ( chọn để trở thành khu vực mật độ cao nhất) đang ở trên cùng một chiều cao cho một pdf duy nhất, nhưng không phải cho không ở cùng độ cao cho khác nhau pdf của (bằng chiều cao đó có nghĩa giá trị của )θθ^θθ=7pp<1−αf(θ^,θ)
Hàm khả năng Theo hướng từ trên xuống dưới (hằng ), chúng ta có hàm khả năng cho khi quan sát . Bạn thấy một trong những dự án bên phải.θ^θθ^
Trong trường hợp cụ thể này, khi bạn chọn khối lượng 68% với mật độ cao nhất cho hằng số thì bạn không nhận được giống như chọn khối lượng 68% với khả năng cao nhất cho hằng số .θθ^
Đối với các tỷ lệ phần trăm khác của khoảng tin cậy, bạn sẽ có một hoặc cả hai ranh giới tại và khoảng thời gian có thể bao gồm hai phần rời rạc. Vì vậy, đó rõ ràng không phải là nơi có mật độ cao nhất của hàm khả năng (phương pháp 2). Đây là một ví dụ khá giả tạo (mặc dù nó đơn giản và tốt đẹp như thế nào dẫn đến nhiều chi tiết này) nhưng đối với các trường hợp phổ biến hơn, bạn có thể dễ dàng nhận ra rằng hai phương pháp không trùng nhau (xem ví dụ ở đây có khoảng tin cậy và khoảng tin cậy với một căn hộ trước được so sánh cho tham số tỷ lệ của phân bố mũ).±∞
Khi nào hai phương thức giống nhau?
Đường ngang và dọc này cho kết quả tương tự, khi ranh giới và , ràng buộc các khoảng trong ô vs là các đường đẳng trị cho . Nếu các ranh giới ở mọi nơi có cùng độ cao so với cả hai hướng, bạn có thể cải thiện.ULθθ^f(θ^;θ)
(tương phản với điều này: trong ví dụ với các ranh giới khoảng tin cậy sẽ không ở cùng giá trị cho khác nhau , vì khối lượng xác suất sẽ lan rộng hơn, do đó mật độ thấp hơn, cho lớn hơn . Điều này làm cho và sẽ không ở cùng giá trị , ít nhất là đối với một số , Điều này mâu thuẫn với phương pháp 2 tìm cách chọn mật độ cao nhất cho mộtθ^∼N(θ,1+θ2/3)f(θ^,θ)θ|θ|θlowθhighf(θ^;θ)θ^f(θ^;θ)θ^. Trong hình trên, tôi đã cố gắng nhấn mạnh điều này bằng cách vẽ hai hàm pdf liên quan đến ranh giới khoảng tin cậy ở giá trị ; bạn có thể thấy rằng chúng có các giá trị khác nhau của pdf tại các ranh giới này.) θ^=−1
Trên thực tế, phương pháp thứ hai có vẻ không hoàn toàn đúng (nó là một biến thể của khoảng khả năng hoặc khoảng tin cậy hơn khoảng tin cậy) và khi bạn chọn mật độ % theo hướng ngang (giới hạn % của khối lượng của hàm khả năng) sau đó bạn có thể phụ thuộc vào xác suất trước đó .αα
Trong ví dụ với phân phối bình thường, nó không phải là một vấn đề và hai phương thức căn chỉnh. Đối với một minh họa cũng xem câu trả lời này của Christoph Hanck . Có các ranh giới là đường đẳng. Khi bạn thay đổi , chức năng chỉ thực hiện thay đổi và không thay đổi 'hình dạng'.θf(θ^,θ)
Xác suất tin tưởng
Khoảng tin cậy, khi các giới hạn được tạo ra theo hướng thẳng đứng, là độc lập của các xác suất trước. Đây không phải là trường hợp với phương pháp thứ 2.
Sự khác biệt này giữa phương pháp thứ nhất và phương pháp thứ hai có thể là một ví dụ điển hình cho sự khác biệt tinh tế giữa xác suất fiducial và khoảng tin cậy.