Logic cơ bản của việc xây dựng khoảng tin cậy


7

Hãy xem xét một mô hình với một tham số quan tâm, θvà công cụ ước tính điểm của nó, θ^. Để đơn giản, giả sử θ^N(θ,σ2/n)(trong nhiều trường hợp, điều này có thể được chứng minh là không có triệu chứng). Có hai cách để xây dựng một khoảng thời gian ngắn nhất có thể(1α) mức độ tin cậy.

  1. Đối với bất kỳ giá trị thực θ, Tôi muốn khoảng thời gian ngắn nhất có thể (θ^lower,θ^upper) cái đó có (1α) xác suất bắt θ. Tôi chọn khu vực mật độ cao nhất trong phân phối củaθ^ được θ, f(θ^;θ), do đó xác suất tích lũy cho khu vực đó là (1α). Tôi xác định công cụ ước tính khoảng sao cho mỗi ước tính điểmθ^ trong khu vực, ước tính khoảng thời gian tương ứng sẽ bao gồm θ.
    Kể từ khi phân phốiθ^ là giống nhau cho bất kỳ giá trị thực θ ngoại trừ thay đổi vị trí, cơ chế (quy tắc) để xây dựng khoảng thời gian không phụ thuộc vào thực tế θLà. Do đó, nó sẽ bao gồm bất kỳ sự thậtθ với (1α) xác suất.

  2. Ước tính điểm θ^, Tôi đang xem xét dưới giá trị thực sự θnó có khả năng đã được tạo ra. Biết phân phốiθ^ cho bất kỳ sự thật nào θ, f(θ^;θ), Tôi chọn những θs mang lại giá trị mật độ cao nhất. Tôi giới hạn lựa chọn chỉ bao gồm giá trị θ có xác suất tích lũy α cho các giá trị ít nhất là cực trị như θ; nói cách khác, giá trị θ mà tương ứng p-giá trị liên quan đến θ^ là ít nhất α.

Cách tiếp cận đầu tiên tập trung trực tiếp vào việc đảm bảo rằng bất cứ điều gì là sự thật θ, nó được bao gồm trong (1α)chia sẻ các trường hợp lấy mẫu. Cách tiếp cận thứ hai tìm kiếm ứng cử viên tốt nhấtθs làm cho nhận ra θ^ có khả năng, trong khi loại bỏ θs theo đó θ^không chắc. Đường giữa hai (có thể so với không có khả năng) được rút ra một cách tùy tiện theo quan điểm của mục tiêu ban đầu, nhưng nó xảy ra là đúng dòng.

Hai quy tắc để xây dựng một khoảng cho cùng một câu trả lời trong ví dụ đơn giản này.
(nếu bất kỳ một trong hai) là động lực chính xác cho, hoặc cách suy nghĩ chính xác về việc xây dựng một khoảng tin cậy?
(Có lẽ loại bỏ giả định phân phối choθ^ ở trên sẽ làm mất hiệu lực một trong những cách tiếp cận, làm rõ rằng nó thường không phù hợp và chỉ đưa ra câu trả lời đúng trong ví dụ này bởi sự trùng hợp?)


Điều gì (nếu có) là động lực của bạn ở đây? Có vẻ như một sự khác biệt rất tinh tế cho phần lớn các trường hợp.
Xiaomi

@Xiaomi, cảm ơn bạn đã quan tâm! Kết quả của hai cách tiếp cận là như nhau, nhưng cách đến đó rõ ràng là rất khác nhau (ít nhất đó là nhận thức của tôi). Tôi tự hỏi cách nào người ta nên tiến hành để đúng với logic (và có lẽ là lịch sử) của ước tính khoảng tin cậy. Có lẽ một trong những cách chỉ thỉnh thoảng đưa ra câu trả lời đúng. Tôi khá lo ngại, mặc dù sự khác biệt có thể xuất hiện một cách tinh tế đối với một số người. Bạn sẽ tình cờ biết câu trả lời?
Richard Hardy

Sau câu trả lời của Martijn Weterings, tôi bắt đầu nghĩ rằng cách tiếp cận thứ hai có thể là một trường hợp đặc biệt để xây dựng một khoảng đáng tin cậy (với một căn hộ trước đóθ).
Richard Hardy

Câu hỏi liên quan về sự khác biệt giữa khoảng tin cậy và khoảng tin cậy với các số liệu thống kê trước đó.stackexchange.com/questions/355109/ Khăn (chúng không giống nhau và đặc biệt đáng chú ý là khoảng tin cậy không thay đổi khi thay đổi biến trong khi a khoảng tin cậy, nơi cần thay đổi trước nếu bạn muốn giữ cho nó 'phẳng', không giữ nguyên)
Sextus Empiricus

Câu cuối cùng của đoạn giải thích phương pháp thứ hai "Tôi giới hạn lựa chọn chỉ bao gồm ... các giá trịθ giá trị p tương ứng được liên kết với θ là ít nhất α" Thực sự rất giống với phương pháp đầu tiên.
Sextus Empiricus

Câu trả lời:


5

Ví dụ với 100 thử nghiệm Bernoulli

Việc xây dựng các khoảng tin cậy có thể được đặt trong một âm mưu của θ đấu với θ^ như ở đây:

Chúng ta có thể từ chối một giả thuyết null với các khoảng tin cậy được tạo ra thông qua lấy mẫu chứ không phải là giả thuyết null?

Trong câu trả lời của tôi cho câu hỏi đó, tôi sử dụng biểu đồ sau:

khoảng tin cậy

Lưu ý rằng hình ảnh này là một tác phẩm kinh điển và được chuyển thể từ The Use of Confidence hoặc Fiducial Limits Illustrated in the Case of the Binomial CJ Clopper và ES Pearson Biometrika Vol. 26, số 4 (tháng 12 năm 1934), trang 404-413

Bạn có thể định nghĩa một α-% độ tin cậy theo hai cách:

  • theo hướng dọc L(θ)<X<U(θ) xác suất cho dữ liệu X, có điều kiện về tham số thực sự θ, để rơi vào trong giới hạn này là α .

  • theo hướng ngang L(X)<θ<U(X) xác suất mà một thử nghiệm sẽ có tham số thực trong khoảng tin cậy là α%.


Sự tương ứng giữa hai hướng

Vì vậy, điểm chính là có sự tương ứng giữa các khoảngL(X),U(X) và các khoảng L(θ),U(θ). Đây là nơi mà hai phương pháp đến từ.

Khi bạn muốn L(X)U(X)càng gần càng tốt ( "ngắn nhất có thể (1α) khoảng tin cậy cấp độ " ) sau đó bạn đang cố gắng làm cho diện tích của toàn bộ khu vực càng nhỏ càng tốt và điều này tương tự như nhận đượcL(θ)U(θ)càng gần càng tốt. (nhiều hơn hoặc ít hơn, không có cách duy nhất để có được khoảng thời gian ngắn nhất có thể, ví dụ: bạn có thể rút ngắn khoảng cách cho một loại quan sátθ^ với chi phí của một loại quan sát khác θ^)


Ví dụ vớiθ^N(μ=θ,σ2=1+θ2/3)

Để minh họa sự khác biệt giữa phương pháp đầu tiên và thứ hai chúng tôi điều chỉnh ví dụ một chút như vậy mà chúng ta có một trường hợp hai phương pháp làm khác nhau.

Để không phải là hằng số mà thay vào đó có một số mối quan hệ vớiσμ=θ

θ^N(μ=θ,σ2=1+θ2/3)

thì hàm mật độ xác suất cho , có điều kiện trên làθ^θ

f(θ^,θ)=12π(1+θ2/3)exp[(θθ^)22(1+θ2/3)]

Hãy tưởng tượng hàm mật độ xác suất này vẽ như là hàm của và .f(θ^,θ)θθ^

thí dụ

Chú thích: Đường màu đỏ là ranh giới trên cho khoảng tin cậy và đường màu xanh là ranh giới dưới cho khoảng tin cậy. Khoảng tin cậy được rút ra cho (khoảng 68,3%). Các đường màu đen dày là pdf (2 lần) và hàm khả năng giao nhau trong các điểm và .±1σ(θ,θ^)=(3,1)(θ,θ^)=(0,1)

PDF Theo hướng từ trái sang phải (không đổi ), chúng ta có pdf để quan sát đưa ra . Bạn thấy hai trong số này được chiếu (trong mặt phẳng ). Lưu ý rằng ranh giới -values ( chọn để trở thành khu vực mật độ cao nhất) đang ở trên cùng một chiều cao cho một pdf duy nhất, nhưng không phải cho không ở cùng độ cao cho khác nhau pdf của (bằng chiều cao đó có nghĩa giá trị của )θθ^θθ=7pp<1αf(θ^,θ)

Hàm khả năng Theo hướng từ trên xuống dưới (hằng ), chúng ta có hàm khả năng cho khi quan sát . Bạn thấy một trong những dự án bên phải.θ^θθ^

Trong trường hợp cụ thể này, khi bạn chọn khối lượng 68% với mật độ cao nhất cho hằng số thì bạn không nhận được giống như chọn khối lượng 68% với khả năng cao nhất cho hằng số .θθ^

Đối với các tỷ lệ phần trăm khác của khoảng tin cậy, bạn sẽ có một hoặc cả hai ranh giới tại và khoảng thời gian có thể bao gồm hai phần rời rạc. Vì vậy, đó rõ ràng không phải là nơi có mật độ cao nhất của hàm khả năng (phương pháp 2). Đây là một ví dụ khá giả tạo (mặc dù nó đơn giản và tốt đẹp như thế nào dẫn đến nhiều chi tiết này) nhưng đối với các trường hợp phổ biến hơn, bạn có thể dễ dàng nhận ra rằng hai phương pháp không trùng nhau (xem ví dụ ở đây có khoảng tin cậy và khoảng tin cậy với một căn hộ trước được so sánh cho tham số tỷ lệ của phân bố mũ).±

Khi nào hai phương thức giống nhau?

Đường ngang và dọc này cho kết quả tương tự, khi ranh giới và , ràng buộc các khoảng trong ô vs là các đường đẳng trị cho . Nếu các ranh giới ở mọi nơi có cùng độ cao so với cả hai hướng, bạn có thể cải thiện.ULθθ^f(θ^;θ)

(tương phản với điều này: trong ví dụ với các ranh giới khoảng tin cậy sẽ không ở cùng giá trị cho khác nhau , vì khối lượng xác suất sẽ lan rộng hơn, do đó mật độ thấp hơn, cho lớn hơn . Điều này làm cho và sẽ không ở cùng giá trị , ít nhất là đối với một số , Điều này mâu thuẫn với phương pháp 2 tìm cách chọn mật độ cao nhất cho mộtθ^N(θ,1+θ2/3)f(θ^,θ)θ|θ|θlowθhighf(θ^;θ)θ^f(θ^;θ)θ^. Trong hình trên, tôi đã cố gắng nhấn mạnh điều này bằng cách vẽ hai hàm pdf liên quan đến ranh giới khoảng tin cậy ở giá trị ; bạn có thể thấy rằng chúng có các giá trị khác nhau của pdf tại các ranh giới này.) θ^=1

Trên thực tế, phương pháp thứ hai có vẻ không hoàn toàn đúng (nó là một biến thể của khoảng khả năng hoặc khoảng tin cậy hơn khoảng tin cậy) và khi bạn chọn mật độ % theo hướng ngang (giới hạn % của khối lượng của hàm khả năng) sau đó bạn có thể phụ thuộc vào xác suất trước đó .αα

Trong ví dụ với phân phối bình thường, nó không phải là một vấn đề và hai phương thức căn chỉnh. Đối với một minh họa cũng xem câu trả lời này của Christoph Hanck . Có các ranh giới là đường đẳng. Khi bạn thay đổi , chức năng chỉ thực hiện thay đổi và không thay đổi 'hình dạng'.θf(θ^,θ)

Xác suất tin tưởng

Khoảng tin cậy, khi các giới hạn được tạo ra theo hướng thẳng đứng, là độc lập của các xác suất trước. Đây không phải là trường hợp với phương pháp thứ 2.

Sự khác biệt này giữa phương pháp thứ nhất và phương pháp thứ hai có thể là một ví dụ điển hình cho sự khác biệt tinh tế giữa xác suất fiducial và khoảng tin cậy.


Điểm tốt. Tôi đã nghi ngờ một số xác suất trước đây có thể đang cố gắng lẻn vào trong cách tiếp cận thứ hai ...
Richard Hardy

Tôi sẽ thử và xem liệu tôi có thể đưa ra một số đại diện hình ảnh tốt hơn. Khi bạn vẽ đồ thị làm bề mặt thì bạn sẽ có được hình dạng sườn núi, nhưng trong trường hợp thử nghiệm Bernouilli, hình dạng đó nhỏ hơn và cao hơn ở các cạnh. Trong trường hợp phân phối bình thường, nó là đối xứng hơn. f(θ^;θ)
Sextus Empiricus

Điều đó (một đại diện trực quan mới) có thể giúp rất nhiều! Ngoài ra, bạn có thể giải thích về Hãy tưởng tượng hàm mật độ xác suất cho điều kiện trên vẽ trong 2D so vớif(θ^;θ)θ^θθθ^ không? Bạn có thể viết lại nó bằng cách nào đó? Tôi gặp khó khăn trong việc hiểu điều này và do đó, những gì có nghĩa là ngang so với dọc trong phần còn lại; có lẽ bạn có thể đặt tên như "hướng " cho chiều ngang và "hướng " cho chiều dọc (hoặc nếu không, tùy theo trường hợp nào là chính xác). θθ^
Richard Hardy

Tôi muốn thêm một hình ảnh về điều đó. Nó tương tự như hình ảnh hiện tại. Chúng ta thường thấy là một hàm có sửa nhưng chúng ta có thể thay đổi nó thành hàm với không được sửa. Sau đó, khi chúng tôi tạo khoảng tin cậy, chúng tôi tạo ranh giới và bị ràng buộc, theo hướng dọc ( ), % khối lượng. Vì chúng tôi làm điều này cho mọi trong hình ảnh 2D có ranh giới chứaf(θ^;θ)θf(θ^,θ)θ L(θ)U(θ)θ^αθα% khối lượng. Chúng ta có thể tưởng tượng làm điều tương tự theo hướng khác (nhưng nó sẽ khác).
Sextus Empiricus

1
@whuber hình ảnh khá cũ, tôi đã sử dụng hình ảnh từ đây jstor.org/urdy/2331986 Việc sử dụng niềm tin hoặc giới hạn Fiducial được minh họa trong trường hợp của Binomial CJ ​​Clopper và ES Pearson Biometrika Vol. 26, Số 4 (Tháng 12 năm 1934), trang 404-413 (và tôi đồng ý rằng ý tưởng chọn một khu vực mà bạn nhận được 95% khối lượng là không chính xác, chỉ một trong những khu vực đó sẽ mang lại sự tự tin khoảng thời gian, vấn đề có thể nằm trong tuyên bố của câu hỏi "Tôi muốn khoảng thời gian ngắn nhất có thể" không rõ ràng. Không có cách duy nhất nào để có được điều này.)
Sextus Empiricus
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.