Điều gì có nghĩa là một cái gì đó có tính chất thường xuyên tốt?


12

Tôi thường nghe cụm từ này, nhưng chưa bao giờ hoàn toàn hiểu ý nghĩa của nó. Cụm từ "thuộc tính thường xuyên tốt" hiện có ~ 2750 lượt truy cập trên google, 536 trên scholar.google.com và 4 trên stats.stackexchange.com .

Điều gần nhất mà tôi tìm thấy với một định nghĩa rõ ràng đến từ slide cuối cùng trong bài thuyết trình của Đại học Stanford này , trong đó nêu rõ

[T] ý nghĩa của việc báo cáo khoảng tin cậy 95% là bạn Bẫy bẫy thông số thực sự trong 95% khiếu nại mà bạn đưa ra, thậm chí qua các vấn đề ước tính khác nhau. Đây là đặc điểm xác định của các thủ tục ước tính với các thuộc tính thường xuyên tốt: chúng giữ để xem xét kỹ lưỡng khi sử dụng nhiều lần.

Suy nghĩ một chút về điều này, tôi cho rằng cụm từ "tính chất thường xuyên tốt" ngụ ý một số đánh giá về phương pháp Bayes, và đặc biệt là phương pháp xây dựng khoảng thời gian của Bayes. Tôi hiểu rằng các khoảng Bayes có nghĩa là chứa giá trị thực của tham số với xác suất . Các khoảng thường xuyên có nghĩa là được xây dựng sao cho nếu quá trình xây dựng khoảng được lặp lại nhiều lần, khoảng các khoảng sẽ chứa giá trị thực của tham số. Nói chung, các khoảng Bayes không đưa ra bất kỳ lời hứa nào về% của các khoảng sẽ bao gồm giá trị thực của tham số. Tuy nhiên, một số phương thức Bayes cũng có thuộc tính mà nếu lặp đi lặp lại nhiều lần, chúng bao gồm giá trị thực khoảngpp100%p100%của thời gian Khi họ có tài sản đó, chúng tôi nói họ có "tài sản thường xuyên tốt".

Có đúng không? Tôi nghĩ rằng phải có nhiều hơn thế, vì cụm từ này đề cập đến các thuộc tính thường xuyên tốt , thay vì có một tài sản thường xuyên tốt .


1
Tôi thực sự thích cách bạn nghĩ ra câu hỏi này. Trong những ngày đầu, Sir Harold Jeffreys đã cố gắng xây dựng các bản phân phối sau của Bayes hoạt động giống như các hàm khả năng và do đó có các đặc tính thường xuyên tốt. Vì vậy, nó có nghĩa là để xây dựng một phân phối trước "thống nhất". Ý tưởng là sử dụng ưu tiên như vậy có nghĩa là ưu tiên là trung tính và không ảnh hưởng đến suy luận. Vì vậy, điều này áp dụng cho nhiều hơn là chỉ làm cho các khoảng tin cậy trông giống như khoảng tin cậy. Nhưng Jeffreys gặp một số rắc rối vì có những trường hợp "đồng phục" trước đó không phù hợp.
Michael R. Chernick

1
Không đúng có nghĩa là mật độ trước không tích hợp đến 1. Dường như Jeffreys tin rằng phương pháp Bayes cần phải được chứng minh bằng cách đồng ý với phương pháp thường xuyên. Cuối cùng Bayes đã bác bỏ quan niệm này bởi vì giá trị của cách tiếp cận mà họ tuyên bố là có thông tin trước đó ảnh hưởng đến suy luận và vì vậy họ thích sử dụng các linh mục "thông tin" thích hợp.
Michael R. Chernick

2
@MichaelCécick: bạn có thể cung cấp một tài liệu tham khảo chính xác về Jeffreys tìm kiếm các thuộc tính thường xuyên cho các công cụ ước tính Bayes không? Tôi chưa bao giờ nghe câu chuyện này. Và tôi cũng nghi ngờ Jeffreys hoàn toàn lo lắng về việc sử dụng các linh mục không phù hợp, tất cả đều vượt qua Lý thuyết Xác suất .
Tây An

Tôi yêu câu hỏi này!
Alexis

1
@ Xi'an như một vấn đề thực tế, đối với mô hình Beta-Binomial, đó là Haldane trước (không phù hợp), điều này dẫn đến ước tính thường xuyên, không phải là Jeffreys trước (trong trường hợp này là phù hợp). Tôi cũng chưa bao giờ nghe nói rằng Jeffreys đang tìm kiếm những đặc tính thường xuyên tốt: tôi nghĩ rằng anh ta đang tìm kiếm những linh mục khách quan, và theo mục tiêu, anh ta có nghĩa là bất biến dưới sự tái phạm.
DeltaIV

Câu trả lời:


3

Một điều khó khăn về các thuộc tính thường xuyên tốt là chúng là các thuộc tính của một thủ tục chứ không phải là các thuộc tính của một kết quả hoặc suy luận cụ thể. Một thủ tục thường xuyên tốt mang lại những suy luận chính xác về tỷ lệ các trường hợp được chỉ định trong thời gian dài, nhưng một thủ tục Bayes tốt thường là một quy trình đưa ra những suy luận chính xác trong từng trường hợp cụ thể.

Ví dụ, hãy xem xét một quy trình Bayes "tốt" theo nghĩa chung vì nó cung cấp phân phối xác suất sau hoặc khoảng tin cậy thể hiện chính xác sự kết hợp của bằng chứng (hàm khả năng) với phân phối xác suất trước. Nếu trước đó chứa thông tin chính xác (giả sử, thay vì ý kiến ​​trống rỗng hoặc một số hình thức không chính xác trước), thì hậu thế hoặc khoảng đó có thể dẫn đến suy luận tốt hơn so với kết quả thường xuyên từ cùng một dữ liệu. Theo nghĩa tốt hơn dẫn đến suy luận chính xác hơn về trường hợp cụ thể này hoặc khoảng ước lượng hẹp hơn vì quy trình sử dụng tùy chỉnh trước có chứa thông tin chính xác. Về lâu dài, tỷ lệ bao phủ của các khoảng và tính chính xác của các kết luận bị ảnh hưởng bởi chất lượng của từng khoảng trước.

Lưu ý rằng quy trình không chỉ định cách lấy trước và vì vậy, kế toán hiệu suất dài hạn, có lẽ, sẽ giả sử bất kỳ trước nào thay vì trước được thiết kế tùy chỉnh cho từng trường hợp.

Một thủ tục Bayes có thể có các thuộc tính thường xuyên tốt. Ví dụ, trong nhiều trường hợp, một quy trình Bayes với một công thức không được cung cấp trước công thức sẽ có các đặc tính thường xuyên xuất sắc. Những đặc tính tốt đó sẽ là một tai nạn thay vì tính năng thiết kế, và sẽ là hậu quả đơn giản của một quy trình như vậy mang lại những khoảng thời gian tương tự như các quy trình thường xuyên.

Do đó, một quy trình Bayes có thể có các đặc tính suy luận vượt trội trong một thí nghiệm riêng lẻ trong khi có các đặc tính thường xuyên kém trong thời gian dài. Tương tự, các quy trình thường xuyên với các thuộc tính thường xuyên chạy dài thường có hiệu suất kém trong trường hợp thử nghiệm riêng lẻ.


2
Tôi không làm theo. Ngoại trừ Bay theo kinh nghiệm, trong tất cả các quy trình Bayes tôi thấy trước đó được chọn độc lập với dữ liệu. Do đó, khi áp dụng quy trình như vậy cho nhiều bộ dữ liệu đến từ cùng một quy trình tạo dữ liệu (đây là khung thường xuyên), Bayes sẽ sử dụng cùng một hàm khả năng (quy trình tạo dữ liệu là như nhau) trước đó (trước đó là độc lập với dữ liệu trong hầu hết các thủ tục Bayes). Tất nhiên vì dữ liệu thay đổi mỗi lần, giá trị của khả năng thay đổi, nhưng hình thức của nó là như nhau. Bây giờ, nếu mỗi cá nhân [1/2]
DeltaIV

2
[2/2] ước tính chính xác hơn, làm thế nào toàn bộ thủ tục có thể kém chính xác hơn? Điều này chỉ có thể nếu ước tính Bayes không phải lúc nào cũng chính xác hơn. Tuy nhiên, vì trước đó không được tùy chỉnh cho dữ liệu được quan sát, tôi không chắc điều gì làm cho nó chính xác hơn hoặc ít hơn cho từng trường hợp và / hoặc "trung bình".
DeltaIV

@DeltaV Tôi nghĩ rằng bạn đang xử lý tập tham chiếu sai. Các thuộc tính thường xuyên của một thủ tục liên quan đến hiệu suất dài hạn của quy trình được áp dụng trong tất cả các trường hợp mới, không chỉ lặp lại thí nghiệm cụ thể. Đó là lý do tại sao các quy trình khoảng tin cậy cho tỷ lệ nhị thức phải hoạt động cho tất cả các giá trị của tham số, không chỉ cho giá trị liên quan đến bất kỳ trường hợp cụ thể nào sử dụng quy trình. Loại 'chạy dài' đó có nghĩa là tùy chỉnh trước phù hợp với trường hợp được đề cập sẽ không phù hợp về lâu dài.
Michael Lew

bạn đúng rằng một quy trình tin cậy thường xuyên phải có phạm vi bảo hiểm danh nghĩa cho tất cả các giá trị của tham số chưa biết. Điều này đã được Newman & Pearson chỉ định rõ ràng và ngày nay nó thường bị bỏ qua. Tuy nhiên, khi bạn chọn trước, bạn không biết đâu là giá trị "thực" của tham số. Bạn chỉ có mẫu của bạn và trước đó phải độc lập với mẫu. Do đó tôi vẫn không thấy rõ làm thế nào bạn có thể tùy chỉnh trước dựa trên mẫu. Bạn có thể làm một ví dụ thực tế?
DeltaIV

@DeltaIV Nếu tôi biết rằng thông số quan tâm hiện tại đã được ước tính trong nghiên cứu trước thì tôi có thể định hình một thông tin trước dựa trên ước tính đó. Ưu tiên đó sẽ phù hợp với phân tích hiện tại này, nhưng không có sẵn thông tin thích hợp tương đương trước cho bộ ứng dụng nổi tiếng của phương pháp trong thời gian dài. Do đó, phân tích có thể có các tính chất tốt hơn nhiều trong trường hợp thực tế bị cô lập so với nó có vẻ như trong thời gian dài thường xuyên.
Michael Lew

2

Tôi sẽ trả lời rằng phân tích của bạn là chính xác. Để cung cấp thêm một vài hiểu biết, tôi sẽ đề cập đến các linh mục phù hợp.

Các linh mục phù hợp thường là các linh mục được thiết kế để xây dựng các mô hình Bayes với một tài sản thường xuyên. Cụ thể, chúng được xác định sao cho các khoảng hpd thu được thỏa mãn phạm vi bảo hiểm thường xuyên của khoảng tin cậy (vì vậy 95% của 95% hpd chứa các giá trị thực trong thời gian dài). Lưu ý rằng, trong 1d, có các giải pháp phân tích: các linh mục Jeffreys phù hợp với các linh mục. Trong chiều cao hơn, đây không phải là trường hợp cần thiết (theo hiểu biết của tôi, không có kết quả chứng minh rằng điều này không bao giờ là trường hợp).

Trong thực tế, nguyên tắc khớp này đôi khi cũng được áp dụng để điều chỉnh giá trị của một số tham số của mô hình: dữ liệu sự thật mặt đất được sử dụng để tối ưu hóa các tham số này theo nghĩa là giá trị của chúng tối đa hóa phạm vi bảo hiểm thường xuyên của các khoảng tin cậy kết quả cho tham số quan tâm . Từ thí nghiệm của riêng tôi, đây có thể là một nhiệm vụ rất tinh tế.


0

p

Bây giờ, để trả lời câu hỏi của bạn: không, nó không ngụ ý bất kỳ sự đánh giá nào về phương pháp Bayes. Bỏ qua các sắc thái và tập trung vào thủ tục ước tính để đơn giản: sự thường xuyên trong thống kê là ý tưởng ước tính một lượng cố định không xác định, hoặc kiểm tra một giả thuyết và đánh giá thủ tục đó chống lại sự lặp lại giả thuyết của nó. Bạn có thể áp dụng nhiều tiêu chí để đánh giá một thủ tục. Điều làm cho nó trở thành một tiêu chí thường xuyên là người ta quan tâm đến những gì xảy ra nếu một người áp dụng quy trình tương tự lặp đi lặp lại. Nếu bạn làm như vậy, bạn quan tâm đến các thuộc tính thường xuyên. Nói cách khác: "các thuộc tính thường xuyên là gì?" có nghĩa là "điều gì xảy ra nếu chúng ta lặp đi lặp lại thủ tục?" Bây giờ, những gì làm cho tính chất thường xuyên như vậy tốtlà một lớp tiêu chí khác. Các thuộc tính thường xuyên phổ biến nhất được coi là thuộc tính tốt là tính nhất quán (trong ước tính, nếu bạn tiếp tục lấy mẫu, công cụ ước tính sẽ hội tụ đến giá trị cố định mà bạn đang ước tính), hiệu quả (nếu bạn tiếp tục lấy mẫu, phương sai của công cụ ước tính sẽ bằng không , vì vậy bạn sẽ ngày càng chính xác hơn), xác suất bảo hiểm(trong nhiều lần lặp lại của quy trình, khoảng tin cậy 95% sẽ chứa giá trị thực 95% thời gian). Hai thuộc tính đầu tiên được gọi là thuộc tính mẫu lớn, thứ ba là thuộc tính thường xuyên thực sự của Neyman theo nghĩa là không nhất thiết phải sử dụng kết quả tiệm cận. Vì vậy, tóm lại, trong khuôn khổ thường xuyên, có một giá trị thực sự và chưa biết. Bạn ước tính nó và bạn luôn luôn (trừ một tai nạn may mắn hiếm gặp) sai trong ước tính, nhưng bạn đang cố gắng tự cứu mình bằng cách yêu cầu điều đó ít nhất là theo sự lặp đi lặp lại một cách giả định về ước tính của bạn, bạn sẽ ngày càng ít sai hoặcbạn biết bạn sẽ đúng một số lần nhất định. Tôi sẽ không thảo luận nếu nó có ý nghĩa hay không, hoặc các giả định bổ sung cần thiết để biện minh cho nó, vì đó không phải là câu hỏi của bạn. Về mặt khái niệm, đó là những gì thuộc tính thường xuyên đề cập đến, và nghĩa là tốt nói chung trong bối cảnh như vậy.

Tôi sẽ đóng lại bằng cách chỉ cho bạn tờ giấy này, để bạn tự đánh giá nếu nó có ý nghĩa và ý nghĩa của một thủ tục Bayes để có các thuộc tính thường xuyên tốt (bạn sẽ tìm thấy nhiều tài liệu tham khảo hơn ở đó):

  • Ít, R., và những người khác, (2011). Các vịnh được hiệu chuẩn, để thống kê nói chung và dữ liệu bị thiếu nói riêng. Khoa học thống kê, 26 (2), 162 Hàng174.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.