Ước tính khả năng tối đa - tại sao nó được sử dụng mặc dù bị sai lệch trong nhiều trường hợp


25

Ước tính khả năng tối đa thường dẫn đến các công cụ ước tính sai lệch (ví dụ: ước tính của nó cho phương sai mẫu được thiên vị cho phân phối Gaussian).

Điều gì sau đó làm cho nó trở nên phổ biến? Tại sao chính xác là nó được sử dụng rất nhiều? Ngoài ra, điều gì đặc biệt làm cho nó tốt hơn phương pháp thay thế - phương pháp của khoảnh khắc?

Ngoài ra, tôi nhận thấy rằng đối với Gaussian, một tỷ lệ đơn giản của công cụ ước tính MLE làm cho nó không thiên vị. Tại sao tỷ lệ này không phải là một thủ tục tiêu chuẩn? Ý tôi là - Tại sao sau khi tính toán MLE, việc tìm tỷ lệ cần thiết để làm cho công cụ ước tính không thiên vị là không thường xuyên? Thực tiễn tiêu chuẩn dường như là sự tính toán đơn giản của các ước tính MLE, ngoại trừ trường hợp Gaussian nổi tiếng trong đó hệ số tỷ lệ được biết đến.


11
Có rất nhiều, rất nhiều lựa chọn thay thế cho ML, không chỉ là phương pháp của các khoảnh khắc - mà còn có xu hướng tạo ra các công cụ ước tính sai lệch. Thay vào đó, điều bạn có thể muốn hỏi là "tại sao mọi người lại muốn sử dụng công cụ ước tính không thiên vị?" Một cách tốt để bắt đầu nghiên cứu vấn đề này là tìm kiếm về sự đánh đổi sai lệch .
whuber

7
Như whuber đã chỉ ra, không có ưu thế nội tại trong việc không thiên vị.
Tây An

4
Tôi nghĩ @whuber có nghĩa là "tại sao mọi người muốn sử dụng công cụ ước tính thiên vị ?" Sẽ không mất nhiều công sức để thuyết phục ai đó rằng một người ước lượng không thiên vị có thể là một người hợp lý.
Vách đá AB

5
Xem en.wikipedia.org/wiki/ Đối với một ví dụ trong đó công cụ ước tính không thiên vị duy nhất chắc chắn không phải là thứ bạn muốn sử dụng.
Scortchi - Phục hồi Monica

4
@Cliff Tôi dự định đặt câu hỏi ở dạng khiêu khích hơn, có khả năng bí ẩn hơn. Ẩn đằng sau điều này là ý tưởng rằng có nhiều cách để đánh giá chất lượng của một người ước tính và nhiều trong số đó không liên quan gì đến sự thiên vị. Từ quan điểm đó, điều tự nhiên nhất là hỏi tại sao ai đó sẽ đề xuất một công cụ ước tính không thiên vị . Xem câu trả lời của glen_b để biết thêm từ quan điểm này.
whuber

Câu trả lời:


18

Không thiên vị không nhất thiết phải đặc biệt quan trọng.

Bên cạnh một tập hợp hoàn cảnh rất hạn chế, hầu hết các công cụ ước tính hữu ích đều bị sai lệch, tuy nhiên chúng thu được.

Nếu hai ước lượng có cùng phương sai, người ta có thể dễ dàng gắn kết một cuộc tranh cãi cho thích là một không thiên vị cho một thiên vị một, nhưng đó là một tình huống bất thường là ở (có nghĩa là, bạn có thể hợp lý thích unbiasedness, ceteris tố khác không đổi - nhưng những pesky ceteris hầu như không bao giờ paribus ).

Thông thường hơn, nếu bạn muốn không thiên vị, bạn sẽ thêm một số phương sai để có được nó, và sau đó câu hỏi sẽ là tại sao bạn sẽ làm điều đó ?

Xu hướng là giá trị trung bình của công cụ ước tính của tôi sẽ ở mức trung bình quá cao (với độ lệch âm biểu thị quá thấp).

Khi tôi đang xem xét một công cụ ước tính mẫu nhỏ, tôi không thực sự quan tâm đến điều đó. Tôi thường quan tâm nhiều hơn đến việc người ước tính của tôi sẽ sai đến mức nào trong trường hợp này - khoảng cách điển hình của tôi từ bên phải ... một cái gì đó như lỗi bình phương gốc hoặc lỗi tuyệt đối trung bình sẽ có ý nghĩa hơn.

Vì vậy, nếu bạn thích phương sai thấp và độ lệch thấp, yêu cầu nói một công cụ ước tính sai số trung bình bình phương tối thiểu sẽ có ý nghĩa; những điều này rất hiếm khi không thiên vị.

Xu hướng và không thiên vị là một khái niệm hữu ích cần phải biết, nhưng nó không phải là một tài sản đặc biệt hữu ích để tìm kiếm trừ khi bạn chỉ so sánh các công cụ ước tính với cùng phương sai.

Công cụ ước tính ML có xu hướng phương sai thấp; chúng thường không phải là MSE tối thiểu, nhưng chúng thường có MSE thấp hơn so với sửa đổi chúng thành không thiên vị (khi bạn có thể làm điều đó) sẽ cung cấp cho bạn.

Ví dụ: xem xét ước tính phương sai khi lấy mẫu từ phân phối bình thường (thực sự MMSE cho phương sai luôn có mẫu số lớn hơn ). n-1σ^MMSE2=S2n+1,σ^MLE2=S2n,σ^Unb2=S2n1n1


1
+1. Có bất kỳ trực giác nào cho (hoặc có lẽ một số lý thuyết đằng sau) đoạn thứ hai của bạn trước đoạn cuối không? Tại sao các công cụ ước tính ML có xu hướng phương sai thấp? Tại sao họ thường có MSE thấp hơn công cụ ước tính không thiên vị? Ngoài ra, tôi rất ngạc nhiên khi thấy biểu thức của công cụ ước tính MMSE; bằng cách nào đó tôi chưa bao giờ gặp phải nó trước đây Tại sao nó hiếm khi được sử dụng? Và nó có liên quan gì đến sự co ngót không? Có vẻ như nó bị "thu nhỏ" từ không thiên vị về số 0, nhưng tôi bối rối vì điều đó vì tôi thường nghĩ về sự co lại chỉ trong bối cảnh đa biến (dọc theo dòng của James-Stein).
amip nói rằng Phục hồi Monica

1
@amoeba MLE thường là các chức năng của số liệu thống kê đầy đủ và ít nhất là phương sai tối thiểu không có triệu chứng không thiên vị, vì vậy bạn hy vọng chúng có phương sai thấp trong các mẫu lớn, điển hình là đạt được CRLB trong giới hạn; điều này thường được phản ánh trong các mẫu nhỏ hơn. Ước lượng MMSE được thường bị thu hẹp về phía zero vì làm giảm phương sai (và do đó một lượng nhỏ thiên vị về phía 0 được giới thiệu bởi một co rút nhỏ thường sẽ giảm MSE).
Glen_b -Reinstate Monica

@Glen_b, câu trả lời tuyệt vời (tôi tiếp tục quay lại với nó). Bạn có thể có lời giải thích hoặc tài liệu tham khảo cho là công cụ ước tính MSE tối thiểu không? σ^MMSE2=S2n+1
Richard Hardy

Ngoài ra, điều đó có nghĩa là công cụ ước tính ML không phải là công cụ ước tính phương sai tối thiểu không? Mặt khác, công cụ ước tính MSE tối thiểu sẽ là một số trung bình có trọng số (với trọng số dương) của MLE và công cụ ước tính không thiên vị, nhưng bây giờ nó nằm ngoài phạm vi đó. Tôi có thể hỏi điều này như một câu hỏi riêng biệt nếu bạn nghĩ nó có ý nghĩa.
Richard Hardy

1
Tìm thấy toàn bộ dẫn xuất trong một bài viết trên Wikipedia về MSE , tôi đoán điều đó giải thích tất cả.
Richard Hardy

16

MLE mang lại giá trị rất có thể của các tham số mô hình, đưa ra mô hình và dữ liệu trong tay - đó là một khái niệm khá hấp dẫn. Tại sao bạn lại chọn các giá trị tham số làm cho dữ liệu được quan sát ít có thể xảy ra hơn khi bạn có thể chọn các giá trị làm cho dữ liệu được quan sát có thể xảy ra nhất trên bất kỳ tập hợp giá trị nào? Bạn có muốn hy sinh tính năng này cho sự thiên vị? Tôi không nói câu trả lời luôn rõ ràng, nhưng động lực cho MLE khá mạnh mẽ và trực quan.

Ngoài ra, MLE có thể được áp dụng rộng rãi hơn phương pháp khoảnh khắc, theo như tôi biết. MLE có vẻ tự nhiên hơn trong các trường hợp biến tiềm ẩn; ví dụ, mô hình trung bình di động (MA) hoặc mô hình không đồng nhất có điều kiện tự phát tổng quát (GARCH) có thể được ước tính trực tiếp bởi MLE (bởi trực tiếp tôi có nghĩa là nó đủ để chỉ định một hàm khả năng và gửi nó đến một thói quen tối ưu hóa) - nhưng không phải bằng phương pháp của khoảnh khắc (mặc dù các giải pháp gián tiếp sử dụng phương pháp của khoảnh khắc có thể tồn tại).


4
+1. Tất nhiên, có rất nhiều trường hợp khi bạn không muốn ước tính nhiều khả năng nhất, chẳng hạn như Mô hình hỗn hợp Gaussian (nghĩa là khả năng không bị ràng buộc). Nói chung, một câu trả lời tuyệt vời để giúp trực giác của MLE.
Vách đá AB

3
(+1) Nhưng tôi nghĩ rằng bạn cần thêm một định nghĩa về giá trị tham số "rất có thể" vì giá trị mà dữ liệu có thể xảy ra là khá rõ ràng. Các thuộc tính mong muốn trực quan khác của một công cụ ước tính không liên quan đến hành vi dài hạn của nó trong việc lấy mẫu lặp đi lặp lại có thể bao gồm nó không phụ thuộc vào cách bạn tham số hóa một mô hình, và nó không tạo ra các ước tính không thể về giá trị tham số thực.
Scortchi - Tái lập Monica

6
Hãy nghĩ rằng vẫn có nguy cơ "rất có thể" đang được đọc là "có thể xảy ra nhất".
Scortchi - Phục hồi Monica


2
@dsaxton: Các nhà thống kê đã phân biệt khả năng của một giá trị tham số được cung cấp dữ liệu với xác suất của dữ liệu được cung cấp một giá trị tham số trong gần một thế kỷ - xem Fisher (1921) "Về lỗi có thể xảy ra của một mối tương quan", Metron , 1 , Trang 3-32 & Pawitan (2013), Trong tất cả khả năng: Mô hình thống kê & suy luận sử dụng khả năng thích ứng - vì vậy mặc dù các thuật ngữ này đồng nghĩa với cách sử dụng thông thường, có vẻ hơi muộn để phản đối.
Scortchi - Phục hồi Monica

12

Trên thực tế, việc nhân rộng các ước tính khả năng tối đa để có được các ước tính không thiên vị một quy trình chuẩn trong nhiều vấn đề ước tính. Lý do cho điều đó là mle là một hàm của số liệu thống kê đầy đủ và theo định lý Rao-Blackwell nếu bạn có thể tìm thấy một công cụ ước lượng không thiên vị dựa trên số liệu thống kê đầy đủ, thì bạn có Công cụ ước lượng không thiên vị tối thiểu.

Tôi biết rằng câu hỏi của bạn chung chung hơn thế nhưng điều tôi muốn nhấn mạnh là các khái niệm chính có liên quan mật thiết đến khả năng và ước tính dựa trên nó. Các ước tính này có thể không thiên vị trong các mẫu hữu hạn nhưng chúng không có triệu chứng vì vậy và hơn nữa chúng có hiệu quả không có triệu chứng, tức là chúng đạt được phương sai của Cramer-Rao đối với các công cụ ước tính không thiên vị, có thể không phải luôn luôn là trường hợp của các công cụ ước tính MOM.


11

Để trả lời câu hỏi của bạn về lý do tại sao MLE rất phổ biến, hãy xem xét rằng mặc dù nó có thể bị sai lệch, nhưng nó phù hợp trong các điều kiện tiêu chuẩn. Ngoài ra, nó có hiệu quả không có triệu chứng, do đó, ít nhất là đối với các mẫu lớn, MLE có khả năng làm tốt hoặc tốt hơn bất kỳ công cụ ước tính nào khác mà bạn có thể nấu. Cuối cùng, MLE được tìm thấy bởi một công thức đơn giản; lấy chức năng khả năng và tối đa hóa nó. Trong một số trường hợp, công thức đó có thể khó theo dõi, nhưng đối với hầu hết các vấn đề, thì không. Ngoài ra, khi bạn có ước tính này, chúng tôi có thể rút ra các lỗi tiêu chuẩn tiệm cận ngay lập tức bằng cách sử dụng thông tin của Fisher. Không sử dụng thông tin của Fisher, thường rất khó để rút ra các giới hạn lỗi.

Đây là lý do tại sao ước tính MLE thường là công cụ ước tính (trừ khi bạn là người Bayes); Thật đơn giản để thực hiện và có khả năng sẽ tốt như vậy nếu không tốt hơn bất cứ điều gì khác mà bạn cần làm nhiều việc hơn để nấu ăn.


1
Bạn có thể giải thích chi tiết về cách so sánh với phương pháp của khoảnh khắc không, vì đây dường như là một phần quan trọng của OP?
Antoni Parellada

1
như được chỉ ra bởi whuber, các công cụ ước tính MOM cũng bị sai lệch, do đó, không có lợi thế "không thiên vị" đối với các công cụ ước tính MOM. Ngoài ra, khi các công cụ ước tính MOM và MLE không đồng ý, MLE có xu hướng có MSE thấp hơn. Nhưng câu trả lời này thực sự là về lý do tại sao MLE có xu hướng mặc định, thay vì so sánh trực tiếp với các phương pháp khác.
Vách đá AB

2
@AntoniParellada Có một chủ đề thú vị khi so sánh MLE và MoM, stats.stackexchange.com/q/80380/28746
Alecos Papadopoulos

3

Tôi muốn nói thêm rằng đôi khi (thường) chúng tôi sử dụng công cụ ước tính MLE bởi vì đó là những gì chúng tôi có, ngay cả khi trong một thế giới lý tưởng, đó sẽ không phải là điều chúng tôi muốn. (Tôi thường nghĩ rằng số liệu thống kê giống như kỹ thuật, nơi chúng ta sử dụng những gì chúng ta có chứ không phải những gì chúng ta muốn.) Trong nhiều trường hợp, việc xác định và giải quyết cho MLE dễ dàng, và sau đó nhận được giá trị bằng cách sử dụng phương pháp lặp. Trong khi đối với một tham số nhất định trong một tình huống nhất định, có thể có một công cụ ước tính tốt hơn (đối với một số giá trị "tốt hơn"), nhưng việc tìm kiếm nó có thể đòi hỏi phải rất thông minh; và khi bạn đã hoàn thành thông minh, bạn vẫn chỉ có công cụ ước tính tốt hơn cho một vấn đề cụ thể đó.


1
Vì tò mò, ví dụ về những gì (trong thế giới lý tưởng) bạn muốn là gì?
Glen_b -Reinstate Monica

2
@Glen_b: Dunno. Không thiên vị, phương sai thấp nhất, dễ tính toán ở dạng kín? Khi bạn lần đầu tiên học các công cụ ước tính cho hồi quy bình phương nhỏ nhất, cuộc sống dường như đơn giản hơn so với thực tế.
eac2222
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.