Làm thế nào để giải thích những gì một người ước tính không thiên vị cho một cư dân?


10

Giả sử là một công cụ ước tính không thiên vị cho . Sau đó, tất nhiên, . θE[ θ |θ]=θθ^θE[θ^θ]=θ

Làm thế nào để một người giải thích điều này với một giáo dân? Trước đây, những gì tôi đã nói là nếu bạn tính trung bình một loạt các giá trị của , khi kích thước mẫu càng lớn, bạn sẽ có được xấp xỉ tốt hơn . qθ^θ

Đối với tôi, đây là vấn đề. Tôi nghĩ rằng những gì tôi đang thực sự mô tả ở đây là hiện tượng này là tiệm không thiên vị, chứ không phải chỉ là không thiên vị, ví dụ, trong đó \ hat {\ theta} có thể phụ thuộc vào n .

limnE[θ^θ]=θ,
θ^n

Vì vậy, làm thế nào để giải thích những gì một người ước tính không thiên vị cho một cư dân?


2
Đó là một cách để ước tính gần đúng: thường không chính xác nhưng về tổng thể nó không tạo ra sự đánh giá quá cao thường xuyên hơn là đánh giá thấp. Tôi nhận ra rằng điều này làm cho âm thanh giống như θ là trung vị của θ^ hơn là trung bình, nhưng tôi nghĩ rằng nó nắm bắt được điểm quan trọng.
jwimberley

3
Tôi thích trò đùa "ba nhà thống kê săn bắn" (một phiên bản ở đây ) cho điều này ...
Ben Bolker

2
Giải thích của bạn là Luật số lớn, nó không liên quan gì đến sự thiên vị.
Tây An

@ Tây An: Nếu công cụ ước tính bị sai lệch, giới hạn sẽ không là . θ
user2357112 hỗ trợ Monica

@ user2357112: theo cách hiểu của tôi (và những người khác, như được hiển thị bởi các câu trả lời cho đến nay), khi kích thước mẫu lớn hơn có nghĩa là xem xét khi tăng lên vô cùng, tức là một công cụ ước tính dựa trên các quan sát . Bây giờ tôi thấy câu có thể được giải thích khác nhau. nθ^nnn
Tây An

Câu trả lời:


14

Về mặt kỹ thuật những gì bạn mô tả khi bạn nói rằng công cụ ước tính của bạn tiến gần hơn đến giá trị thực khi kích thước mẫu tăng lên (như những người khác đã đề cập), hoặc sự hội tụ của các công cụ ước tính thống kê. Sự hội tụ này có thể là sự hội tụ trong xác suất, điều này nói rằng với mọi hoặc gần như hội tụ chắc chắn nói rằng . Lưu ý cách giới hạn thực sự bên trongε > 0 P ( lim n | q n - q | > ε ) = 0limnP(|θ^nθ|>ϵ)=0ϵ>0P(limn|θ^nθ|>ϵ)=0xác suất trong trường hợp thứ hai. Hóa ra dạng hội tụ sau này mạnh hơn dạng kia, nhưng cả hai đều có ý nghĩa cơ bản giống nhau, đó là ước tính có xu hướng ngày càng gần hơn với điều chúng ta ước tính khi chúng ta thu thập nhiều mẫu hơn.

Một điểm tinh tế ở đây là ngay cả khi dù có xác suất hay gần như chắc chắn, nói chung là không đúng khi nói rằng , vì vậy tính nhất quán không bao hàm sự không thiên vị tiệm cận như bạn đang đề xuất. Bạn phải cẩn thận khi di chuyển giữa các chuỗi biến ngẫu nhiên (là hàm) sang chuỗi kỳ vọng (là tích phân).limnE( θ n)=θθ^nθlimnE(θ^n)=θ

Tất cả các công cụ kỹ thuật sang một bên, không thiên vị chỉ có nghĩa là . Vì vậy, khi bạn giải thích cho ai đó chỉ cần nói rằng nếu thử nghiệm được lặp lại trong các điều kiện giống hệt nhau nhiều lần thì giá trị trung bình của ước tính sẽ gần với giá trị thực.E(θ^n)=θ


5
Tầm nhìn của bạn về giáo dân là khá đáng ngưỡng mộ. Anh ta biết những gì "hội tụ trong xác suất", "như hội tụ", giới hạn ... Đó là người đàn ông đến từ tương lai.
Aksakal

2
Tôi không nghĩ rằng một giáo dân biết bất kỳ điều nào trong số này, tôi đã cố gắng sửa chữa một số hiểu lầm trong bài viết gốc. Đề nghị của tôi về cách giải thích mọi thứ với một giáo dân nằm ở đoạn cuối.
DSaxton

đoạn cuối đó mặc dù vướng vào khái niệm thiên vị với tính nhất quán của một công cụ ước tính, có lẽ là một trong những nhầm lẫn của OP để bắt đầu.
Aksakal

3
Làm sao vậy Lặp lại một thử nghiệm trong các điều kiện giống hệt nhau có nghĩa là kích thước mẫu được cố định để chúng tôi rõ ràng không nói về tính nhất quán.
DSaxton

1
Ok, bạn nói đúng về điều đó, nhưng điều đó có nghĩa là bạn đang đưa ra quan điểm thường xuyên về xác suất
Aksakal

9

Tôi không chắc chắn nếu bạn nhầm lẫn tính nhất quán và không thiên vị.

Tính nhất quán: Kích thước mẫu càng lớn thì phương sai của công cụ ước tính càng nhỏ.

  • Phụ thuộc vào cỡ mẫu

Tính không thiên vị: Giá trị mong đợi của công cụ ước tính bằng giá trị thực của các tham số

  • Không phụ thuộc vào cỡ mẫu

Vì vậy, câu của bạn

nếu bạn tính trung bình một loạt các giá trị của , khi kích thước mẫu lớn hơn, bạn sẽ có được xấp xỉ tốt hơn .θ^θ

Không đúng Ngay cả khi kích thước mẫu là vô hạn, một công cụ ước lượng không thiên vị sẽ vẫn là một công cụ ước tính không thiên vị, ví dụ: Nếu bạn ước tính trung bình là "trung bình +1", bạn có thể thêm một tỷ quan sát vào mẫu của mình và công cụ ước tính của bạn vẫn sẽ không cung cấp cho bạn giá trị thực.

Ở đây bạn có thể tìm thấy một cuộc thảo luận sâu sắc hơn về sự khác biệt giữa tính nhất quán và không thiên vị.

Sự khác biệt giữa một công cụ ước tính nhất quán và công cụ ước tính không thiên vị là gì?


2
Tôi thực sự không biết gì về tính nhất quán, tuy nhiên cảm ơn bạn.
Clarinetist

1
@Clarinetist Tính nhất quán có lẽ là thuộc tính quan trọng nhất của một người ước tính, rằng với đủ dữ liệu, bạn sẽ có được tùy ý gần với câu trả lời đúng.
Matthew Gunn

7

@Ferdi đã cung cấp câu trả lời rõ ràng cho câu hỏi của bạn, nhưng hãy làm cho nó chính thức hơn một chút.

Hãy được mẫu của bạn của các biến ngẫu nhiên độc lập và phân phối giống nhau từ phân phối . Bạn quan tâm đến việc ước tính số lượng không xác định nhưng cố định , sử dụng công cụ ước tính là một hàm của . Vì là hàm của các biến ngẫu nhiên, hãy ước tínhX1,,XnFθ gX1,,Xng

θ^n=g(X1,,Xn)

cũng là một biến ngẫu nhiên. Chúng tôi định nghĩa thiên vị là

bias(θ^n)=Eθ(θ^n)θ

công cụ ước tính không thiên vị khi .Eθ(θ^n)=θ

Nói bằng tiếng Anh đơn giản: chúng ta đang xử lý các biến ngẫu nhiên , vì vậy trừ khi nó suy biến , nếu chúng ta lấy các mẫu khác nhau, chúng ta có thể mong đợi quan sát các dữ liệu khác nhau và các ước tính khác nhau. Tuy nhiên, chúng tôi có thể hy vọng rằng trên các mẫu khác nhau "trung bình" ước tính sẽ "đúng" nếu công cụ ước tính không thiên vị. Vì vậy, nó sẽ không luôn luôn đúng, nhưng "trung bình" nó sẽ đúng. Nó đơn giản là không thể luôn luôn "đúng" vì tính ngẫu nhiên liên quan đến dữ liệu.θ^n

Như những người khác đã lưu ý, thực tế là ước tính của bạn "gần" hơn với số lượng ước tính khi mẫu của bạn tăng lên, tức là có khả năng hội tụ

θ^nPθ

phải làm với tính nhất quán của người ước tính , không thiên vị. Không thiên vị một mình không cho chúng ta biết bất cứ điều gì về kích thước mẫu và mối quan hệ của nó với các ước tính thu được. Hơn nữa, các công cụ ước tính không thiên vị không phải lúc nào cũng có sẵn và không phải lúc nào cũng thích hơn các công cụ ước tính . Ví dụ: sau khi xem xét sự đánh đổi sai lệch thiên vị, bạn có thể sẵn sàng xem xét sử dụng công cụ ước tính với độ lệch lớn hơn, nhưng phương sai nhỏ hơn - vì vậy "trung bình" nó sẽ xa hơn giá trị thực, nhưng thường hơn (phương sai nhỏ hơn) các ước tính sẽ được gần hơn với giá trị thực, sau đó trong trường hợp ước lượng không thiên vị.


(+1): điểm rất tốt trong việc mang lại thực tế là hiếm khi có các công cụ ước tính không thiên vị. Và đề cập đến sự đối lập thiên vị / phương sai.
Tây An

2

Trước tiên, bạn phải phân biệt sự hiểu lầm thiên vị với thiên vị thống kê, đặc biệt là đối với một giáo dân.

Sự lựa chọn nói sử dụng trung bình, trung bình hoặc chế độ làm công cụ ước tính của bạn cho trung bình dân số , thường chứa một khuynh hướng niềm tin lý thuyết chính trị, tôn giáo hoặc khoa học. Việc tính toán mà công cụ ước tính là dạng trung bình tốt nhất thuộc loại khác với số học ảnh hưởng đến độ lệch thống kê.

Khi bạn đã vượt qua sai lệch lựa chọn phương thức, thì bạn có thể giải quyết các xu hướng tiềm năng trong phương pháp ước tính. Trước tiên, bạn phải chọn một phương pháp có thể có sự thiên vị và một cơ chế dễ dàng dẫn đến sự thiên vị đó.

Có thể dễ dàng hơn để sử dụng phân chia một quan điểm chinh phục trong đó nó trở nên rõ ràng khi kích thước mẫu trở nên nhỏ hơn, ước tính trở nên sai lệch rõ ràng. Ví dụ: yếu tố n-1 (so với yếu tố 'n') trong các công cụ ước tính lây lan mẫu trở nên rõ ràng khi n giảm từ 3 xuống 2 xuống 1!

Tất cả phụ thuộc vào cách 'lay' người đó.


Tôi sợ rằng bạn có thể đang nói về những thành kiến ​​khác nhau mà người trong câu hỏi. Bạn có thể thử cụ thể hơn về sự thiên vị là gì? Bạn viết về "các sai lệch tiềm năng trong phương pháp ước tính" và điều này dường như không tương ứng với định nghĩa về sai lệch (được đưa ra trong câu hỏi và câu trả lời ở trên). Cuối cùng, điều này làm cho câu trả lời của bạn trở nên khó hiểu ...
Tim

@Tim, bước đầu tiên là chỉ cần đảm bảo rằng những thành kiến ​​của con người đã được che đậy. Bước thứ hai là (và một phần tuân theo các vấn đề của bước 1) để đảm bảo rằng việc giảng dạy của giáo dân không phải là phương pháp X (phương pháp không thiên vị) đã được chọn. ví dụ Độ lệch chuẩn là 1 / n * sum ((x-mean) ^ 2), nhưng điều đó (một cách cẩn thận) không phân biệt giữa dân số và mẫu. Hầu hết 'giáo dân' được dạy phiên bản 1 / (N-1) không suy nghĩ cho một mẫu. Nếu bạn chỉ có một phương pháp, bạn (người giáo dân) không có lựa chọn nào để thực hiện, vì vậy sai lệch ước tính không thể là vấn đề ... Đó là bước Kruger-Dunning.
Philip Oakley
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.