Điều gì có nghĩa là lỗi tiêu chuẩn của ước tính khả năng tối đa?


21

Tôi là một nhà toán học tự học thống kê và đấu tranh đặc biệt là với ngôn ngữ.

Trong cuốn sách tôi đang sử dụng, có một vấn đề sau:

Một biến ngẫu nhiên được đưa ra dưới dạng phân phối với . (Tất nhiên, bạn có thể thực hiện bất kỳ phân phối nào tùy thuộc vào một tham số vì câu hỏi này.) Sau đó, một mẫu gồm năm giá trị , , , , được đưa ra.Pareto ( α , 60 ) α > 0 14 21 6 32 2XPareto(α,60)α>014216322

Phần đầu tiên: "Sử dụng phương pháp khả năng tối đa, tìm ước tính của dựa trên [mẫu]." Đây không phải là vấn đề. Câu trả lời là . alpha alpha4,6931α^αα^4,6931

Nhưng sau đó: "Đưa ra ước tính cho lỗi tiêu chuẩn của ."α^

Nghĩa là gì đây? Vì chỉ là một số thực cố định, tôi không thấy nó có thể có lỗi tiêu chuẩn như thế nào. Tôi có xác định độ lệch chuẩn của không? Pareto( α ,60)α^Pareto(α^,60)

Nếu bạn nghĩ rằng câu hỏi không rõ ràng, thông tin này cũng sẽ giúp tôi.


Có gì là viết tắt của? 60
Alecos Papadopoulos

Bạn có công thức cho không? Điều đó sẽ giúp bạn ước tính lỗi tiêu chuẩn của nó. α^
soakley

1
@Glen_b Nhưng nếu đó là giới hạn thấp hơn thì làm sao có thể tất cả các giá trị của mẫu nhận ra đều nhỏ hơn?
Alecos Papadopoulos

1
@Alecos Đó là một điểm tuyệt vời. Nhận xét của tôi không có ý nghĩa; Tôi đã xóa nó.
Glen_b -Reinstate Monica

1
@Alecos: Pareto(α,λ) là sự phân bố với mật độ . f(x)= =αλα(λ+x)α+1
Stefan

Câu trả lời:


17

Câu trả lời khác đã bao hàm nguồn gốc của lỗi tiêu chuẩn, tôi chỉ muốn giúp bạn với ký hiệu:

Sự nhầm lẫn của bạn là do trong Thống kê, chúng tôi sử dụng chính xác cùng một ký hiệu để biểu thị Công cụ ước tính (là hàm) và ước tính cụ thể (là giá trị mà công cụ ước tính nhận được khi nhận làm mẫu nhận biết cụ thể).

Vì vậy, α = h ( X )α ( X = x ) = 4,6931 cho x = { 14 ,α^= =h(X)α^(X= =x)= =4,6931 . Vì vậy, α ( X ) là hàm số của biến ngẫu nhiên và do đó, một biến ngẫu nhiên chính nó, mà chắc chắn có sai. x= ={14,21,6,32,2}α^(X)

Trong ước lượng ML, trong nhiều trường hợp, những gì chúng ta có thể tính toán là lỗi tiêu chuẩn tiệm cận , bởi vì phân phối mẫu hữu hạn của công cụ ước tính không được biết (không thể rút ra được).

Nói đúng không có một phân phối tiệm cận, vì nó hội tụ tới một số thực (số đúng trong hầu hết các trường hợp dự toán ML). Nhưng số lượng α^hội tụ đến một biến ngẫu nhiên bình thường (bằng cách áp dụng các giới hạn trung tâm lý).n(α^-α)

Một điểm thứ hai của sự nhầm lẫn ký hiệu : hầu hết, nếu không nói là tất cả các văn bản, sẽ viết ( "Avar" = tiệm cận sai ") trong khi những gì họ có nghĩaAvar ( Avar(α^), tức là họ đề cập đến phương sai tiệm cận số lượngAvar(n(α^-α)), chứ không phải của α ... Đối với trường hợp của một phân phối Pareto cơ bản chúng tôi cón(α^-α)α^

Avar[n(α^-α)]= =α2

và do đó

Avar(α^)= =α2/n

(nhưng những gì bạn sẽ tìm thấy được viết là ) Avar(α^)= =α2

Bây giờ, trong những gì cảm nhận được Công cụ Ước tính α có một "sai tiệm cận", vì như đã nói, tiệm khi hội tụ tới một hằng số? Vâng, trong một ý nghĩa gần đúng và cho các mẫu lớn nhưng hữu hạn . Tức là ở đâu đó giữa một mẫu "nhỏ", trong đó Công cụ ước tính là một biến ngẫu nhiên có phân phối (thường) không xác định và mẫu "vô hạn", trong đó công cụ ước tính là một hằng số, có "lãnh thổ mẫu lớn nhưng hữu hạn" này Công cụ Ước tính vẫn chưa trở thành một hằng số và nơi phân phối và phương sai của nó có nguồn gốc một cách bùng binh, bởi đầu tiên sử dụng giới hạn trung tâm lý để lấy được phân phối đúng cách tiệm cận số lượng Z = α^(đó là bình thường do sự CLT), sau đó chuyển những thứ xung quanh và viết α = 1Z=n(α^α)(trong khi thực hiện một bước trở lại và xử lýnnhư hữu hạn) mà chương trìnhalphanhư một chức năng affine của biến ngẫu nhiên bình thườngZ, và vì vậy thường được phân phối riêng của mình (luôn xấp xỉ).α^=1nZ+αnα^Z


1 để phân biệt giữa αα^- chắc chắn các ký hiệu có thể không phù hợp. n(α^α)
Giáo hoàng Nate

21

- một khả năng ước lượng tối đa - là một chức năng của một mẫu ngẫu nhiên, và do đó cũng là ngẫu nhiên (không cố định). Ước tính sai số chuẩn của α có thể thu được từ các thông tin Fisher,α^α^

tôi(θ)= =-E[2L(θ|Y= =y)θ2|θ]

Nơi là một tham số và L ( θ | Y = y ) là hàm loga hợp lý θ có điều kiện trên mẫu ngẫu nhiên y . Bằng trực giác, thông tin Fisher chỉ ra độ dốc của độ cong của bề mặt loga quanh MLE, và vì vậy lượng 'thông tin' rằng y sẽ cung cấp khoảng θ .θL(θ|Y= =y)θyyθ

Đối với phân phối với một nhận thức duy nhất Y = y , khả năng đăng nhập trong đó y 0 được biết:Pmộtreto(α,y0)Y= =yy0

Cắm vào định nghĩa của thông tin Fisher, I(α)=1

L(α|y,y0)= =đăng nhậpα+αđăng nhậpy0-(α+1)đăng nhậpyL'(α|y,y0)= =1α+đăng nhậpy0-đăng nhậpyL"(α|y,y0)= =-1α2
Cho một mẫu{y1,y2,. . . ,Yn}Khả năng ước lượng tối đa α là tiệm phân phối như: α n ~ N (α, 1
tôi(α)= =1α2
{y1,y2,...,yn}α^ Trong đónlà cỡ mẫu. Vìαlà không rõ, chúng ta có thể cắm vàoαđể có được một ước tính sai số chuẩn: SE(α)
α^~nN(α,1ntôi(α))= =N(α,α2n), 
nαα^
SE(α^)α^2/n4,69312/52.1

1
α^~nN(α,1ntôi(α))nnα^˙N(α,1ntôi(α))
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.