Làm cách nào để tìm độ lệch chuẩn của độ lệch chuẩn mẫu so với phân phối chuẩn?


11

Hãy tha thứ cho tôi nếu tôi bỏ lỡ điều gì đó khá rõ ràng.

Tôi là một nhà vật lý với bản chất phân phối (biểu đồ) tập trung vào một giá trị trung bình gần bằng với phân phối chuẩn. Giá trị quan trọng với tôi là độ lệch chuẩn của biến ngẫu nhiên Gaussian này. Làm thế nào tôi có thể cố gắng tìm lỗi trên độ lệch chuẩn mẫu? Tôi có cảm giác có gì đó liên quan đến lỗi trên mỗi thùng trong biểu đồ gốc.


Một gợi ý được cung cấp tại stats.stackexchange.com/questions/26924 . Nói chung, sai số lấy mẫu của phương sai có thể được tính theo bốn thời điểm phân phối đầu tiên và do đó, lỗi lấy mẫu của SD ít nhất có thể được ước tính từ những thời điểm đó.
whuber

Câu trả lời:


12

Có vẻ như bạn đang yêu cầu tính toán độ lệch chuẩn của độ lệch chuẩn mẫu. Đó là, bạn đang yêu cầu , trong đóSD(s)=var(s)

s=1n1i=1n(XiX¯),

¯ XX1,...,XnN(μ,σ2) và là giá trị trung bình mẫu.X¯

Đầu tiên, chúng ta biết từ các tính chất cơ bản của phương sai

var(s)=E(s2)E(s)2

Vì phương sai mẫu không thiên vị, nên chúng ta biết . Trong Tại sao là độ lệch chuẩn mẫu một ước lượng chệch của ? , được tính toán, từ đó chúng ta có thể suy raσ E ( s )E(s2)=σ2σE(s)

E(s)2=2σ2n1(Γ(n/2)Γ(n12))2

vì thế

SD(s)=E(s2)E(s)2=σ12n1(Γ(n/2)Γ(n12))2

Điểm tốt. Tôi có một ước tính về phương sai của s ^ 2. Lấy căn bậc hai cho ước tính độ lệch chuẩn của s ^ 2. Nhưng bạn đã trả lời câu hỏi thực tế là lấy độ lệch chuẩn của s. Tôi cho rằng vì lý do thực tế, bạn cũng sẽ thay thế σ bằng s để có ước tính bằng công thức.
Michael R. Chernick

Vâng, điều đó đúng, bạn có thể thay thế bằng và phép tính gần đúng này hoạt động tốt ngay cả đối với kích thước mẫu khiêm tốn - Tôi đã thực hiện một số thử nghiệm với . s n = 20σsn=20
Macro

11

Đại lượng có phân phối chi bình phương với bậc tự do khi các mẫu độc lập và được phân phối với cùng phân phối bình thường Số lượng này có thể được sử dụng để có độ tin cậy khoảng cho phương sai của bình thường và độ lệch chuẩn của nó. Nếu bạn có các giá trị thô và không chỉ giá trị trung tâm của các thùng, bạn có thể tính . n - 1 s 2X=(n1)s2/σ2n1s2

Được biết, nếu có phân phối chi bình phương với bậc tự do thì phương sai của nó là . Biết được điều này và thực tế chúng ta nhận được rằng có phương sai bằng Mặc dù không xác định nhưng bạn có thể ước chừng nó bằng và bạn có một ý tưởng sơ bộ về phương sai của là gì.n - 1 2 ( n - 1 ) V một r ( c X ) = c 2 V một r ( X ) s 2 2 ( n - 1 ) σ 4Xn12(n1)Var(cX)=c2Var(X)s2

2(n1)σ4(n1)2=2σ4n1.
σ4s4s2

Tôi sẽ đăng bài này vào lúc ăn xin, nhưng vấn đề như tôi thấy ở đây là không rõ. Vì thực tế đó, tôi không biết liệu nó có hợp lệ để xấp xỉ không nếu chúng ta thậm chí không biết kích thước mẫu. Tôi nhớ rằng người ta có thể chỉ ra rằng khoảnh khắc thứ tư có thể có vấn đề nghiêm trọng với các ngoại lệ. σ2s4σ4
Néstor

s4 là một công cụ ước tính nhất quán của (với điều kiện tồn tại), phải không @Nesp? Tôi nghĩ rằng đây thường là những gì có nghĩa là khi mọi người nói "gần đúng" hoặc "ý tưởng thô". σ4σ4
Macro

2
Có lẽ là thiếu ngủ, nhưng, không giống như lý luận tròn?
Néstor

Chúng tôi giả định từ lúc bắt đầu rằng dữ liệu đến từ một phân phối bình thường nên không có vấn đề gì ngoại lệ. Tôi có nghĩa là thô trong cách Macro gợi ý. Tôi đồng ý rằng kích thước mẫu ảnh hưởng đến mức độ s ^ 4 gần với σ ^ 4. Nhưng lo lắng về các ngoại lệ là Nesp offbase. Nếu bạn đánh giá thấp tôi vì điều đó tôi nghĩ nó rất không công bằng. Những gì tôi đã trình bày là cách tiêu chuẩn để ước tính độ lệch chuẩn cho s ^ 2 khi dữ liệu được PHÂN PHỐI BÌNH THƯỜNG.
Michael R. Chernick

@Nesp, Michael đã đưa ra một công cụ ước tính nhất quán về phương sai của độ lệch chuẩn mẫu so với mẫu phân phối thông thường - đối với các mẫu lớn, nó sẽ hoạt động tốt - mô phỏng và tìm hiểu. Tôi không chắc tại sao bạn nghĩ rằng đây là lý luận tròn.
Macro

7

Có một số cách định lượng lỗi sai lệch chuẩn trong trường hợp bình thường. Tôi sẽ trình bày khả năng hồ sơ của có thể được sử dụng để xấp xỉ khoảng tin cậy.σ

Đặt là một mẫu từ Bình thường . Hàm khả năng tương ứng được đưa ra bởix=(x1,...,xn)(μ,σ)

L(μ,σ)1σnexp(12σ2j=1n(xjμ)2)

Sau đó, Công cụ ước tính khả năng tối đa được đưa ra bởi , trong đó . Cho rằng bạn quan tâm đến việc định lượng lỗi trên , sau đó bạn có thể tính toán khả năng cấu hình chuẩn hóa của tham số này như sau.(μ^,σ^)=(x¯,s)s=1nj=1n(xjx¯)2σ

Rp(σ)=supμL(μ,σ)L(μ^,σ^)=(σ^σ)nexp[n2(1(σ^σ)2)]

Lưu ý rằng . Một khoảng cấp có độ tin cậy xấp xỉ . Tiếp theo tôi đính kèm mã có thể được sử dụng để tính các khoảng này. phù hợp trong ngữ cảnh của bạn (hoặc nếu bạn đăng dữ liệu tôi có thể bao gồm những thay đổi này).0.147 0.95 RRp:R+(0,1]0.1470.95R

data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2))  )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)

Một lợi thế của loại khoảng này là chúng bất biến dưới các phép biến đổi. Trong trường hợp này nếu bạn tính một khoảng cho , , thì khoảng tương ứng cho chỉ đơn giản là .tôi = ( L , U ) σ 2 tôi ' = ( L 2 , U 2 )σI=(L,U)σ2I=(L2,U2)


Tôi nghĩ rằng anh ấy thực sự chỉ muốn độ lệch chuẩn của s.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.