Số lượng từ sự kết hợp của phân phối bình thường


12

Tôi có thông tin về sự phân bố kích thước nhân trắc học (như nhịp vai) cho trẻ em ở các độ tuổi khác nhau. Đối với mỗi độ tuổi và kích thước, tôi có ý nghĩa, độ lệch chuẩn. (Tôi cũng có tám lượng tử, nhưng tôi không nghĩ rằng tôi có thể nhận được những gì tôi muốn từ họ.)

Đối với mỗi thứ nguyên, tôi muốn ước tính các lượng tử cụ thể của phân bố độ dài. Nếu tôi giả sử rằng mỗi kích thước được phân phối bình thường, tôi có thể thực hiện việc này với các phương tiện và độ lệch chuẩn. Có một công thức đẹp mà tôi có thể sử dụng để lấy giá trị liên quan đến một lượng tử cụ thể của phân phối không?

Điều ngược lại khá dễ dàng: Đối với một giá trị cụ thể, hãy đặt khu vực ở bên phải của giá trị cho mỗi phân phối bình thường (độ tuổi). Tính tổng các kết quả và chia cho số lượng phân phối.

Cập nhật : Đây là câu hỏi tương tự ở dạng đồ họa. Giả sử rằng mỗi phân phối màu được phân phối bình thường. Câu hỏi tương tự ở dạng đồ họa

Ngoài ra, rõ ràng tôi chỉ có thể thử một loạt các độ dài khác nhau và tiếp tục thay đổi chúng cho đến khi tôi có được một khoảng đủ gần với lượng tử mong muốn cho độ chính xác của mình. Tôi đang tự hỏi nếu có một cách tốt hơn thế này. Và nếu đây là cách tiếp cận phù hợp, liệu có một cái tên cho nó?


3
Bạn có hỏi liệu có một công thức đơn giản để tính toán lượng tử của hỗn hợp phân phối bình thường không? Trong ứng dụng này, bạn sẽ yêu cầu các lượng tử (giả sử) của nhịp vai bất kể tuổi tác dựa trên các thông số cụ thể theo độ tuổi . Đây có phải là một giải thích chính xác?
whuber

Câu trả lời:


16

w

d2wdp2=w(dwdp)2

w(1/2)=0w(1/2)=2π

qnorm(p, mean=mu, sd=sigma)

pN(μ,σ2)


Chỉnh sửa: Với sự hiểu biết được sửa đổi về vấn đề, dữ liệu được tạo từ hỗn hợp các quy tắc, do đó mật độ của dữ liệu được quan sát là:

p(x)=iwipi(x)

iwi=1pi(x)μiσi

F(y)=yiwipi(x)dx=iwiypi(x)=iwiFi(y)

Fi(x)μiσiF1

F1wi,μi,σip

# evaluate the function at the point x, where the components 
# of the mixture have weights w, means stored in u, and std deviations
# stored in s - all must have the same length.
F = function(x,w,u,s) sum( w*pnorm(x,mean=u,sd=s) )

# provide an initial bracket for the quantile. default is c(-1000,1000). 
F_inv = function(p,w,u,s,br=c(-1000,1000))
{
   G = function(x) F(x,w,u,s) - p
   return( uniroot(G,br)$root ) 
}

#test 
# data is 50% N(0,1), 25% N(2,1), 20% N(5,1), 5% N(10,1)
X = c(rnorm(5000), rnorm(2500,mean=2,sd=1),rnorm(2000,mean=5,sd=1),rnorm(500,mean=10,sd=1))
quantile(X,.95)
    95% 
7.69205 
F_inv(.95,c(.5,.25,.2,.05),c(0,2,5,10),c(1,1,1,1))
[1] 7.745526

# data is 20% N(-5,1), 45% N(5,1), 30% N(10,1), 5% N(15,1)
X = c(rnorm(5000,mean=-5,sd=1), rnorm(2500,mean=5,sd=1),
      rnorm(2000,mean=10,sd=1), rnorm(500, mean=15,sd=1))
quantile(X,.95)
     95% 
12.69563 
F_inv(.95,c(.2,.45,.3,.05),c(-5,5,10,15),c(1,1,1,1))
[1] 12.81730

2
Đoạn cuối của câu hỏi gợi ý rằng một cái gì đó khác đang được yêu cầu. Tôi đã yêu cầu làm rõ.
whuber

linh cảm của whuber là chính xác. Tôi đã thêm một hình ảnh để làm cho câu hỏi bớt khó hiểu.
Thomas Levine

1
Hiện tại đã có gói R để giải quyết vấn đề này, xem số liệu thống kê.stackexchange.com/questions/390931 / 21
Christoph Hanck
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.