Làm thế nào để tham số hóa tỷ lệ của hai biến phân phối thông thường, hoặc nghịch đảo của một biến?


12

Vấn đề: Tôi đang tham số hóa các bản phân phối để sử dụng làm mục sư và dữ liệu trong phân tích tổng hợp Bayes. Dữ liệu được cung cấp trong tài liệu dưới dạng thống kê tóm tắt, hầu như chỉ được giả định là được phân phối bình thường (mặc dù không có biến nào có thể <0, một số là tỷ lệ, một số là khối lượng, v.v.).

Tôi đã gặp hai trường hợp mà tôi không có giải pháp. Đôi khi tham số quan tâm là nghịch đảo của dữ liệu hoặc tỷ lệ của hai biến.

Ví dụ:

  1. tỷ lệ của hai biến phân phối thông thường:
    • dữ liệu: trung bình và sd cho phần trăm nitơ và phần trăm carbon
    • tham số: tỷ lệ giữa carbon và nitơ.
  2. nghịch đảo của một biến phân phối thông thường:
    • dữ liệu: khối lượng / khu vực
    • tham số: diện tích / khối lượng

Cách tiếp cận hiện tại của tôi là sử dụng mô phỏng:

ví dụ: đối với một tập hợp phần trăm dữ liệu carbon và nitơ với các phương tiện: xbar.n, c, phương sai: se.n, c và cỡ mẫu: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Tôi muốn tham số hóa ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Sau đó chọn các bản phân phối phù hợp nhất với phạm vi cho trước của tôi0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Câu hỏi: Đây có phải là một cách tiếp cận hợp lệ? Có cách tiếp cận khác / tốt hơn?

Cảm ơn trước!

Cập nhật: phân phối Cauchy, được định nghĩa là tỷ lệ của hai quy tắc với , có tiện ích hạn chế vì tôi muốn ước tính phương sai. Có lẽ tôi có thể tính toán phương sai của một mô phỏng n rút ra từ một Cauchy?μ=0

Tôi đã tìm thấy các xấp xỉ dạng đóng sau đây nhưng tôi chưa kiểm tra xem liệu chúng có cho kết quả tương tự không ... Hayya et al, 1975 σ 2 y : x =σ 2 x ×μy/mu 4

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. và Armstrong, D. và Gressis, N., 1975. Một lưu ý về tỷ lệ của hai biến phân phối thông thường. Khoa học quản lý 21: 1338--1341


Tôi có nên đăng câu hỏi Cập nhật về việc tính toán phương sai trên các lần rút ngẫu nhiên từ Cauchy như một câu hỏi riêng không?
David LeBauer

david - vì các biến của bạn đều dương, tại sao bạn muốn làm phiền vớiμ=0 ? btw - trong mô phỏng của bạn, dường như bạn đang tạo các biến per.c và per.n độc lập. điều đó có đúng không - và nếu vậy, đó có phải là điều bạn muốn không?
ronaf

không, tôi không muốn làm phiền với = 0; các biến này thường được coi là độc lập và dữ liệu hiệp phương sai hiếm khi có sẵn. Vì C là khá ổn định, tính độc lập là một giả định hợp lý.μ
David LeBauer

Tôi không hiểu tại sao kỳ vọng của tỷ lệ không tồn tại. Nếu và được phân phối bình thường với giá trị trung bình khác 0, thì giá trị trung bình của được cho bởi , tôi đang thiếu gì? XYZ=XYxyp(x,y)dxdy
Royi

Câu trả lời:


6

Bạn có thể muốn xem một số tài liệu tham khảo trong bài viết Wikipedia về Tỷ lệ phân phối . Có thể bạn sẽ tìm thấy các xấp xỉ hoặc phân phối tốt hơn để sử dụng. Nếu không, cách tiếp cận của bạn có vẻ âm thanh.

Cập nhật Tôi nghĩ rằng một tài liệu tham khảo tốt hơn có thể là:

Xem công thức 2-4 trên trang 195.

Cập nhật 2

Về câu hỏi cập nhật của bạn liên quan đến phương sai từ Cauchy - như John Cook đã chỉ ra trong các bình luận, phương sai không tồn tại. Vì vậy, lấy phương sai mẫu đơn giản sẽ không hoạt động như một "công cụ ước tính". Trên thực tế, bạn sẽ thấy rằng phương sai mẫu của bạn hoàn toàn không hội tụ và dao động dữ dội khi bạn tiếp tục lấy mẫu.


Cảm ơn bạn đã tham khảo, đó là nơi tôi tìm thấy tài liệu tham khảo Haaya 1975 và các phương trình trong câu hỏi của tôi, mặc dù tôi đánh giá cao sự trấn an rằng các phương trình phù hợp với vấn đề của tôi.
David LeBauer

Nhìn nhanh vào Haaya, có vẻ như họ quan tâm đến việc lấy xấp xỉ Bình thường cho tỷ lệ và sử dụng mô phỏng để xác định khi nào áp dụng (sử dụng hệ số biến thiên, cv). Cv trong trường hợp của bạn có đáp ứng các tiêu chí không? Nếu vậy, các xấp xỉ áp dụng.
ars

1
@David: sử dụng Marsaglia 1965 thay vì được cập nhật trong câu trả lời.
ars

Lưu ý: Marsaglia đã xuất bản một bản cập nhật trong JSS năm 2004 .
David LeBauer

XYZ=XYxyp(x,y)dxdy

0

y1N(.,.)

Đề nghị của tôi dưới đây để sử dụng Cauchy không hoạt động như được chỉ ra trong các bình luận của ars và John.

Tỷ lệ của hai biến ngẫu nhiên thông thường theo phân phối Cauchy . Bạn có thể muốn sử dụng ý tưởng này để xác định các tham số của cauchy phù hợp nhất với dữ liệu bạn có.


a. Tôi cần ước tính phương sai và phương sai của phân phối Cauchy không được xác định.
David LeBauer

b. Nếu tôi hiểu điểm thứ hai của bạn, vâng, tôi có thể giả sử rằng y-1 ~ N (mu, sigma), nhưng tôi vẫn cần tính toán mu và sigma từ các thống kê tóm tắt được đưa ra cho y; Ngoài ra, tôi đã chọn không xem xét phân phối với các giá trị <0 cho các biến chỉ được xác định> 0 (mặc dù trong nhiều trường hợp p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

Không phải Cauchy áp dụng cho quy tắc trung bình bằng không?
ars

@ars Bạn đúng rồi. Các cauchy sau đó có thể được sử dụng hạn chế.

Ars: Vâng, tôi tin rằng kết quả Cauchy không cần phương tiện. Nhưng điều đó vẫn có nghĩa là ít nhất trong trường hợp đặc biệt đó, phương sai mà David đang cố ước tính KHÔNG HIỆN TẠI.
John D. Cook
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.