Tính toán trọng số xác suất nghịch đảo - ước tính mật độ có điều kiện (đa biến)?


8

Phiên bản chung:

Tôi cần ước tính trong đó và liên tục và đa biến. Tôi thà làm điều đó không theo quy tắc bởi vì tôi không có một hình thức chức năng tốt trong tâm trí và cần phải là một cái gì đó không thiên vị. Tôi muốn sử dụng một mật độ hạt nhân ước lượng có điều kiện, nhưng tôi nhận ra rằng tôi sẽ cần phải quantize đầu tiên. Sau đó, tôi đã có ý tưởng ước tính và từ dữ liệu và sử dụng nó để tính toán hoặc có thể tôi đã đọc nó ở đâu đó và đừng nhớ nơi nào.Một X f ( A | X ) X f ( A , X ) f ( X ) f ( A | X )f(A|X)AXf^(A|X)Xf^(A,X)f^(X)f^(A|X)

Có một lý do thủ tục này sẽ không hợp lệ? Có một cách tiếp cận tốt hơn hoặc trung thực hơn mật độ hạt nhân? Ngoài ra, có một vấn đề với việc ước tính mật độ dân số từ mật độ mẫu không theo phương pháp đo lường? Dữ liệu là dữ liệu khảo sát và tôi có trọng số khảo sát; Tôi nên kết hợp chúng bằng cách nào đó?


Phiên bản dành riêng cho trường hợp:

Có lẽ đáng nói là tôi sẽ sử dụng các ước tính này cho các trọng số xác suất điều trị nghịch đảo trong mô hình cấu trúc cận biên, như trong Robins (2000) ( PDF không được cung cấp ). Tôi quan sát một chuỗi các "phương pháp điều trị" và một chuỗi các yếu tố gây nhiễu thay đổi theo thời gian đối với một số kết quả xảy ra tại . Tôi đã đưa ra giả thuyết về một mối quan hệ nhân quả tham số đơn giản, , nhưng vì có một yếu tố gây nhiễu thay đổi theo thời gian { x t } 4 t = 0 ~ y t = T + 1 E [ ~ Y | một ] = β ' một β{at}t=04{xt}t=04y~t=T+1E[Y~|a]=βaβlà một ước tính sai lệch về "hiệu quả điều trị trung bình" và yếu tố gây nhiễu không thể được thêm vào như một biến hồi quy vì nó nằm trên đường dẫn nhân quả và điều đó cũng sẽ sai lệch . May mắn thay, Doc Robins đã tìm ra rằng tôi có thể có được ước tính không thiên vị / không tin cậy và hiệu quả hợp lý nếu tôi cân nhắc lại các quan sát của mình bằng cách: w i = 4 s = 0 f ( a s | a s < t )β

wi=s=04f(as|as<t)f(as|as<t,xs<t)

Câu hỏi của tôi: Chuỗi trọng lượng đó thực sự là những gì tôi cần một ước tính cho. Robins khuyến nghị hồi quy logistic. Nhưng nằm trong , được đo trên và cho tất cả các mục đích thực tế nằm trong một tập hợp con hữu hạn. nằm trong một khoảng đóng, nhưng chỉ vì nó thực sự là giá trị trung bình của một vài biến, mỗi biến được đo trên tập con hữu hạn của . [ 0 , ) 7 { 0 , ... } 7 x t { 0 , ... , 12 }at[0,)7{0,}7xt{0,,12}

Vì vậy, tôi đã có một vài ý tưởng:

  1. Ước tính và không theo tỷ lệf ( x , a s < t )f(at,as<t,xs<t)f(x,as<t)
  2. Ước tính với hồi quy beta và không theo tỷ lệf ( x s < t , a s < t )f(at|as<t,xs<t)f(xs<t,as<t)
  3. Ước tính với hồi quy beta và ước tính ) bằng cách "xâu chuỗi" hồi quy beta theo thời gian để diễn tả toàn bộ sự việc như một điều kiện.f ( a t , a s < t , x s < ( t - 1 ) )f(xt1|at,as<t,xs<(t1))f(at,as<t,xs<(t1))
  4. Một cái gì đó thực sự mạch lạc và trung thực trong việc truyền bá sự không chắc chắn, mà rõ ràng là tôi không nghĩ đến.
  5. Bayes? Tôi biết Stan và JAGS, nhưng MCMC có thể sẽ làm nổ máy tính của tôi (tôi không muốn giao dịch với EC2).

Tôi không tìm thấy bất kỳ gợi ý nào trong tài liệu, vì các phương pháp điều trị đa biến rất hiếm trong mô hình nguyên nhân. Tôi nên làm gì?

Điểm thưởng: bạn cảm thấy thế nào về ký hiệu để thể hiện thay vì một cái gì đó như ? { a s } t s = 0 a t - 1as<t{as}s=0tat1

Câu trả lời:


10

Ý tưởng cơ bản

a,b,c

f^ab(y,z)f^c(z)=f^abc(y|z)

(a,b)ca=b=cy=xt,z=xt1

na2(f^abc=aaa(y|z)f(y|z))dN(0,V)

V^=(K(u)2du)2f^aaa(y|z)f^a(z)=(K(u)2du)2f^aa(y,z)

Mặc dù tôi chưa bao giờ thấy một mô hình có trọng số thường xuyên (thậm chí cả các chỉ số giới thiệu giới thiệu) thực hiện một nỗ lực để tính toán phương sai của các trọng số ước tính. Bây giờ tôi sẽ tuân theo quy ước đó nhưng nếu tôi nhận được kết quả ở đây, tôi sẽ xem liệu tôi có thể biến nó thành một mô hình Bayes hoàn toàn sẽ truyền bá sự không chắc chắn một cách trung thực hơn không. Vì vậy, có, ước tính mật độ có điều kiện bằng cách ước tính mật độ khớp và mật độ biên là thủ tục tiêu chuẩn.

Áp dụng cho trường hợp của tôi

y=xtz=(xs)s=1t1xs=(xs,1xs,D)x=((xs,d)d=1D)s=1t1

Băng thông

B=(Bnumerator00Bdenominator)=((a1,1B1numB2numat,D)00(c1,1B1denomB2denomct1,D))

H=hH0|H0|=1bN4+DBnumBdenomB

a=b=czyzz=μμa^(μ)

Một phiên bản tổng quát hơn của cùng một kết quả nằm trong một phần khác của các ghi chú bài giảng, được gọi là băng thông "quy tắc ngón tay cái". Chúng cũng lấy được băng thông tối ưu như là một chức năng của quy trình xác thực chéo chung.

Tính toán

Tôi có một điều trị 7 chiều trong 3 khoảng thời gian, vì vậy tôi có mật độ lên đến 21 chiều để ước tính. Và tôi đã quên về đồng biến cơ sở. Tôi có một cái gì đó giống như 30 đồng biến cơ sở, vì vậy cuối cùng tôi sẽ cố gắng ước tính phân phối 51 chiều, phân phối 44 chiều và phân phối 37 chiều. Và đó là chưa kể rằng chiều cực đoan sẽ đòi hỏi một mẫu lớn không thể tưởng tượng nổi. Scott & Wand (1991) báo cáo rằng cỡ mẫu 50 trong một chiều tương đương với hơn 1 triệu trong 8 chiều ... không đề cập đến 30. Không có số lượng nào trong số này có thể diễn tả cảm giác của tôi lúc này.

Phần kết luận

Vì vậy, tôi chỉ lãng phí một tuần của cuộc đời mình cho việc này. Ồ tốt Thay vào đó, tôi sẽ sử dụng MCMC để phù hợp với các mô hình kết quả và điều trị tham số đồng thời, để trọng số IPT cuối cùng là một chức năng của mật độ dự đoán sau từ mô hình điều trị. Sau đó, tôi sẽ chuyển qua các dạng tuyến tính, bậc hai và khối cho mô hình xử lý và xem cái nào phù hợp nhất.


6
"Vì vậy, tôi chỉ lãng phí một tuần của cuộc đời mình cho việc này." Đó gọi là học tập và nghiên cứu. Là một sinh viên bậc thầy, bạn nên nắm lấy điều đó bởi vì có nhiều điều như thế này sẽ đến. Thường không có lối tắt trong nghiên cứu vì thường không ai biết đường!
Momo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.