Tìm độ chính xác của ước tính mô phỏng Monte Carlo


12

Lý lịch

Tôi đang thiết kế một mô phỏng Monte Carlo kết hợp đầu ra của một loạt các mô hình và tôi muốn chắc chắn rằng mô phỏng đó sẽ cho phép tôi đưa ra những tuyên bố hợp lý về xác suất kết quả mô phỏng và độ chính xác của ước tính xác suất đó.

Mô phỏng sẽ tìm thấy xác suất mà bồi thẩm đoàn rút ra từ một cộng đồng được chỉ định sẽ kết án một bị cáo nào đó. Đây là các bước của mô phỏng:

  1. Sử dụng dữ liệu hiện có, tạo ra một mô hình xác suất logistic ( M ) bằng cách hồi quy hội đồng bầu cử đầu tiên bỏ phiếu bầu cử trên các dự đoán nhân khẩu học.

  2. Sử dụng các phương pháp Monte Carlo để mô phỏng 1.000 phiên bản M (nghĩa là 1000 phiên bản hệ số cho các tham số mô hình).

  3. Chọn một trong 1.000 phiên bản của mô hình ( M i ).

  4. Empanel 1.000 hội thẩm bằng cách chọn ngẫu nhiên 1.000 bộ 12 hội thẩm hội trường trực tuyến từ một cộng đồng người Hồi giáo ( C ) của các cá nhân có phân phối đặc điểm nhân khẩu học cụ thể.

  5. Xác định một cách xác định xác suất bỏ phiếu bầu cử tội lỗi đầu tiên cho mỗi bồi thẩm bằng M i .

  6. Kết xuất mỗi phiếu bầu có thể có của "bồi thẩm" thành một phiếu bầu xác định (dựa trên giá trị lớn hơn hoặc thấp hơn giá trị được chọn ngẫu nhiên trong khoảng 0-1).

  7. Xác định mỗi phiếu bầu của "bồi thẩm đoàn" bầu cử bằng cách sử dụng một mô hình (xuất phát từ dữ liệu thực nghiệm) về khả năng bồi thẩm đoàn sẽ kết án, có điều kiện dựa trên tỷ lệ bồi thẩm đoàn để kết tội trong lá phiếu đầu tiên.

  8. Lưu trữ tỷ lệ các bản án có tội trong 1000 hội thẩm ( PG i ).

  9. Lặp lại các bước 3-8 cho mỗi 1.000 phiên bản mô phỏng của M .

  10. Tính giá trị trung bình của PG và báo cáo rằng khi ước lượng điểm của khả năng thuyết phục trong  C .

  11. Xác định các giá trị phần trăm 2,5 & 97,5 cho PG và báo cáo là khoảng tin cậy 0,95.

Tôi hiện đang sử dụng 1.000 viên bồi thẩm đoàn và 1.000 giám khảo trên lý thuyết rằng 1.000 ngẫu nhiên rút ra từ một xác suất đặc điểm phân phối-nhân khẩu học của C hoặc các phiên bản của M -sẽ điền phân phối đó.

Câu hỏi

Điều này sẽ cho phép tôi xác định chính xác độ chính xác của ước tính của tôi? Nếu vậy, tôi cần bao nhiêu hiệp để empanel cho mỗi phép tính PG i để bao gồm phân phối xác suất của C (vì vậy tôi tránh lựa chọn sai lệch); Tôi có thể sử dụng ít hơn 1.000?

Cảm ơn bạn rất nhiều về mọi mặt!


Chỉ tò mò: có bất cứ điều gì trong mô hình này có điều kiện về việc liệu bị cáo có thực sự phạm tội không?
whuber

Mô hình dựa trên các câu trả lời khảo sát cho một mẫu thực tế duy nhất, vì vậy cảm giác tội lỗi thực tế không khác nhau. Tôi dự đoán các thế kỷ khác nhau sẽ diễn ra như thế nào trong một trường hợp tranh cãi.
Maggie

OK, đùa qua một bên, bạn báo cáo ba ước tính: giá trị trung bình và 2,5 và 97,5% của PG. Bạn cần một quyết định "chính xác" nào và chính xác đến mức nào?
whuber

Ngoài ra, bước (6) là bí ẩn. Bạn có thể giải thích những gì nó dự định làm? Có một "giá trị được chọn ngẫu nhiên" khác nhau cho mỗi bồi thẩm (5), mỗi bồi thẩm đoàn (4), mỗi mô hình (3) hoặc một số kết hợp của chúng không?
whuber

1
(Xem bình luận ở trên) Tôi nghĩ rằng tôi có thể giảm (a), số lượng bồi thẩm đoàn. Lỗi lấy mẫu là một hàm của số lượng mẫu. Với 1.000 jutions trên mỗi mô hình, tôi có tổng số một triệu mẫu. Lỗi lấy mẫu liên quan đến 10 ^ 6 mẫu là ~ 0,1%. Nếu tôi chỉ sử dụng 35 jutions cho mỗi mô hình, tôi sẽ có 3,5 * 10 ^ 4 mẫu và ~ 0,5% lỗi lấy mẫu. Lỗi lấy mẫu này nhỏ hơn nhiều so với sai số đo của tôi là ~ 5.0%. Do đó, tôi sẽ có thể sử dụng 35 jutions cho mỗi mô hình và chỉ cần sử dụng sai số đo để ước tính khoảng tin cậy của mình.
Maggie

Câu trả lời:


4

Có một tiêu chí chung và "trong vũ trụ" cho sự tốt đẹp của Monte Carlo - sự hội tụ.

Bám sát một M và kiểm tra xem PG hành xử như thế nào với số lượng của các hội thảo - nó sẽ hội tụ, do đó sẽ cho bạn thấy một số lần lặp lại mà bạn sẽ có số chữ số có nghĩa (cho ứng dụng của bạn). Lặp lại điểm chuẩn này cho một vài Ms khác để chắc chắn rằng bạn không may mắn với lựa chọn M, sau đó tiến hành toàn bộ mô phỏng.


1
không chắc chắn bất cứ ai đã hoàn toàn đáp ứng với câu hỏi. Nó có hai phần: (1) Chiến lược mô hình hóa được mô tả có cung cấp giải pháp phòng thủ cho vấn đề mà cô ấy muốn giải quyết hay không, đó là khả năng một bồi thẩm đoàn rút ra ngẫu nhiên từ cộng đồng, C , với các đặc điểm nhân khẩu học cụ thể sẽ bỏ phiếu để tìm bị cáo có tội không? Và (2) Nếu chiến lược lập mô hình là hợp lý, cô ấy phải chọn bao nhiêu cuộc hôn nhân, và cô ấy phải mô phỏng bao nhiêu phán đoán cho mỗi người, để báo cáo ước tính có thể phòng thủ được về mức độ kết án & 0,95 CI? Cô ấy muốn tiết kiệm điện toán. Xem bình luận cuối cùng của cô ấy
dmk38

0

Dường như với tôi, vấn đề ở đây là liệu mô hình có quá phức tạp để nhìn ra mà không sử dụng mô phỏng Monte Carlo hay không.

Nếu mô hình hoàn toàn đơn giản thì có thể xem xét nó thông qua thống kê conventioanl và rút ra giải pháp cho câu hỏi đang được hỏi, mà không cần chạy lại mô hình nhiều lần. Đây là một chút đơn giản, nhưng nếu tất cả mô hình của bạn đã tạo ra các điểm dựa trên phân phối bình thường, thì bạn có thể dễ dàng rút ra loại câu trả lời mà bạn đang tìm kiếm. Tất nhiên, nếu mô hình này đơn giản thì bạn không cần phải thực hiện mô phỏng Monte Carlo tìm câu trả lời của bạn.

Nếu vấn đề phức tạp và không thể chia nhỏ thành nhiều vấn đề cơ bản hơn, thì Monte-Carlo là loại mô hình phù hợp để sử dụng, nhưng tôi không nghĩ có bất kỳ cách nào để xác định giới hạn độ tin cậy mà không cần chạy mô hình. Cuối cùng, để có được loại giới hạn độ tin cậy được mô tả, mô hình của anh ta sẽ phải được chạy nhiều lần, phân phối xác suất phải phù hợp với đầu ra và từ đó có thể xác định giới hạn tâm sự. Một trong những thách thức với mô phỏng Monte-Carlo là các mô hình đưa ra câu trả lời tốt và thường xuyên cho các bản phân phối trong phạm vi tầm trung nhưng đuôi thường cho kết quả biến đổi hơn nhiều, điều đó có nghĩa là nhiều lần chạy hơn để xác định hình dạng của đầu ra ở mức 2,5% và 97,5% phần trăm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.