Nghiên cứu mô phỏng: làm thế nào để chọn số lần lặp?


11

Tôi muốn tạo dữ liệu với "Model 1" và khớp chúng với "Model 2". Ý tưởng cơ bản là điều tra các thuộc tính mạnh mẽ của "Mô hình 2". Tôi đặc biệt quan tâm đến tỷ lệ bao phủ của khoảng tin cậy 95% (dựa trên xấp xỉ bình thường).

  • Làm cách nào để đặt số lần chạy lặp?
  • Có đúng là lớn hơn các bản sao cần thiết có thể dẫn đến sai lệch giả? Nếu vậy, làm thế nào?

Bạn có ý nghĩa gì bởi "tỷ lệ bao phủ của khoảng tin cậy 95%"? Nếu khoảng tin cậy là chính xác hoặc khoảng xấp xỉ tốt, nó sẽ bao gồm giá trị thực của tham số khoảng 95% thời gian.
Michael R. Chernick

1
Nếu bạn đang tạo khoảng tin cậy dựa trên Mô hình 2 cho dữ liệu được tạo trong Mô hình 1, điều này dường như cho thấy hai mô hình có liên quan và chứa một số tham số giống nhau. Bạn có thể giải thích thêm một chút không? Ngoài ra, khi bạn nói "giả" trong gạch đầu dòng thứ hai của bạn, bạn có nghĩa là sai hoặc chỉ không quan trọng? Số lượng mô phỏng lớn hơn không tạo ra sai lệch nhưng nó có thể tiết lộ một thiên vị ít quan trọng thực tế mà bạn sẽ không thấy với số lượng nhỏ hơn, tương tự như cách bạn có thể phát hiện (nghĩa là có ý nghĩa thống kê) cho một hiệu ứng rất nhỏ khi bạn có cỡ mẫu rất lớn.
Macro

@Michael Chernick: Chẳng hạn, phạm vi bảo hiểm có thể đạt được nếu lỗi tiêu chuẩn quá nhỏ. Tôi đã chỉnh sửa câu hỏi của mình để chỉ định hơn là tôi sử dụng khoảng tin cậy dựa trên xấp xỉ bình thường.
dùng7064

@Macro: "Model 1" tạo dữ liệu bình thường với các thuật ngữ lỗi không đồng nhất và "Model 2" là mô hình tuyến tính tiêu chuẩn.
dùng7064

Câu trả lời:


10

Dựa trên nhận xét tiếp theo của bạn, có vẻ như bạn đang cố ước tính xác suất bao phủ của khoảng tin cậy khi bạn giả sử phương sai lỗi không đổi khi phương sai lỗi thực sự không phải là hằng số.

Cách tôi nghĩ về điều này là, với mỗi lần chạy, khoảng tin cậy sẽ bao gồm giá trị thực hoặc không. Xác định một biến chỉ báo:

Yi={1if the interval covers0if it does not

Sau đó, xác suất bảo hiểm bạn quan tâm là mà bạn có thể ước tính theo tỷ lệ mẫu mà tôi nghĩ là những gì bạn đang đề xuất.E(Yi)=p

Làm cách nào để đặt số lần chạy lặp?

Chúng ta biết rằng phương sai của một thử nghiệm Bernoulli là , và mô phỏng của bạn sẽ tạo IID thử nghiệm Bernoulli, do đó phương sai của mô phỏng dựa ước tính của bạn của pp ( 1 - p ) / n , nơi n là số lượng mô phỏng. Bạn có thể chọn n để thu nhỏ phương sai này bao nhiêu tùy ý. Đó là một thực tế là p ( 1 - p ) / n 1 / 4 np(1p)pp(1p)/nnn

p(1p)/n1/4n

Vì vậy, nếu bạn muốn phương sai được ít hơn một số xác định trước ngưỡng, , sau đó bạn có thể đảm bảo điều này bằng cách chọn n 1 / 4 δ .δn1/4δ

Trong một cài đặt tổng quát hơn, nếu bạn đang cố gắng điều tra các thuộc tính của phân phối lấy mẫu của công cụ ước tính bằng mô phỏng (ví dụ: trung bình và phương sai) thì bạn có thể chọn số lượng mô phỏng dựa trên mức độ chính xác mà bạn muốn đạt được trong một tương tự thời trang được mô tả ở đây.

Cũng lưu ý rằng, khi giá trị trung bình (hoặc một thời điểm khác) của một biến là đối tượng quan tâm, như ở đây, bạn có thể xây dựng khoảng tin cậy cho nó dựa trên các mô phỏng sử dụng xấp xỉ bình thường (ví dụ định lý giới hạn trung tâm) , như đã thảo luận trong câu trả lời hay của MansT. Giá trị gần đúng bình thường này tốt hơn khi số lượng mẫu tăng lên, vì vậy, nếu bạn có kế hoạch xây dựng khoảng tin cậy bằng cách kháng cáo định lý giới hạn trung tâm, bạn sẽ muốn đủ lớn để áp dụng. Đối với trường hợp nhị phân, như bạn có ở đây, có vẻ như xấp xỉ này là tốt ngay cả khi n pn ( 1 - p ) khá vừa phải - giả sử, 20 .nnpn(1p)20

Có đúng là lớn hơn các bản sao cần thiết có thể dẫn đến sai lệch giả? Nếu vậy, làm thế nào?

Như tôi đã đề cập trong một bình luận - điều này phụ thuộc vào ý của bạn bởi giả mạo. Số lượng mô phỏng lớn hơn sẽ không tạo ra sai lệch theo nghĩa thống kê, nhưng nó có thể cho thấy một thiên vị không quan trọng chỉ đáng chú ý với kích thước mẫu lớn trong thiên văn. Ví dụ: giả sử xác suất bảo hiểm thực sự của khoảng tin cậy sai chính tả là . Sau đó, đây thực sự không phải là một vấn đề theo nghĩa thực tế, nhưng bạn chỉ có thể nhận ra sự khác biệt này nếu bạn chạy một tấn mô phỏng.94.9999%


10

Tôi thường sử dụng độ rộng của khoảng tin cậy như một cách nhanh chóng và bẩn thỉu để xác định số lần lặp cần thiết.

pXnXBin(n,p)

p^=X/npp(1p)/nnp^p^±1.96p^(1p^)/npp0.9521.960.950.05/n

0.1n

0.1=21.960.950.05/n.

n


(+1) có vẻ như chúng tôi đã gửi câu trả lời rất giống nhau cùng một lúc nhưng tôi nghĩ rằng ngôn ngữ khác nhau được sử dụng có thể hữu ích với một số người.
Macro

Vâng, thực sự, tôi vẫn không biết nên chấp nhận câu trả lời nào! Dù sao, +1 cho cả hai!
dùng7064

1
@Macro: +1 cho bạn là tốt. Phương sai và độ rộng khoảng cách tất nhiên tương đương ít nhiều ở đây. Những bộ óc vĩ đại nghĩ giống nhau - và chúng ta cũng vậy. ;)
MånsT

n=(21.650.950.05/0.01)2

0

Population Standard Deviationnd95%d=1.96×Pop.Std.Devnn=(1.96×Pop.Std.Dev)2d2

Thực hiện nhiều mô phỏng hơn (giả sử tất cả các mẫu được tạo ra bởi một quy trình ngẫu nhiên) không có gì làm tổn hại đến việc ước tính về độ chính xác hoặc sai lệch.

95%np(1p)n


4
Chào Michael. Tôi nghĩ rằng câu trả lời này bỏ lỡ điểm. OP đang cố gắng điều tra làm thế nào các thuộc tính bảo hiểm của khoảng tin cậy được thay đổi khi bạn giả sử phương sai không đổi nhưng phương sai thực sự không phải là hằng số.
Macro

@Macro: Bạn nói đúng. Tôi cố tình đặt câu hỏi trong một bối cảnh rộng hơn để tránh các câu trả lời cụ thể cho vấn đề giả định phương sai không đổi.
dùng7064

@Macro Đó không phải là một phần của câu hỏi mà tôi đã trả lời. Rõ ràng điều đó đã được làm rõ sau đó. Nó cũng xuất hiện rằng điều đáng quan tâm là độ chính xác của khoảng tin cậy sử dụng xấp xỉ bình thường. Điều này dường như không được giải quyết trong bất kỳ câu trả lời.
Michael R. Chernick

4
@Michael, vâng tôi biết - quan điểm của tôi là nhiều hơn mà bạn (và tôi) đã yêu cầu làm rõ nhưng bạn đã không chờ làm rõ trước khi đăng câu trả lời của mình. Re: bình luận thứ hai của bạn, bạn có thể điều tra các thuộc tính bảo hiểm của bất kỳ khoảng nào theo cách này, bất kể nó dựa trên xấp xỉ bình thường hay không. Nếu bạn nghĩ rằng có một cái gì đó khác biệt để thêm mà bị bỏ lỡ bởi các câu trả lời hiện có thì vui lòng chỉnh sửa câu trả lời của bạn để tất cả chúng ta có thể tìm hiểu.
Macro

@Macro Tất nhiên tôi đồng ý với bạn. Tôi đã chỉnh sửa câu trả lời của mình vì lợi ích của OP. Tôi nghi ngờ rằng không có gì trong nội dung mà bạn chưa biết.
Michael R. Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.