Có đúng là bootstrap phần trăm không bao giờ nên được sử dụng?


31

Trong các ghi chú của MIT OpenC thuyếtWare cho 18.05 Giới thiệu về Xác suất và Thống kê, Mùa xuân 2014 (hiện có tại đây ), có ghi:

Phương pháp phần trăm bootstrap hấp dẫn do tính đơn giản của nó. Tuy nhiên, nó phụ thuộc vào phân phối bootstrap của dựa trên một mẫu cụ thể là một xấp xỉ tốt với phân phối thực sự của ˉ x . Rice nói về phương pháp phân vị, "Mặc dù phương trình lượng tử trực tiếp này của phân phối lấy mẫu bootstrap với giới hạn độ tin cậy ban đầu có vẻ hấp dẫn, nhưng lý do của nó có phần mơ hồ." [2] Tóm lại, không sử dụng phương pháp phân vị bootstrap . Thay vào đó, hãy sử dụng bootstrap theo kinh nghiệm (chúng tôi đã giải thích cả hai với hy vọng rằng bạn sẽ không nhầm lẫn bootstrap theo kinh nghiệm cho bootstrap phần trăm).x¯x¯

[2] John Rice, Thống kê toán học và phân tích dữ liệu , tái bản lần 2, tr. 272

Sau một chút tìm kiếm trực tuyến, đây là câu trích dẫn duy nhất tôi tìm thấy trong đó nói rõ rằng bootstrap phần trăm không nên được sử dụng.

Những gì tôi nhớ lại được đọc từ văn bản Nguyên tắc và Lý thuyết về Khai thác dữ liệu và Học máy của Clarke et al. là lý do chính cho bootstrapping là thực tế là nơi F nlà CDF thực nghiệm. (Tôi không nhớ chi tiết ngoài điều này.)

1ni=1nF^n(x)pF(x)
F^n

Có đúng là không nên sử dụng phương thức bootstrap không? Nếu vậy, có những lựa chọn thay thế nào khi không nhất thiết phải biết (nghĩa là không có đủ thông tin để thực hiện bootstrap tham số)?F


Cập nhật

Bởi vì rõ đã được yêu cầu, "bootstrap thực nghiệm" từ những ghi chú MIT đề cập đến thủ tục sau đây: họ tính toán δ 2 = ( θ * - θ ) 1 - α / 2 với θ * dự toán bootstrapped của θq dự toán đầy đủ mẫu của θδ1=(θ^θ^)α/2δ2=(θ^θ^)1α/2θ^θθ^θ, Và kết quả ước tính khoảng tin cậy sẽ là .[θ^δ2,θ^δ1]

Về bản chất, ý tưởng chính là thế này: bootstrapping thực nghiệm ước tính một khoản tiền tương ứng với phần chênh lệch giữa ước lượng điểm và tham số thực tế, tức , và sử dụng sự khác biệt này để đưa ra các giới hạn CI thấp hơn và cao hơn.θ^θ

Các "phần trăm bootstrap" đề cập đến những điều sau đây: Sử dụng là khoảng tin cậy cho θ . Trong tình huống này, chúng tôi sử dụng bootstrapping để tính toán các ước tính của tham số quan tâm và lấy phần trăm của các ước tính này cho khoảng tin cậy.[θ^α/2,θ^1α/2]θ


2
Tôi chỉnh sửa cập nhật của bạn rất nhiều. Vui lòng kiểm tra xem chỉnh sửa của tôi có ý nghĩa. Các trích dẫn của bạn từ cuốn sách của Efron đã gây nhầm lẫn bởi vì những gì Efron mô tả không tương ứng với những gì ghi chú MIT của bạn gọi là "bootstrap theo kinh nghiệm". Vì vậy, tôi chỉ để lại mô tả về những gì MIT ghi chú. BTW, tôi đang bối rối về một điều trong mô tả của họ về "bootstrap thực nghiệm": trên đỉnh của trang 6 nó nói "Kể từ khi được tại 90 phần trăm ..." - Tôi không hiểu điều này . Rõ ràng từ ví dụ rằng phía bên trái của CI được đưa ra bằng cách trừ đi 90 phần trăm, tức là bạn δ 2 . δ.1δ2
amip nói rằng Phục hồi Monica

2
@amoeba chỉnh sửa của bạn là chính xác. Cảm ơn đã giúp đỡ trong suốt. Tôi nghĩ rằng có một số vấn đề với các ghi chú của MIT; mô tả của họ về những khó khăn với bootstraps phần trăm không rõ ràng và lập luận của họ chống lại họ chủ yếu là một kháng cáo lên chính quyền. Tôi không thể sao chép ví dụ số cuối cùng của họ so với bootstrap phần trăm. Đừng nghĩ rằng họ đã làm việc thông qua một số chi tiết cũng như chúng tôi có trong khi chúng tôi giải quyết câu hỏi hữu ích này, và do đó văn bản của họ có thể có một số thiếu sót, như bạn chỉ ra.
EdM

Nhìn vào ghi chú của MIT, tôi không thấy các tác giả có khoảng tin cậy như thế nào trong phần 9 "Phương pháp phân vị bootstrap (không nên sử dụng)" của [37.4, 42.4]. Có vẻ như mẫu họ đang sử dụng không giống với mẫu trong phần 6, mà họ đang thực hiện so sánh. Nếu chúng tôi lấy mẫu cho δ ∗ = x ∗ - x được báo cáo ở cuối trang 5 và thêm lại giá trị trung bình mẫu của 40.3 và lấy các TCTD, các giới hạn tôi nhận được là [38.9, 41.9] có cùng chiều rộng 3 là giới hạn họ báo cáo trong phần 6 của [38.7, 41.7].
Bối rối

Câu trả lời:


21

Có một số khó khăn phổ biến đối với tất cả các ước tính khởi động không theo tỷ lệ của khoảng tin cậy (CI), một số vấn đề liên quan đến cả "thực nghiệm" (được gọi là "cơ bản" trong boot.ci()chức năng của bootgói R và trong Tham khảo 1 ) và ước tính CI "phần trăm" (như được mô tả trong Tham khảo 2 ), và một số ước tính có thể bị làm trầm trọng hơn với các TCTD phần trăm.

TL; DR : Trong một số trường hợp, ước tính CI bootstrap phần trăm có thể hoạt động đầy đủ, nhưng nếu một số giả định nhất định không giữ thì CI phần trăm có thể là lựa chọn tồi tệ nhất, với bootstrap theo kinh nghiệm / cơ bản là điều tồi tệ nhất tiếp theo. Các ước tính CI bootstrap khác có thể đáng tin cậy hơn, với độ bao phủ tốt hơn. Tất cả có thể có vấn đề. Nhìn vào các sơ đồ chẩn đoán, như mọi khi, giúp tránh các lỗi tiềm ẩn phát sinh bằng cách chỉ chấp nhận đầu ra của một thói quen phần mềm.

Thiết lập Bootstrap

Nói chung theo thuật ngữ và lập luận của Ref. 1 , chúng tôi có một mẫu dữ liệu rút ra từ các biến ngẫu nhiên độc lập và phân phối hệt Y i chia sẻ một hàm phân phối tích lũy F . Chức năng phân phối thực nghiệm (EDF) được xây dựng từ các mẫu dữ liệu là F . Chúng tôi đang quan tâm đến một đặc trưng θ dân số, theo ước tính của một thống kê T có giá trị trong mẫu là t . Chúng tôi muốn biết như thế nào T ước tính θy1,...,ynYiFF^θTtTθ, ví dụ: phân phối của .(Tθ)

Sử dụng bootstrap phi tham lấy mẫu từ EDF F để lấy mẫu bắt chước từ F , lấy R mẫu mỗi kích thước n với thay thế từ y i . Các giá trị được tính toán từ các mẫu bootstrap được ký hiệu là "*". Ví dụ: thống kê T được tính trên mẫu bootstrap j cung cấp giá trị T j .F^FRnyiTTj

Các TCTD bootstrap theo kinh nghiệm / cơ bản so với tỷ lệ phần trăm

Các thực nghiệm / bootstrap cơ bản sử dụng sự phân bố của trong R mẫu bootstrap từ F để ước tính sự phân bố của ( T - θ ) trong quần thể được mô tả bởi F chính nó. Do đó, ước tính CI của nó dựa trên sự phân bố của ( T - t ) , trong đó t là giá trị của thống kê trong mẫu ban đầu.(Tt)RF^(Tθ)F(Tt)t

Cách tiếp cận này dựa trên nguyên tắc cơ bản của bootstrapping ( Tham khảo 3 ):

Dân số là mẫu như mẫu là với mẫu bootstrap.

Thay vào đó, bootstrap phần trăm sử dụng các lượng tử của các giá trị để xác định CI. Các ước tính có thể khá khác nhau nếu có lệch hay thiên vị trong việc phân phối của ( T - θ ) .Tj(Tθ)

Nói rằng có một sai lệch quan sát được sao cho: ˉ T = t + B ,B

T¯=t+B,

nơi là giá trị trung bình của T * j . Đối với concreteness, nói rằng thứ 5 và thứ 95 percentiles của T * j được thể hiện dưới dạng ˉ T * - δ 1ˉ T * + δ 2 , nơi ˉ T * là giá trị trung bình so với các mẫu bootstrap và δ 1 , δ 2 là mỗi tích cực và có khả năng khác nhau để cho phép xiên. Các ước tính dựa trên phân vị CI thứ 5 và 95 sẽ được đưa ra tương ứng bằng cách:T¯TjTjT¯δ1T¯+δ2T¯δ1,δ2

T¯δ1=t+Bδ1;T¯+δ2=t+B+δ2.

Các ước tính CI phần trăm thứ 5 và 95 theo phương pháp bootstrap theo kinh nghiệm / cơ bản sẽ tương ứng ( Tham khảo 1 , eq. 5.6, trang 194):

2t(T¯+δ2)=tBδ2;2t(T¯δ1)=tB+δ1.

(Tθ)

Hành vi này được minh họa độc đáo trên trang này , vì đã khởi động một thống kê sai lệch tiêu cực đến mức ước tính mẫu ban đầu nằm dưới 95% TCTD dựa trên phương pháp thực nghiệm / cơ bản (bao gồm trực tiếp điều chỉnh sai lệch phù hợp). 95% các TCTD dựa trên phương pháp phân vị, được sắp xếp xung quanh một trung tâm sai lệch gấp đôi, thực sự đều nằm dưới cả ước tính điểm sai lệch âm so với mẫu ban đầu!

Bootstrap phần trăm không bao giờ nên được sử dụng?

(Tt)

Tuy nhiên, cả hai cách tiếp cận đều không cung cấp độ chính xác trong phạm vi bảo hiểm có thể được cung cấp bởi các phương pháp bootstrap khác. Efron ngay từ đầu đã nhận ra những hạn chế tiềm năng của các TCTD phân vị nhưng cho biết: "Chủ yếu chúng tôi sẽ hài lòng khi để các mức độ thành công khác nhau của các ví dụ nói lên điều đó." ( Tham khảo 2 , trang 3)

Công việc tiếp theo, được tóm tắt ví dụ bởi DiCiccio và Efron ( Tham khảo 4 ), đã phát triển các phương pháp "cải thiện theo thứ tự độ lớn theo độ chính xác của các khoảng chuẩn" được cung cấp theo phương pháp thực nghiệm / cơ bản hoặc phân vị. Do đó, người ta có thể lập luận rằng không nên sử dụng các phương pháp thực nghiệm / cơ bản và phương pháp phân vị, nếu bạn quan tâm đến độ chính xác của các khoảng.

Trong các trường hợp cực đoan, ví dụ lấy mẫu trực tiếp từ phân phối lognatural mà không cần chuyển đổi, không có ước tính CI nào được khởi động có thể đáng tin cậy, như Frank Harrell đã lưu ý .

Điều gì giới hạn độ tin cậy của những điều này và các TCTD khởi động khác?

Một số vấn đề có thể có xu hướng làm cho các TCTD khởi động không đáng tin cậy. Một số áp dụng cho tất cả các phương pháp tiếp cận, một số khác có thể được giảm bớt bằng các phương pháp khác ngoài các phương pháp thực nghiệm / cơ bản hoặc phân vị.

F^FF^FU[0,θ]

F^F

Điều này có nghĩa là nếu tham số cơ bản thay đổi, hình dạng của phân phối chỉ được thay đổi bởi một hằng số và thang đo không nhất thiết phải thay đổi. Đây là một giả định mạnh mẽ!

FθF^t

Trong các vấn đề không theo tỷ lệ, tình hình phức tạp hơn. Bây giờ không chắc (nhưng không hoàn toàn không thể) rằng bất kỳ số lượng nào cũng có thể là chính xác.

(Tt)th(h(T)h(t))h(h(T)h(t))

boot.ci()BCaαn1n0.5Tj

Trong các trường hợp cực đoan, người ta có thể cần phải sử dụng bootstrapping trong các mẫu bootstrapping để điều chỉnh khoảng tin cậy đầy đủ. "Bootstrap đôi" này được mô tả trong Phần 5.6 của Tài liệu tham khảo. 1 , với các chương khác trong cuốn sách đó gợi ý các cách để giảm thiểu nhu cầu tính toán cực đoan của nó.


  1. Davison, AC và Hinkley, Phương pháp khởi động DV và ứng dụng của họ, Nhà xuất bản Đại học Cambridge, 1997 .

  2. Phương pháp Efron, B. Bootstrap: Một cái nhìn khác về jacknife, Ann. Thống kê. 7: 1-26, 1979 .

  3. Các mô hình hồi quy Fox, J. và Weisberg, S. Bootstrapping trong R. Phụ lục về An R đồng hành với hồi quy ứng dụng, Ấn bản thứ hai (Sage, 2011). Sửa đổi kể từ ngày 10 tháng 10 năm 2017 .

  4. DiCiccio, TJ và Efron, B. Khoảng tin cậy của Bootstrap. Thống kê Khoa học 11: 189-228, 1996 .

  5. Canty, AJ, Davison, AC, Hinkley, DV, và Ventura, V. Bootstrap chẩn đoán và biện pháp khắc phục. Có thể. J. Stat. 34: 5-27, 2006 .


1
Tôi thực sự không hiểu tại sao bạn nói rằng "bootstrap theo kinh nghiệm" sẽ "ít nhạy cảm hơn" với những sai lệch so với phân bố dân số. Không phải bootstrap phần trăm và "bootstrap theo kinh nghiệm" này sử dụng chính xác cùng một lượng tử của phân phối bootstrapping? Tôi nghĩ rằng sự khác biệt duy nhất là nếu phân phối bootstrap không đối xứng xung quanh trung bình mẫu thì khoảng thời gian từ hai cách tiếp cận này sẽ được lật. Giống như được mô tả ở đây: en.wikipedia.org/wiki/ (("cơ bản" so với "phần trăm").
amip nói rằng Phục hồi lại

1
@amoeba họ khác nhau về cách họ xử lý sai lệch trong ước tính bootstrap, không chỉ trong việc lật các khoảng. Câu trả lời này cần nhiều công việc hơn để phân tách các vấn đề về khởi động theo kinh nghiệm và tỷ lệ phần trăm khỏi các vấn đề liên quan đến đuôi phân phối, điều mà tôi đã hơi bối rối ở đây và tôi hy vọng sẽ làm rõ trong vài ngày nữa.
EdM

1
Tôi không nêu lên câu trả lời này vì dựa trên các tài liệu tham khảo được cung cấp và lý do (rất hợp lý) được trình bày: " không nên sử dụng bootstrap phần trăm " chỉ đơn giản là nói quá, không phải "một chút". Có, nếu chúng ta có thể, chúng ta nên sử dụng một số hình thức phương pháp bootstrap được điều chỉnh sai lệch nhưng không, sử dụng bootstrap phần trăm tốt hơn để có được ước tính CI không hiệu quả thay vì vô thức dính vào 2SE xung quanh ý nghĩa và nghĩ rằng chúng ta đã khám phá ra nước Mỹ. (Tôi phần lớn đồng ý với nội dung chính của câu trả lời, không phải là đoạn cuối cùng vì tôi cảm thấy nó để cánh cửa mở ra để giải thích sai.)
usεr11852 nói Phục hồi Monic

1
Về cơ bản được tổ chức lại và sửa chữa, một phần để đáp ứng với các ý kiến.
EdM

1
Uθ^Uθ^θ^Uθ^U=θ^(θ^Uθ^)=2θ^θ^Utθ^θ^UT¯δ2

8

Một số nhận xét về thuật ngữ khác nhau giữa cuốn sách của MIT / Rice và Efron

Tôi nghĩ rằng câu trả lời của EdM thực hiện công việc tuyệt vời khi trả lời câu hỏi gốc của OP, liên quan đến các ghi chú bài giảng của MIT. Tuy nhiên, OP cũng trích dẫn cuốn sách từ Suy luận thống kê thời đại máy tính của Efrom (2016) sử dụng các định nghĩa hơi khác nhau có thể dẫn đến nhầm lẫn.


Chương 11 - Ví dụ tương quan mẫu điểm học sinh

θ^=0.498B=2000θ^

nhập mô tả hình ảnh ở đây

Bootstrap khoảng thời gian tiêu chuẩn

Sau đó, anh ta định nghĩa bootstrap tiêu chuẩn sau :

θ^±1.96se^

se^seboot

Độ lệch chuẩn thực nghiệm của các giá trị bootstrap:

x=(x1,x2,...,xn)x=(x1,x2,...,xn)b

θ^b=s(xb)  for b=1,2,...,B

θ^

se^boot=[b=1B(θ^bθ^)2/(B1)]1/2
θ^=b=1Bθ^bB

Định nghĩa này có vẻ khác với định nghĩa được sử dụng trong câu trả lời của EdM:

(Tt)RF^(Tθ)F


Phần trăm bootstrap

Ở đây, cả hai định nghĩa có vẻ phù hợp. Từ trang Efron 186:

Bθ^1,θ^2,...,θ^B

Trong ví dụ này, chúng lần lượt là 0.118 và 0.758.

Trích dẫn EdM:

Tj


So sánh phương pháp tiêu chuẩn và phân vị theo định nghĩa của Efron

Dựa trên các định nghĩa của riêng mình, Efron đi đến chiều dài đáng kể để cho rằng phương pháp phân vị là một sự cải tiến. Trong ví dụ này, CI kết quả là:

nhập mô tả hình ảnh ở đây


Phần kết luận

Tôi cho rằng câu hỏi ban đầu của OP phù hợp với các định nghĩa do EdM cung cấp. Các chỉnh sửa được OP thực hiện để làm rõ các định nghĩa được căn chỉnh theo sách của Efron và không hoàn toàn giống nhau đối với CI bootstrap theo kinh nghiệm so với tiêu chuẩn.

Bình luận được chào đón


2
boot.ci()θ

Chỉ cần kiểm tra hướng dẫn cho boot.ci(): "Các khoảng thời gian bình thường cũng sử dụng hiệu chỉnh sai lệch bootstrap." Vì vậy, đó dường như là một sự khác biệt so với "bootstrap khoảng thời gian tiêu chuẩn" được mô tả bởi Efron.
EdM

Đủ công bằng - các khoảng thời gian bình thường được mô tả trong cuốn sách là trường hợp cơ bản mà anh ta xây dựng để tiếp cận chính xác và tốt hơn (tất cả các cách để BC và BCa) nên có nghĩa là nó không được thực hiện
Xavier Bourret Sicotte

@EdM và Xavier: Liệu suy luận thống kê thời đại máy tính có mô tả các TCTD "thực nghiệm / cơ bản" không? Nếu vậy, làm thế nào để cuốn sách gọi họ? Nếu không, nó có lạ không?
amip nói rằng Phục hồi Monica

1
@amoeba không phải là tôi có thể nhìn thấy từ cái nhìn đầu tiên. Cuốn sách có sẵn dưới dạng pdf để sử dụng cá nhân. Khi tôi tranh luận trong câu trả lời của mình và như đã lưu ý trong cuốn sách, có những lựa chọn tốt hơn so với các TCTD "theo kinh nghiệm / cơ bản" và "tỷ lệ phần trăm" đối với phạm vi bảo hiểm, vì vậy tôi có thể thấy tại sao người ta có thể bỏ qua: không thiên vị và với CI đối xứng, không có nhiều sự khác biệt giữa chúng. Tôi chắc chắn không thể lỗi nhà phát minh bootstrap vì đã nhấn mạnh phương pháp CI ban đầu của mình, vì nó dẫn trực tiếp đến BC và BCa hơn là "thực nghiệm / cơ bản.".
EdM

5

Tôi đang làm theo hướng dẫn của bạn: "Tìm kiếm một câu trả lời rút ra từ các nguồn đáng tin cậy và / hoặc chính thức."

Bootstrap được phát minh bởi Brad Efron. Tôi nghĩ thật công bằng khi nói rằng anh ấy là một nhà thống kê nổi tiếng. Có một thực tế là ông là giáo sư tại Stanford. Tôi nghĩ rằng điều đó làm cho ý kiến ​​của ông đáng tin cậy và chính thức.

Tôi tin rằng Suy luận thống kê thời đại máy tính của Efron và Hastie là cuốn sách mới nhất của ông và do đó sẽ phản ánh quan điểm hiện tại của ông. Từ P. 204 (11.7, ghi chú và chi tiết),

Khoảng tin cậy của Bootstrap không chính xác cũng không tối ưu, nhưng thay vào đó, mục tiêu là khả năng ứng dụng rộng rãi kết hợp với độ chính xác gần như chính xác.

Nếu bạn đọc Chương 11, "Khoảng tin cậy của Bootstrap", anh ta đưa ra 4 phương pháp tạo khoảng tin cậy của bootstrap. Phương pháp thứ hai trong số các phương pháp này là (11.2) Phương pháp phần trăm. Phương pháp thứ ba và thứ tư là các biến thể của phương pháp phân vị cố gắng sửa cho những gì Efron và Hastie mô tả là sai lệch trong khoảng tin cậy và theo đó họ đưa ra lời giải thích lý thuyết.

Bên cạnh đó, tôi không thể quyết định liệu có bất kỳ sự khác biệt nào giữa những gì người MIT gọi là CI bootstrap theo kinh nghiệm và CI phân vị không. Tôi có thể bị xì hơi não, nhưng tôi thấy phương pháp thực nghiệm là phương pháp phân vị sau khi trừ đi một lượng cố định. Điều đó sẽ không thay đổi gì cả. Tôi có thể đọc sai, nhưng tôi thực sự biết ơn nếu ai đó có thể giải thích cách tôi hiểu sai văn bản của họ.

Bất kể, cơ quan hàng đầu dường như không có vấn đề gì với CI của phần trăm. Tôi cũng nghĩ rằng bình luận của anh ấy trả lời những lời chỉ trích về bootstrap CI được một số người nhắc đến.

THÊM VÀO

[x¯δ.1,x¯δ.9][x¯δ.9,x¯δ.1]
δ=x¯μx¯μμx¯. Chỉ cần hợp lý. Hơn nữa, delta cho tập thứ hai là bootstrap phần trăm bị ô uế!. Efron sử dụng phân vị và tôi nghĩ rằng việc phân phối các phương tiện thực tế nên là cơ bản nhất. Tôi sẽ nói thêm rằng ngoài Efron và Hastie và bài báo Efron năm 1979 được đề cập trong một câu trả lời khác, Efron đã viết một cuốn sách về bootstrap vào năm 1982. Trong cả 3 nguồn đều có đề cập đến bootstrap phần trăm, nhưng tôi không thấy đề cập đến điều gì người MIT gọi bootstrap theo kinh nghiệm. Ngoài ra, tôi khá chắc chắn rằng họ tính toán phần trăm bootstrap không chính xác. Dưới đây là một cuốn sổ tay R tôi đã viết.

Các cam kết về tham chiếu MIT Trước tiên, hãy lấy dữ liệu MIT vào R. Tôi đã thực hiện một thao tác cắt và dán đơn giản các mẫu bootstrap của họ và lưu nó vào boot.txt.

Ẩn orig.boot = c (30, 37, 36, 43, 42, 43, 43, 46, 41, 42) boot = read.table (file = "boot.txt") có nghĩa là = as.numeric (lapply (boot , mean)) # lapply tạo danh sách, không phải vectơ. Tôi sử dụng nó LUÔN cho khung dữ liệu. mu = mean (orig.boot) del = sort (mean - mu) # sự khác biệt mu có nghĩa là del Và hơn nữa

Ẩn mu - sort (del) [3] mu - sort (del) [18] Vì vậy, chúng tôi nhận được cùng một câu trả lời họ làm. Đặc biệt tôi có cùng phân vị thứ 10 và 90. Tôi muốn chỉ ra rằng phạm vi từ phân vị thứ 10 đến phân vị thứ 90 là 3. Điều này giống như MIT đã làm.

Phương tiện của tôi là gì?

Ẩn có nghĩa là sắp xếp (có nghĩa) Tôi đang nhận được các phương tiện khác nhau. Điểm quan trọng - lần thứ 10 và 90 của tôi có nghĩa là 38,9 và 41,9. Đây là những gì tôi mong đợi. Chúng khác nhau bởi vì tôi đang xem xét khoảng cách từ 40.3, vì vậy tôi đang đảo ngược thứ tự trừ. Lưu ý rằng 40.3-38.9 = 1.4 (và 40.3 - 1.6 = 38.7). Vì vậy, những gì họ gọi là bootstrap phần trăm cung cấp một phân phối phụ thuộc vào phương tiện thực tế chúng ta nhận được chứ không phải sự khác biệt.

Điểm then chốt Bootstrap theo kinh nghiệm và bootstrap phần trăm sẽ khác nhau ở chỗ cái mà họ gọi là bootstrap theo kinh nghiệm sẽ là khoảng [x ∗ ¯ .1, x ∗ ¯ − .9] [x ∗ ¯ − .1, x ∗ ¯ .9] trong khi bootstrap phần trăm sẽ có khoảng tin cậy [x ∗ .9, x ∗ ¯ .1] [x ∗ ¯ − .9, x ∗ ¯ − .1 ]. Thông thường họ không nên khác nhau. Tôi có suy nghĩ của mình về việc tôi muốn, nhưng tôi không phải là nguồn chính xác mà OP yêu cầu. Thử nghiệm suy nghĩ- nên hai hội tụ nếu kích thước mẫu tăng. Lưu ý rằng có 210210 mẫu có thể có kích thước 10. Chúng ta sẽ không biến mất, nhưng nếu chúng ta lấy 2000 mẫu - một kích thước thường được coi là đủ.

Ẩn set.seed (1234) # sao chép boot.2k = matrix (NA, 10,2000) cho (i trong c (1: 2000)) {boot.2k [, i] = sample (orig.boot, 10, thay thế = T)} mu2k = sort (áp dụng (boot.2k, 2, trung bình)) Hãy xem mu2k

Ẩn tóm tắt (mu2k) có nghĩa là (mu2k) -mu2k [200] có nghĩa là (mu2k) - mu2k [1801] Và các giá trị thực tế-

Ẩn mu2k [200] mu2k [1801] Vì vậy, bây giờ cái mà MIT gọi là bootstrap theo kinh nghiệm cho khoảng tin cậy 80% là [, 40.3 -1.87,40.3 +1.64] hoặc [38.43,41.94] và phân phối phần trăm xấu của chúng mang lại [38,5, 42]. Điều này tất nhiên có ý nghĩa bởi vì luật của số lượng lớn sẽ nói trong trường hợp này rằng phân phối nên hội tụ thành một phân phối bình thường. Ngẫu nhiên, điều này được thảo luận trong Efron và Hastie. Phương pháp đầu tiên họ đưa ra để tính khoảng thời gian bootstrap là sử dụng mu = / - 1,96 sd. Như họ chỉ ra, đối với cỡ mẫu đủ lớn, nó sẽ hoạt động. Sau đó, họ đưa ra một ví dụ mà n = 2000 không đủ lớn để có được sự phân phối dữ liệu xấp xỉ bình thường.

Kết luận Trước tiên, tôi muốn nêu nguyên tắc tôi sử dụng để quyết định các câu hỏi về cách đặt tên. Đây là bữa tiệc của tôi Tôi có thể khóc nếu tôi muốn. Trong khi ban đầu được Petula Clark phát âm, tôi nghĩ nó cũng áp dụng các cấu trúc đặt tên. Vì vậy, với sự tôn trọng chân thành với MIT, tôi nghĩ rằng Bradley Efron xứng đáng đặt tên cho các phương pháp bootstrapping khác nhau theo ý muốn. Anh ấy làm nghề gì ? Tôi không thể tìm thấy đề cập nào trong Efron của 'bootstrap theo kinh nghiệm', chỉ là phần trăm. Vì vậy, tôi sẽ không đồng ý với Rice, MIT, et al. Tôi cũng sẽ chỉ ra rằng theo luật số lượng lớn, như được sử dụng trong bài giảng MIT, theo kinh nghiệm và tỷ lệ phần trăm sẽ hội tụ đến cùng một số. Theo sở thích của tôi, bootstrap phần trăm là trực quan, hợp lý và những gì người phát minh ra bootstrap có trong tâm trí. Tôi sẽ nói thêm rằng tôi đã dành thời gian để làm điều này chỉ vì sự chỉnh sửa của riêng tôi chứ không phải bất cứ điều gì khác. Đặc biệt, Tôi đã không viết Efron, đó có lẽ là điều OP nên làm. Tôi sẵn sàng nhất để đứng chính xác.


3
"Tôi nghĩ thật công bằng khi nói rằng anh ấy là một nhà thống kê nổi tiếng." - Vâng, tôi sẽ nói rằng đó là công bằng!
Xavier Bourret Sicotte

Tôi nghĩ cái mà OP gọi là "boostrap theo kinh nghiệm" là cái mà Wikipedia gọi là "bootstrap cơ bản" ở đây en.wikipedia.org/wiki/ . Nó sử dụng cùng một phần trăm như "bootstrap phần trăm", bạn đúng, nhưng loại bỏ chúng xung quanh. Do Efron và Hastie đưa điều này vào 4 phương pháp của họ? Làm thế nào để họ gọi nó?
amip nói phục hồi Monica

Tôi đã cố gắng làm rõ điều này trong câu hỏi dựa trên những gì tôi đọc được trong các ghi chú của MIT. Hãy cho tôi biết nếu có bất cứ điều gì không rõ ràng (hoặc nếu bạn có thời gian để tự kiểm tra các ghi chú, hãy kiểm tra bài viết của tôi cho chính xác).
Clarinetist

@Xavier người ta có thể đưa ra một trường hợp rằng tuyên bố Efron của tôi bị gạch chân.
aginensky

1
[x¯δ.1,x¯δ.9]x¯
EdM

2

Như đã lưu ý trong các câu trả lời trước đó, "bootstrap theo kinh nghiệm" được gọi là "bootstrap cơ bản" trong các nguồn khác (bao gồm cả hàm R boot.ci ), giống hệt với "bootstrap phần trăm" được lật theo ước tính điểm. Venables và Ripley viết ("Statstics hiện đại với S", tái bản lần thứ 4, Springer, 2002, trang 136):

Trong các bài toán không đối xứng, các khoảng cơ bản và phần trăm sẽ khác nhau đáng kể và các khoảng cơ bản có vẻ hợp lý hơn.

n

f(x)=3x2 Xác suất bảo hiểm của khoảng thời gian bootstrap khác nhau cho giá trị trung bình của phân phối không đối xứng±t1α/2s2/n)±z1α/2s2/n)

λXác suất bảo hiểm cho các khoảng thời gian bootstrap khác nhau cho công cụ ước tính ML±z1α/2±z1α/2

Trong cả hai trường hợp sử dụng, bootstrap BCa có xác suất bao phủ cao nhất trong số các phương thức bootstrap và bootstrap phần trăm có xác suất bao phủ cao hơn bootstrap cơ bản / theo kinh nghiệm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.