Các ví dụ trong đó một bootstrap ngây thơ của người thất bại là gì?


86

Giả sử tôi có một tập hợp dữ liệu mẫu từ một phân phối không xác định hoặc phức tạp và tôi muốn thực hiện một số suy luận về thống kê của dữ liệu. Khuynh hướng mặc định của tôi là chỉ cần tạo ra một loạt các mẫu bootstrap với thay thế, và tính toán số liệu thống kê của tôi trên mỗi mẫu bootstrap để tạo ra một phân phối ước tính cho .TTT

Các ví dụ mà đây là một ý tưởng tồi là gì?

Ví dụ, một trường hợp khi thực hiện bootstrap một cách ngây thơ này sẽ thất bại là nếu tôi đang cố gắng sử dụng bootstrap trên dữ liệu chuỗi thời gian (giả sử, để kiểm tra xem tôi có tự động tương quan đáng kể hay không). Bootstrap ngây thơ được mô tả ở trên (tạo ra datapoint thứ của loạt mẫu bootstrap thứ n bằng cách lấy mẫu thay thế từ loạt gốc của tôi) sẽ (tôi nghĩ) sẽ không được khuyến khích, vì nó bỏ qua cấu trúc trong chuỗi thời gian ban đầu của tôi, và vì vậy chúng tôi có được các kỹ thuật bootstrap fancier như khối bootstrap.i

Nói cách khác, bootstrap có gì ngoài "lấy mẫu bằng thay thế"?


Nếu bạn muốn suy luận về giá trị trung bình của dữ liệu iid, bootstrap là một công cụ tuyệt vời. Mọi thứ khác đều có thể nghi ngờ và đòi hỏi bằng chứng từng trường hợp về sự hội tụ yếu.
StasK

Câu trả lời:


67

Nếu số lượng quan tâm, thường là chức năng của một phân phối, thì khá hợp lý và dữ liệu của bạn là iid, bạn thường ở trong lãnh thổ khá an toàn. Tất nhiên, có những trường hợp khác khi bootstrap cũng hoạt động.

Ý nghĩa của việc bootstrap là "fail"

Nói rộng hơn, mục đích của bootstrap là xây dựng một phân phối lấy mẫu gần đúng cho thống kê quan tâm. Đây không phải là ước tính thực tế của tham số. Vì vậy, nếu thống kê về lợi ích (theo một số thay đổi và định tâm) là và trong phân phối, chúng tôi muốn phân phối bootstrap của chúng tôi hội tụ để phân phối . Nếu chúng ta không có điều này, thì chúng ta không thể tin vào những suy luận được đưa ra.X^nX^nXX

Các kinh điển ví dụ khi bootstrap có thể thất bại, thậm chí trong một khuôn khổ iid được khi cố gắng xấp xỉ phân phối lấy mẫu của một số liệu thống kê để khắc nghiệt. Dưới đây là một cuộc thảo luận ngắn gọn.

Thống kê đơn hàng tối đa của một mẫu ngẫu nhiên từ phân phốiU[0,θ]

Đặt là một chuỗi các biến ngẫu nhiên thống nhất iid trên . Đặt . Phân phối của là (Lưu ý rằng bằng một đối số rất đơn giản, điều này thực sự cũng cho thấy xác suất và thậm chí, gần như chắc chắn , nếu tất cả các biến ngẫu nhiên được xác định trên cùng một không gian.)X1,X2,[0,θ]X(n)=max1knXkX(n)

P(X(n)x)=(x/θ)n.
X(n)θ

Một phép tính cơ bản mang lại hay nói cách khác, hội tụ trong phân phối đến một biến ngẫu nhiên theo cấp số nhân với trung bình .

P(n(θX(n))x)=1(1xθn)n1ex/θ,
n(θX(n))θ

Bây giờ, chúng tôi tạo một ước tính bootstrap (ngây thơ) về phân phối của bằng cách lấy lại mẫu bằng thay thế để lấy và sử dụng phân phối của điều kiện trên .n(θX(n))X1,,XnX1,,Xnn(X(n)X(n))X1,,Xn

Nhưng, hãy quan sát rằng với xác suất , và do đó, phân phối bootstrap có khối lượng điểm bằng 0 ngay cả khi không có triệu chứng thực tế là phân phối giới hạn thực tế là liên tục.X(n)=X(n)1(11/n)n1e1

Rõ ràng hơn, mặc dù phân phối giới hạn thực là theo cấp số nhân với trung bình , phân phối bootstrap giới hạn đặt khối lượng điểm ở 0 có kích thước độc lập với giá trị thực của . Bằng cách lấy đủ lớn, chúng ta có thể làm cho xác suất phân phối giới hạn thực sự nhỏ tùy ý cho bất kỳ khoảng cố định nào , nhưng bootstrap sẽ ( vẫn !) Báo cáo rằng có ít nhất xác suất 0,632 trong khoảng này! Từ đó, rõ ràng bootstrap có thể hành xử tùy tiện trong cài đặt này.θ1e10.632 θθ[0,ε)

Tóm lại, bootstrap thất bại (thảm hại) trong trường hợp này. Mọi thứ có xu hướng sai khi xử lý các tham số ở cạnh của không gian tham số.

Một ví dụ từ một mẫu các biến ngẫu nhiên bình thường

Có những ví dụ tương tự khác về sự thất bại của bootstrap trong những trường hợp đơn giản đáng ngạc nhiên.

Hãy xem xét một mẫu từ trong đó không gian tham số cho bị giới hạn ở . MLE trong trường hợp này là . Một lần nữa, chúng tôi sử dụng ước tính bootstrap . Một lần nữa, có thể thấy rằng phân phối của (có điều kiện trên mẫu được quan sát) không hội tụ đến phân phối giới hạn giống như .X1,X2,N(μ,1)μ[0,)X^n=max(X¯,0)X^n=max(X¯,0)n(X^nX^n)n(X^nμ)

Mảng trao đổi

Có lẽ một trong những ví dụ ấn tượng nhất là cho một mảng có thể trao đổi. Đặt là một mảng các biến ngẫu nhiên sao cho mỗi cặp ma trận hoán vị và , các mảng và có cùng phân phối chung. Nghĩa là, hoán vị các hàng và cột của giữ cho bất biến phân phối. (Bạn có thể nghĩ về một mô hình hiệu ứng ngẫu nhiên hai chiều với một quan sát trên mỗi ô làm ví dụ, mặc dù mô hình này tổng quát hơn nhiều.)Y=(Yij)PQYPYQY

Giả sử chúng tôi muốn ước tính khoảng tin cậy cho giá trị trung bình (do giả định khả năng trao đổi được mô tả ở trên phương tiện của tất cả các tế bào phải giống nhau).μ=E(Yij)=E(Y11)

McCullagh (2000) đã xem xét hai cách tự nhiên khác nhau (tức là ngây thơ) để khởi động một mảng như vậy. Không ai trong số họ nhận được phương sai tiệm cận cho mẫu có nghĩa là chính xác. Ông cũng xem xét một số ví dụ về mảng trao đổi một chiều và hồi quy tuyến tính.

Người giới thiệu

Thật không may, vấn đề này là không cần thiết, vì vậy không ai trong số này đặc biệt dễ đọc.

P. Bickel và D. Freedman, Một số lý thuyết tiệm cận cho bootstrap . Ann. Thống kê , tập 9, không 6 (1981), 1196 Từ1217.

DWK Andrew, Sự không nhất quán của bootstrap khi một tham số nằm trên ranh giới của không gian tham số , Kinh tế lượng , tập. 68, không 2 (2000), 399 Hàng405.

P. McCullagh, Lấy mẫu lại và mảng có thể trao đổi , Bernoulli , vol. 6, không 2 (2000), 285 Điện thoại.

EL Lehmann và JP Romano, Thử nghiệm các giả thuyết thống kê , thứ 3. chủ biên, Springer (2005). [Chương 15: Phương pháp mẫu lớn chung]


Hành vi của bootstrap thống kê đơn hàng có vẻ hợp lý với tôi, vì phân phối theo cấp số nhân có "khối lượng điểm" tương tự ở mức 0 - Chế độ phân phối theo cấp số nhân là 0, vì vậy có vẻ hợp lý rằng xác suất nên khác không tại giá trị rất có thể! Bootstrap có lẽ sẽ giống như một bản phân phối hình học, là một dạng tương tự rời rạc của hàm mũ. Tôi sẽ không coi đây là một "thất bại" của bootstrap ở đây - vì số lượng ước tính của luôn nằm trong khoảng thích hợpθθX(n)
xác suất

1
@cardinal - phân phối tiệm cận không phải là điểm chuẩn thích hợp - trừ khi bạn có một mẫu vô hạn. Phân phối bootstrap nên được so sánh với phân phối mẫu hữu hạn mà nó được thiết kế để gần đúng. Những gì bạn muốn hiển thị là khi số lần lặp bootstrap chuyển sang vô cùng, phân phối bootstrap hội tụ đến phân phối lấy mẫu hữu hạn . let là một giải pháp gần đúng không phải là một giải pháp chính xác. n
xác suất

5
@cardinal +1, tôi đã đưa ra câu hỏi trước đó, nhưng tôi chỉ muốn cảm ơn vì câu trả lời, ví dụ và liên kết rất tốt đến các bài viết.
mpiktas

@probabilityislogic, tất nhiên trong ứng dụng chung của lý thuyết tiệm cận phụ thuộc vào tốc độ hội tụ, nếu nó chậm, thì nó không được áp dụng. Nhưng sau đó bạn phải chứng minh rằng tốc độ chậm, vì tôi nghi ngờ rằng ví dụ với phân phối đồng đều lấy cỡ mẫu 100, bạn sẽ gặp phải các vấn đề @cardinal đã nêu.
mpiktas

3
@probabilityislogic, lúc đầu, tôi chỉ thấy cái sau của hai bình luận gần đây nhất của bạn. Để giải quyết câu hỏi trước, bạn có thể thấy hai câu đầu tiên của phần trên với tiêu đề "Ý nghĩa của việc bootstrap là 'fail'", trong đó điều này được giải quyết rõ ràng. Bootstrap không phải là về ước tính tham số. Chúng tôi giả sử rằng chúng tôi có một cách tốt để ước tính tham số mong muốn (trong trường hợp này, hoạt động tốt). Bootstrap là về việc biết một cái gì đó về phân phối tham số để chúng ta có thể suy luận. Ở đây, bootstrap bị phân phối ( rất! ) Sai. X(n)
Đức hồng y

8

Cuốn sách sau đây có một chương (máy chơi game) dành cho "Khi Bootstrapping thất bại cùng với các biện pháp khắc phục lỗi":

MR Chernick, phương pháp Bootstrap: Hướng dẫn cho các học viên và nhà nghiên cứu , tái bản lần 2. Hoboken NJ: Wiley-Interscience, 2008.

Các chủ đề là:

  1. Quá nhỏ của cỡ mẫu
  2. Phân phối với khoảnh khắc vô hạn
  3. Ước tính giá trị cực đoan
  4. Khảo sát lấy mẫu
  5. Trình tự dữ liệu mà Are M -Dependent
  6. Quá trình tự động không ổn định
  7. Phụ thuộc tầm xa

1
Bạn đã thấy bình luận này cho một câu trả lời trong chủ đề này? Ngẫu nhiên, bình luận đó liên kết đến một trang Amazon cho cuốn sách của Chernick; các độc giả đánh giá là khai sáng.
whuber

@whuber Vâng, tôi không nhận thấy bình luận đó. Tôi có nên loại bỏ câu trả lời của mình?
Sadeghd

1
Bởi vì câu trả lời của bạn chi tiết hơn tham chiếu trong bình luận, nó có khả năng có giá trị: nhưng phù hợp với các chính sách và mục tiêu của SE, thật tuyệt khi thấy nó được khuếch đại với một số giải thích về lý do tại sao bạn giới thiệu cuốn sách này hoặc - thậm chí tốt hơn - để bao gồm một bản tóm tắt các thông tin trong đó. Nếu không, nó thêm ít và nên được xóa hoặc chuyển đổi thành một nhận xét cho câu hỏi.
whuber

1

Bootstrap ngây thơ phụ thuộc vào kích thước mẫu là lớn, do đó CDF theo kinh nghiệm cho dữ liệu là một xấp xỉ tốt với CDF "thật". Điều này đảm bảo rằng việc lấy mẫu từ CDF theo kinh nghiệm rất giống với lấy mẫu từ CDF "thật". Trường hợp cực đoan là khi bạn chỉ lấy mẫu một điểm dữ liệu - bootstrapping không đạt được gì ở đây. Nó sẽ ngày càng trở nên vô dụng khi nó tiếp cận trường hợp thoái hóa này.

Bootstrapping ngây thơ sẽ không nhất thiết thất bại trong phân tích chuỗi lần (mặc dù nó có thể không hiệu quả) - nếu bạn mô hình chuỗi sử dụng các hàm cơ bản của thời gian liên tục (như đa thức huyền thoại) cho một thành phần xu hướng, và các hàm sin và cos của thời gian liên tục theo chu kỳ các thành phần (cộng với thuật ngữ lỗi tiếng ồn thông thường). Sau đó, bạn chỉ cần đưa vào bất cứ lúc nào bạn tình cờ đã lấy mẫu vào hàm khả năng. Không có thảm họa cho bootstrapping ở đây.

Bất kỳ mô hình tương quan tự động hoặc ARIMA nào cũng có biểu diễn ở định dạng này ở trên - mô hình này chỉ dễ sử dụng hơn và tôi nghĩ để hiểu và giải thích (dễ hiểu các chu kỳ trong các hàm sin và cosine, khó hiểu các hệ số của mô hình ARIMA). Ví dụ, hàm tương quan tự động là biến đổi Fourier ngược của phổ công suất của chuỗi thời gian.


@probabilityislogic -1, tôi đã vô tình đưa ra câu trả lời trước đó (đổ lỗi cho Opera mini) vì vậy tôi phải chỉnh sửa nó để có thể downvote, tôi xin lỗi vì đã sử dụng chiến thuật như vậy. Tôi đã làm điều này chỉ bởi vì tôi không thích câu trả lời lúc đầu, nhưng không đánh giá thấp vì tôi muốn chuẩn bị các lập luận của mình, mà tôi sẽ đưa ra trong nhận xét sau đây.
mpiktas

1
@probabilityislogic, đối với các quy trình chuỗi thời gian, thời gian đóng vai trò quan trọng, do đó phân phối vectơ khác với . Việc lấy mẫu lại như được thực hiện trong bootstrap ngây thơ phá hủy cấu trúc này, vì vậy, ví dụ nếu bạn cố gắng điều chỉnh mô hình AR (1), sau khi lấy mẫu lại, bạn có thể nhận thấy rằng bạn đang cố gắng khớp như , đó là không có vẻ tự nhiên. Nếu bạn google cho "chuỗi thời gian bootstrapping" , bài viết thứ hai sẽ đưa ra ví dụ về cách ước tính phương sai của chuỗi thời gian có ...(Xt,Xt+1)(Xt+1,Xt)Y10ρY15
mpiktas

2
@probabilityislogic, bạn có thể chứng minh ý tưởng của mình trong câu trả lời cho ước tính bootstrap ngây thơ của trong mô hình AR (1) không? Tôi không nghĩ rằng nó có thể, do đó là lý do cơ bản cho downvote. Tôi sẽ rất vui khi được chứng minh là sai. ρYt=ρYt1+ut
mpiktas

1
@probabilityislogic, và? Điều gì sẽ là ước tính của trong trường hợp đó? Tôi xin lỗi vì đã làm phiền, nhưng tôi thực sự không thấy làm thế nào bạn có thể cho thấy bootstrap ngây thơ sẽ không thất bại trong trường hợp này. rho
mpiktas

4
Cuốn sách của tôi ở đây có một chương về khi bootstrap thất bại và cũng là một chương về cách bootstrap được áp dụng trong chuỗi thời gian. Đối với chuỗi thời gian, bootstrap có thể được áp dụng cho phần dư từ một mô hình theo cách tiếp cận dựa trên mô hình. Cách tiếp cận miền thời gian không tham số khác là khối bootstrap trong đó có nhiều loại.
Michael Chernick
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.