Ý nghĩa của khoảng tin cậy được lấy từ các mẫu thử bootstrapping là gì?


38

Tôi đã xem xét rất nhiều câu hỏi trên trang web này về khoảng thời gian khởi động và độ tin cậy, nhưng tôi vẫn bối rối. Một phần lý do cho sự nhầm lẫn của tôi có lẽ là tôi không đủ nâng cao về kiến ​​thức thống kê để hiểu rất nhiều câu trả lời. Tôi mới đi được nửa chặng đường trong một khóa học thống kê giới thiệu và trình độ toán của tôi chỉ ở giữa Đại số II, vì vậy, bất cứ điều gì vượt qua mức đó chỉ khiến tôi bối rối. Nếu một trong những người có kiến ​​thức trên trang web này có thể giải thích vấn đề này ở cấp độ của tôi thì nó sẽ vô cùng hữu ích.

Chúng tôi đã học trong lớp cách lấy các mẫu tương tự bằng phương pháp bootstrap và sử dụng chúng để xây dựng khoảng tin cậy cho một số thống kê mà chúng tôi muốn đo. Vì vậy, ví dụ, giả sử chúng tôi lấy một mẫu từ một dân số lớn và thấy rằng 40% nói rằng họ sẽ bỏ phiếu cho Ứng cử viên A. Chúng tôi cho rằng mẫu này là một phản ánh khá chính xác về dân số ban đầu, trong trường hợp đó chúng tôi có thể lấy mẫu từ nó để khám phá một cái gì đó về dân số. Vì vậy, chúng tôi lấy các mẫu và tìm (sử dụng mức tin cậy 95%) rằng khoảng tin cậy kết quả nằm trong khoảng từ 35% đến 45%.

Câu hỏi của tôi là, khoảng tin cậy này thực sự có nghĩa là gì?

Tôi tiếp tục đọc rằng có một sự khác biệt giữa Khoảng tin cậy (Thường xuyên) và Khoảng tin cậy (Bayesian). Nếu tôi hiểu chính xác, một khoảng tin cậy sẽ nói rằng có 95% khả năng trong tình huống của chúng tôi , tham số thực nằm trong khoảng cho trước (35% -45%), trong khi khoảng tin cậy sẽ nói rằng có 95% trong khoảng này loại tình huống (nhưng không nhất thiết trong tình huống của chúng tôi cụ thể) phương pháp chúng tôi đang sử dụng sẽ báo cáo chính xác rằng tham số thực nằm trong khoảng đã cho.

Giả sử định nghĩa này là chính xác, câu hỏi của tôi là: "Thông số thực" mà chúng ta đang nói đến khi sử dụng khoảng tin cậy được xây dựng bằng phương pháp bootstrap là gì? Chúng ta đang đề cập đến (a) tham số thực sự của dân số ban đầu , hay (b) tham số thực sự của mẫu ? Nếu (a), thì chúng ta sẽ nói rằng 95% thời gian phương thức bootstrap sẽ báo cáo chính xác các tuyên bố đúng về dân số ban đầu. Nhưng làm thế nào chúng ta có thể biết điều đó? Không phải toàn bộ phương thức bootstrap dựa trên giả địnhrằng mẫu ban đầu là một phản ánh chính xác của dân số được lấy từ đâu? Nếu (b) thì tôi không hiểu ý nghĩa của khoảng tin cậy. Chúng ta đã không biết thông số thực sự của mẫu? Đó là một phép đo đơn giản!

Tôi đã thảo luận điều này với giáo viên của tôi và cô ấy khá hữu ích. Nhưng tôi vẫn bối rối.

Câu trả lời:


28

Nếu quy trình bootstrapping và hình thành khoảng tin cậy được thực hiện chính xác, điều đó có nghĩa giống như bất kỳ khoảng tin cậy nào khác. Từ quan điểm thường xuyên, 95% CI ngụ ý rằng nếu toàn bộ nghiên cứu được lặp lại quảng cáo giống hệt nhau , 95% khoảng tin cậy như vậy được hình thành theo cách này sẽ bao gồm giá trị thực. Tất nhiên, trong nghiên cứu của bạn, hoặc trong bất kỳ nghiên cứu riêng lẻ nào, khoảng tin cậy sẽ bao gồm giá trị thực hoặc không, nhưng bạn sẽ không biết cái nào. Để hiểu rõ hơn về những ý tưởng này, nó có thể giúp bạn đọc câu trả lời của tôi ở đây: Tại sao Khoảng tin cậy (CI) 95% không ngụ ý 95% cơ hội chứa giá trị trung bình?

x¯μ. Để trình bày nhanh về toán học, hãy xem xét mô phỏng sau bằng cách sử dụng R:

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952

Những giả định cụ thể nào chúng ta đang dựa vào?
iarwain

2
Cảm ơn. Tôi nghĩ rằng tôi đã tìm thấy những gì tôi đang tìm kiếm trong câu trả lời thứ hai cho chủ đề đó: "Hãy nhớ rằng chúng tôi không sử dụng phương tiện của các mẫu bootstrap để ước tính dân số có nghĩa là gì, chúng tôi sử dụng mẫu có nghĩa cho điều đó (hoặc bất cứ thống kê quan tâm nào là). Nhưng chúng tôi đang sử dụng các mẫu bootstrap để ước tính các thuộc tính (mức độ lan truyền, độ lệch) của quy trình lấy mẫu. Và sử dụng lấy mẫu từ một dân số biết (mà chúng tôi hy vọng là đại diện cho dân số quan tâm) để tìm hiểu các tác động của việc lấy mẫu có ý nghĩa và ít thông tư hơn nhiều. " ...
iarwain

1
... Nói cách khác, tất cả các CI đang nói với chúng tôi là trong một quần thể gần giống với chúng ta, chúng ta sẽ mong đợi 95% mẫu được lấy từ dân số đó phản ánh giá trị thực +/- biên sai số. Vì vậy, tất cả những gì chúng tôi đang làm là đưa ra một đầu mối rất thô sơ - mặc dù có lẽ là đầu mối tốt nhất mà chúng tôi có - để biết mức độ thống kê mẫu của chúng tôi có thể gần với tham số dân số thực sự. Nếu vậy, có vẻ như chúng ta không nên quá coi trọng các con số chính xác trong CI - chúng chỉ có ý nghĩa như thế này, "thống kê mẫu có lẽ gần như chính xác với mức độ này." Tôi đã hiểu đúng chưa?
iarwain

1
Điều đó về cơ bản là chính xác. Một CI cho chúng tôi cảm nhận về độ chính xác của ước tính của chúng tôi, nhưng chúng tôi không bao giờ biết liệu CI thực tế (đã nhận ra) của chúng tôi có chứa giá trị thực hay không. Giả định chính là dữ liệu của chúng tôi là đại diện cho dân số quan tâm. Lưu ý rằng cả hai điều này đều không đặc biệt đối với các TCTD khởi động , bạn có cùng cách hiểu và giả định trong một CI được tính toán thông qua lý thuyết tiệm cận.
gung - Tái lập Monica

1
Đây là một lời giải thích tuyệt vời. Tôi chỉ nói thêm rằng "giá trị thực" đôi khi là một tạo tác của thiết kế nghiên cứu. Trong việc bỏ phiếu cho các ứng cử viên chính trị, các mẫu phân tầng đưa ra các ước tính chính xác và đáng tin cậy hơn nhiều so với một mẫu ngẫu nhiên. Chi phí là một rủi ro của việc chồng chéo nhóm sai theo thiết kế. Trong trường hợp đó, CI 95% được tập trung vào giá trị chính xác, giá trị đạt được bằng cách sao chép quảng cáo nghiên cứu , nhưng giá trị đó không phải là ý nghĩa khác của một tham số thực: tham số chúng tôi muốn ước tính. Đây là lý do tại sao nghiên cứu thiết kế và suy luận được liên kết về bản chất.
AdamO

0

Những gì bạn đang nói là không cần phải tìm khoảng tin cậy từ các mẫu được khởi động. Nếu bạn hài lòng với số liệu thống kê (giá trị trung bình mẫu hoặc tỷ lệ mẫu) thu được từ các mẫu thử bootstrapping, không tìm thấy bất kỳ khoảng tin cậy nào và do đó, không có câu hỏi về giải thích. Nhưng nếu bạn không hài lòng với số liệu thống kê thu được từ các mẫu được khởi động hoặc hài lòng nhưng vẫn muốn tìm khoảng tin cậy, thì cách giải thích cho khoảng tin cậy đó cũng giống như bất kỳ khoảng tin cậy nào khác. Đó là bởi vì khi các mẫu tương ứng bootstrapping của bạn đại diện chính xác (hoặc được giả định là như vậy) dân số ban đầu, Vậy thì sự cần thiết của khoảng tin cậy ở đâu? Thống kê từ các mẫu tương ứng bootstrapping là chính tham số dân số ban đầu nhưng khi bạn không coi thống kê là tham số dân số ban đầu, thì cần phải tìm khoảng tin cậy. Vì vậy, đó là tất cả về cách bạn xem xét. Giả sử bạn đã tính khoảng tin cậy 95% từ các mẫu khởi động. Bây giờ cách giải thích là: "95% số lần, phương thức bootstrap này dẫn đến kết quả chính xác trong khoảng tin cậy có chứa tham số dân số thực".

(Đây là những gì tôi nghĩ. Hãy sửa tôi nếu có bất kỳ sai lầm nào).


-1

Chúng tôi đang đề cập đến các tham số thực sự của dân số ban đầu. Có thể làm điều này với giả định rằng dữ liệu được rút ngẫu nhiên từ dân số ban đầu - trong trường hợp đó, có các đối số toán học cho thấy các thủ tục bootstrap sẽ cho khoảng tin cậy hợp lệ, ít nhất là khi kích thước của tập dữ liệu trở nên đủ lớn .


Vì vậy, có vẻ như để hiểu lý do tại sao nó hoạt động, tôi cần biết đủ toán học để làm theo các bằng chứng toán học. Đúng không?
iarwain

Tôi nghĩ vậy (tôi không quen với các bằng chứng)
Gareth

Mặc dù theo trực giác, bạn có thể thấy rằng khi kích thước mẫu trở nên lớn, mẫu bắt đầu trông rất giống với dân số. Ví dụ: giả sử tôi lấy 1 triệu mẫu từ phân phối bình thường với giá trị trung bình và phương sai đã cho. Gọi mẫu này là X. Một mẫu ngẫu nhiên (có thay thế) được vẽ từ X trông rất giống một mẫu ngẫu nhiên được rút ra từ phân phối ban đầu. Tôi nghĩ rằng đây là ý tưởng cơ bản về lý do tại sao nó hoạt động.
Gareth
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.