Hiểu đầu ra của một bootstrap được thực hiện trong R (tsboot, MannKendall)


11

Tôi có một câu hỏi liên quan đến việc giải thích cuộc gọi tsboot trong R. Tôi đã kiểm tra tài liệu của cả Kendall và gói khởi động, nhưng không thông minh hơn trước.

Khi tôi chạy bootstrap bằng ví dụ trong gói Kendall, trong đó thống kê kiểm tra là Kendall's tau:

library(Kendall)
# Annual precipitation entire Great Lakes
# The Mann-Kendall trend test confirms the upward trend.
data(PrecipGL)
MannKendall(PrecipGL)

xác nhận xu hướng tăng:

tau = 0.265, 2-sided pvalue =0.00029206

Ví dụ sau đó tiếp tục sử dụng một khối bootstrap:

#
#Use block bootstrap 
library(boot)
data(PrecipGL)
MKtau<-function(z) MannKendall(z)$tau
tsboot(PrecipGL, MKtau, R=500, l=5, sim="fixed")

Tôi nhận được kết quả sau:

BLOCK BOOTSTRAP FOR TIME SERIES
Fixed Block Length of 5 
Call:
tsboot(tseries = PrecipGL, statistic = MKtau, R = 500, l = 5, 
sim = "fixed")


Bootstrap Statistics :
 original     bias    std. error
t1* 0.2645801 -0.2670514  0.09270585

Nếu tôi hiểu chính xác, "t1 * gốc" là MKtau ban đầu, "độ lệch" là giá trị trung bình của MKtau trong chuỗi thời gian khởi động R = 500 và "lỗi std." Là độ lệch chuẩn của MKtaus từ 500 mẫu.

Tôi gặp khó khăn trong việc hiểu điều này có nghĩa là gì - điều này về cơ bản cho tôi biết rằng tất cả 500 MKTaus đều thấp hơn bản gốc và t1 * ban đầu nằm trong phạm vi 3 sd của MKtaus đã khởi động. Ergo nó có khác biệt đáng kể?

Hoặc tôi sẽ nói MKtau cho tập dữ liệu là 0,26 cộng / trừ lỗi tiêu chuẩn?

Tôi xin lỗi vì câu hỏi dài dòng, nhưng tôi là người mới thống kê và đang học thông qua việc tự học, thiếu một người nào đó để trả lại vấn đề có lẽ thực sự đơn giản này qua lại.


6
Trong đầu ra biaschỉ đơn giản là sự khác biệt giữa giá trị trung bình của 500 mẫu bootstrap được lưu trữ và ước tính ban đầu. Các std. errorlà độ lệch chuẩn của mẫu bootstrap 500 và là một ước lượng sai số chuẩn. Đầu ra cho bạn biết rằng ước tính ban đầu của bạn cao hơn giá trị trung bình của 500 ước tính bootstrapping (vì vậy không phải tất cả MKtaus bootstrapping đều thấp hơn). Bootstrap thường được sử dụng để tính toán các lỗi tiêu chuẩn / khoảng tin cậy mà không đưa ra các giả định về phân phối. Sử dụng boot.cihàm để tính khoảng tin cậy.
COOLSerdash

@COOLSerdash, cảm ơn vì điều này! Vì vậy, nếu thống kê ban đầu của tôi cao hơn 3 sd so với giá trị trung bình của thống kê bootstrapping, thì tôi có thể kết luận trực tiếp bất cứ điều gì không (giả sử: thống kê có ý nghĩa ở 0,99)? Tôi cũng đã sử dụng boot.ciđể tính các khoảng tin cậy và một lần nữa, thống kê được tính toán ban đầu nằm ngoài các khoảng này.
Maria

Không, bạn không so sánh thống kê bootstrapping với thống kê ban đầu với kiểm tra giả thuyết. Tôi sẽ chỉ sử dụng / báo cáo lỗi tiêu chuẩn khởi động và khoảng tin cậy trong trường hợp của bạn.
COOLSerdash

Câu trả lời:


3

Đã gặp phải câu hỏi tương tự và khám phá nó với bộ dữ liệu được kiểm soát - mô hình y = ax + b với lỗi N (0, sig), tôi thấy rằng gói Kendall có thể không hoạt động như quảng cáo. Các x trong trường hợp của tôi là 1:100, và y = x , với sig = 100 (phương sai của hạn lỗi).

Hồi quy có vẻ tốt, và Kendall cũng vậy. Không có tự động tương quan ở đây ngoài việc gây ra bởi mô hình tuyến tính. Chạy thử nghiệm Kendall như được quảng cáo với độ dài khối 1, 3, 5 và 10 mang lại giá trị sai lệch rất lớn và boot.cibáo cáo không có xu hướng.

Sau đó, tôi đã mã hóa bootstrap của dữ liệu với các độ dài khối này và với chuỗi điều khiển của tôi, tôi nhận được kết quả hợp lý về giá trị trung bình của các mẫu bootstrap và mức độ lây lan của chúng. Do đó, có thể có thứ gì đó không ổn với gói Kendall liên quan đến bootstrap khối.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.