Làm thế nào để có được khoảng tin cậy về thay đổi bình phương dân số


10

Vì một ví dụ đơn giản, giả sử rằng có hai mô hình hồi quy tuyến tính

  • Mô hình 1 có ba dự đoán, x1a, x2b, vàx2c
  • Mô hình 2 có ba dự đoán từ mô hình 1 và hai dự đoán bổ sung x2ax2b

Có một phương trình hồi quy dân số trong đó phương sai dân số được giải thích là cho Mô hình 1 và cho Mô hình 2. Phương sai gia tăng được giải thích bởi Mô hình 2 trong dân số là ρ 2 ( 2 ) delta ρ 2 = ρ 2 ( 2 ) - ρ 2 ( 1 )ρ(1)2ρ(2)2Δρ2=ρ(2)2ρ(1)2

Tôi quan tâm đến việc thu được các lỗi tiêu chuẩn và khoảng tin cậy cho một công cụ ước tính của . Trong khi ví dụ liên quan đến 3 và 2 yếu tố dự đoán tương ứng, mối quan tâm nghiên cứu của tôi liên quan đến một loạt các số lượng dự đoán khác nhau (ví dụ: 5 và 30). Suy nghĩ đầu tiên của tôi là sử dụng làm công cụ ước tính và khởi động lại nó, nhưng tôi không chắc liệu điều này có được thích hợp. Δ r 2 a d j = r 2 a d j ( 2 ) - r 2 a d j ( 1 )Δρ2Δradj2=radj(2)2radj(1)2

Câu hỏi

  • Là một ước lượng hợp lý của ? Δ ρ 2Δradj2Δρ2
  • Làm thế nào có thể đạt được khoảng tin cậy cho thay đổi bình phương r dân số (nghĩa là )?Δρ2
  • Bootstrapping có phù hợp để tính khoảng tin cậy không?Δρ2

Bất kỳ tài liệu tham khảo nào về mô phỏng hoặc tài liệu xuất bản cũng sẽ được hoan nghênh nhất.

Mã ví dụ

Nếu nó giúp, tôi đã tạo một tập dữ liệu mô phỏng nhỏ trong R có thể được sử dụng để thể hiện câu trả lời:

n <- 100
x <- data.frame(matrix(rnorm(n *5), ncol=5))
names(x) <- c('x1a', 'x1b', 'x1c', 'x2a', 'x2b')
beta <- c(1,2,3,1,2)
model2_rho_square <- .7
error_rho_square <- 1 - model2_rho_square
error_sd <- sqrt(error_rho_square / model2_rho_square* sum(beta^2))
model1_rho_square <- sum(beta[1:3]^2) / (sum(beta^2) + error_sd^2)
delta_rho_square <- model2_rho_square - model1_rho_square

x$y <- rnorm(n, beta[1] * x$x1a + beta[2] * x$x1b + beta[3] * x$x1c +
               beta[4] * x$x2a + beta[5] * x$x2b, error_sd)

c(delta_rho_square, model1_rho_square, model2_rho_square)
summary(lm(y~., data=x))$adj.r.square - 
        summary(lm(y~x1a + x1b + x1c, data=x))$adj.r.square

Lý do quan tâm với bootstrap

Tôi đã chạy bootstrap trên một số dữ liệu với khoảng 300 trường hợp và 5 dự đoán trong mô hình đơn giản và 30 dự đoán trong mô hình đầy đủ. Mặc dù ước tính mẫu sử dụng chênh lệch r-vuông đã điều chỉnh là 0.116, khoảng tin cậy được tăng cường chủ yếu là CI95% lớn hơn (0,095 đến 0,214) và giá trị trung bình của bootstraps không ở gần ước tính mẫu. Thay vào đó, giá trị trung bình của các mẫu được tăng cường dường như được tập trung vào ước tính mẫu về sự khác biệt giữa các bình phương r trong mẫu. Điều này bất chấp thực tế là tôi đã sử dụng các ô vuông được điều chỉnh mẫu để ước tính sự khác biệt.

Thật thú vị, tôi đã thử một cách khác của máy tính làΔρ2

  1. tính toán thay đổi mẫu r-vuông
  2. điều chỉnh thay đổi r-vuông mẫu bằng công thức r-vuông điều chỉnh tiêu chuẩn

Khi được áp dụng cho dữ liệu mẫu, điều này đã làm giảm ước tính của xuống nhưng khoảng tin cậy có vẻ phù hợp với phương pháp tôi đã đề cập đầu tiên, CI95% (.062, .179) với giá trị trung bình là .118.Δρ2.082

Nói chung, tôi lo ngại rằng bootstrapping giả định rằng mẫu là dân số, và do đó, ước tính rằng việc giảm quá mức có thể không thực hiện một cách thích hợp.


"Tuy nhiên, tôi lo ngại rằng việc bootstrapping một giá trị dân số được điều chỉnh như vậy có thể là vấn đề." -- tại sao?
Ngày

@Janemony Tôi đã chỉnh sửa câu hỏi và cố gắng nói rõ mối quan tâm của tôi về bootstrapping với hình vuông r điều chỉnh.
Jeromy Anglim

Là gì dân R bình phương ? Tôi đã xem xét định nghĩa được đưa ra ở đây nhưng đối với tôi phương sai không có ý nghĩa gì vì không được phân phối chính xác. y iσy2yi
Stéphane Laurent

@ StéphaneLaurent đó là tỷ lệ phương sai được giải thích trong dân số theo phương trình hồi quy dân số. Hoặc bạn có thể định nghĩa nó không có triệu chứng khi tỷ lệ phương sai được giải thích trong mẫu của bạn khi kích thước mẫu của bạn đạt đến vô cùng. Xem thêm câu trả lời này liên quan đến ước tính không thiên vị của dân số r-vuông . Nó đặc biệt có liên quan trong tâm lý học, nơi chúng ta thường quan tâm nhiều hơn đến mối quan hệ thực sự hơn là thực sự áp dụng phương trình dự đoán ước tính của chúng ta.
Jeromy Anglim

3
Một thử nghiệm F có thể được coi là thử nghiệm của giả thuyết . Điều đó có thể được sử dụng để rút ra lỗi tiêu chuẩn và khoảng tin cậy mà bạn đang tìm kiếm không? Δρ2=0
Maarten Buis

Câu trả lời:


3

Dân sốR2

Trước tiên tôi đang cố gắng để hiểu định nghĩa của dân số R bình phương .

Trích dẫn bình luận của bạn:

Hoặc bạn có thể định nghĩa nó không có triệu chứng khi tỷ lệ phương sai được giải thích trong mẫu của bạn khi kích thước mẫu của bạn đạt đến vô cùng.

Tôi nghĩ bạn có nghĩa đây là giới hạn của mẫu khi một lần lặp lại mô hình vô hạn nhiều lần (với cùng các yếu tố dự đoán ở mỗi lần lặp lại). R2

Vậy công thức cho giá trị tiệm cận của mẫu gì? Viết mô hình tuyến tính của bạn như trong https://stats.stackexchange.com/a/58133/8402 và sử dụng các ký hiệu tương tự như liên kết này. Sau đó, người ta có thể kiểm tra xem mẫu sẽ đi tới khi sao chép mô hình vô hạn nhiều lần.R²Y=μ+σG
R2popR2:=λn+λY=μ+σG

Ví dụ như:

> ## design of the simple regression model lm(y~x0)
> n0 <- 10
> sigma <- 1
> x0 <- rnorm(n0, 1:n0, sigma)
> a <- 1; b <- 2 # intercept and slope
> params <- c(a,b)
> X <- model.matrix(~x0)
> Mu <- (X%*%params)[,1]
> 
> ## replicate this experiment k times 
> k <- 200
> y <- rep(Mu,k) + rnorm(k*n0)
> # the R-squared is:
> summary(lm(y~rep(x0,k)))$r.squared 
[1] 0.971057
> 
> # theoretical asymptotic R-squared:
> lambda0 <- crossprod(Mu-mean(Mu))/sigma^2
> lambda0/(lambda0+n0)
          [,1]
[1,] 0.9722689
> 
> # other approximation of the asymptotic R-squared for simple linear regression:
> 1-sigma^2/var(y)
[1] 0.9721834

Dân số của một mô hình conR2

Bây giờ giả sử mô hình được với và xem xét mô hình .Y=μ+σGH1:μW1H0:μW0

Sau đó, tôi đã nói ở trên rằng dân số của mô hình được trong đó và và sau đó người ta chỉ cần có .R2H1popR12:=λ1n+λ1λ1=PZ1μ2σ2Z1=[1]W1PZ1μ2=(μiμ¯)2

Bây giờ bạn có xác định dân số của mô hình là giá trị tiệm cận của tính theo mô hình nhưng theo giả định phân phối của mô hình không? Giá trị tiệm cận (nếu có) dường như khó tìm hơn.R2 H0R2H0H1


Cảm ơn Stéphane. Tôi sẽ phải suy nghĩ về những gì bạn đang nói. Liên quan đến câu hỏi của bạn. Tôi giả sử rằng quá trình tạo dữ liệu thực sự không được biết nhưng nó giống nhau cho cả hai mô hình, nhưng có một tỷ lệ phương sai thực sự được giải thích bằng hồi quy tuyến tính trong mô hình 1 và mô hình 2.
Jeromy Anglim

@JeromyAnglim Formula (A3) của bài viết này là một trường hợp cụ thể của công thức của tôi cho mô hình ANOVA một chiều. Vì vậy, công thức của tôi phải là định nghĩa chung về dân số , nhưng đây không phải là những gì bạn đang sử dụng trong OP của mình. R2
Stéphane Laurent

1
@JeromyAnglim Nghiên cứu của bài viết này dường như gần với những gì bạn đang tìm kiếm (với các dự đoán ngẫu nhiên).
Stéphane Laurent

Cảm ơn. Giấy Algina, Keselman và Penfield trông rất hữu ích. Tôi đã thêm một số ý kiến ​​cho câu trả lời của tôi về nó.
Jeromy Anglim

@JeromyAnglim Vậy giả định về các yếu tố dự đoán là gì? Chúng được tạo ra theo phân phối Gaussian đa biến?
Stéphane Laurent

1

Thay vì trả lời câu hỏi bạn hỏi, tôi sẽ hỏi tại sao bạn hỏi câu hỏi đó. Tôi giả sử bạn muốn biết liệu

mod.small <- lm(y ~ x1a + x1b + x1c, data=x)

ít nhất là tốt như

mod.large <- lm(y ~ ., data=x)

tại giải thích y. Vì các mô hình này được lồng nhau, nên cách rõ ràng để trả lời câu hỏi này dường như là chạy một phân tích về phương sai so sánh chúng, giống như cách bạn có thể chạy một phân tích về độ lệch cho hai GLM, như

anova(mod.small, mod.large)

Sau đó, bạn có thể sử dụng cải tiến bình phương R mẫu giữa các mô hình như dự đoán tốt nhất của bạn về sự cải thiện phù hợp trong dân số, luôn cho rằng bạn có thể hiểu được dân số R bình phương. Cá nhân tôi không chắc là tôi có thể, nhưng với điều này thì cũng không vấn đề gì.

Nói chung, nếu bạn quan tâm đến số lượng dân số, có lẽ bạn quan tâm đến việc khái quát hóa, do đó, một biện pháp phù hợp mẫu không hoàn toàn là những gì bạn muốn, tuy nhiên, 'đã được sửa chữa'. Ví dụ: xác thực chéo một số lượng ước tính loại và số lượng lỗi thực tế bạn có thể gặp phải từ mẫu, như MSE, dường như sẽ đạt được những gì bạn muốn.

Nhưng rất có thể tôi đang thiếu thứ gì đó ở đây ...


Tôi đánh giá cao câu trả lời của bạn, và nó cũng có thể là lời khuyên tốt cho những người khác. Nhưng bối cảnh nghiên cứu của tôi có nghĩa là tôi quan tâm chính đáng đến quảng trường delta-rho. Trong khi hầu hết các nhà thống kê thường quan tâm nhiều hơn đến tiện ích dự đoán của một mô hình (ví dụ: delta r-Square được xác thực chéo), tôi là một nhà khoa học tâm lý và đặc biệt quan tâm đến tài sản dân số. Hơn nữa, tôi không quan tâm đến ý nghĩa thống kê của cải tiến. Tôi quan tâm đến kích thước của sự cải thiện. Và tôi thấy rằng delta-r-vuông là một số liệu hữu ích để lập chỉ mục kích thước cải tiến đó.
Jeromy Anglim

Liên quan đến MSE, các nghiên cứu khác nhau về tâm lý học sử dụng các biện pháp trên các số liệu rất khác nhau. Do đó, có một sự hấp dẫn, đúng hay sai đối với các biện pháp được tiêu chuẩn hóa như r-vuông.
Jeromy Anglim

Đủ công bằng, đặc biệt là trên MSE. Tôi vẫn còn một chút bối rối bởi sự quan tâm đến bootstrapping và suy luận dân số nhưng sự thiếu quan tâm đến thử nghiệm vì, có lẽ ngây thơ, những điều này dường như là mối quan tâm tương đương được giải quyết khác nhau. Tôi cũng gặp khó khăn trong việc phân biệt chặt chẽ dự đoán mẫu với suy luận với dân số, nhưng đó có lẽ là chủ nghĩa bayes giật đầu cà phê (trong đó dự đoán chỉ là một vấn đề suy luận dân số khác).
liên hợp chiến binh

Có lẽ tôi đã nói một chút nhanh chóng. Trong bối cảnh nghiên cứu của tôi, thường có nhiều bằng chứng cho thấy delta-rho-vuông lớn hơn 0. Câu hỏi quan tâm là mức độ tăng là gì. Tức là, đó là một sự gia tăng tầm thường hoặc một sự gia tăng có ý nghĩa về mặt lý thuyết. Do đó, sự tự tin hoặc khoảng tin cậy cho tôi một ước tính về sự không chắc chắn xung quanh sự gia tăng đó. Tôi chưa giải thích được những gì tôi đang làm ở đây với sự hiểu biết của tôi về thống kê Bayes, nhưng tôi muốn.
Jeromy Anglim

1

Phần sau đây thể hiện một vài khả năng để tính khoảng tin cậy trên .ρ2

Bootstrap đôi điều chỉnh r-vuông

Dự đoán tốt nhất hiện tại của tôi tại một câu trả lời là thực hiện một bootstrap r-vuông điều chỉnh gấp đôi. Tôi đã thực hiện kỹ thuật này. Nó bao gồm những điều sau đây:

  • Tạo một tập hợp các mẫu bootstrap từ dữ liệu hiện tại.
  • Đối với mỗi mẫu bootstrapping:
    • tính bình phương r điều chỉnh đầu tiên cho hai mô hình
    • tính bình phương r điều chỉnh thứ hai trên các giá trị r bình phương đã điều chỉnh từ bước trước
    • Trừ mô hình2 từ các giá trị r-vuông được điều chỉnh thứ hai của mô hình1 để có ước tính .Δρ2

Lý do là hình vuông r được điều chỉnh đầu tiên loại bỏ sai lệch được đưa ra bằng cách khởi động (nghĩa là bootstrapping giả định rằng hình vuông r mẫu là hình vuông r dân số). Bình phương r điều chỉnh thứ hai thực hiện hiệu chỉnh chuẩn được áp dụng cho một mẫu bình thường để ước tính bình phương r dân số.

Tại thời điểm này, tất cả những gì tôi có thể thấy là việc áp dụng thuật toán này tạo ra các ước tính có vẻ đúng (nghĩa là theta_hat trong bootstrap rất gần với mẫu theta_hat). Các lỗi tiêu chuẩn phù hợp với trực giác của tôi. Tôi vẫn chưa kiểm tra liệu nó có cung cấp phạm vi bảo hiểm thường xuyên phù hợp trong đó quy trình tạo dữ liệu được biết hay không và tôi cũng không hoàn toàn chắc chắn tại thời điểm này làm thế nào để biện minh có thể được biện minh từ các nguyên tắc đầu tiên

Nếu bất cứ ai thấy bất kỳ lý do tại sao phương pháp này sẽ có vấn đề, tôi rất biết ơn khi nghe về nó.

Mô phỏng bởi Algina et al

Stéphane đã đề cập đến bài báo của Algina, Keselman và Penfield. Họ đã thực hiện một nghiên cứu mô phỏng để kiểm tra độ bao phủ khoảng tin cậy 95% của phương pháp bootstrapping và tiệm cận để ước tính . Các phương pháp bootstrapping của họ chỉ liên quan đến một ứng dụng duy nhất của r-vuông được điều chỉnh, thay vì điều chỉnh kép của r-vuông mà tôi đã đề cập ở trên. Họ phát hiện ra rằng các ước tính bootstrap chỉ cung cấp phạm vi bảo hiểm tốt khi số lượng dự đoán bổ sung trong mô hình đầy đủ là một hoặc có thể là hai. Theo giả thuyết của tôi, đó là bởi vì khi số lượng dự đoán tăng lên, thì sự khác biệt giữa bootstrap r-vuông đơn và đôi được điều chỉnh.Δρ2

Smithson (2001) về việc sử dụng tham số phi tập trung

Smithson (2001) thảo luận về việc tính toán khoảng tin cậy cho một phần dựa trên tham số phi tập trung. Xem trang 615 và 616 nói riêng. Ông gợi ý rằng "thật đơn giản để xây dựng một CI cho và một phần nhưng không phải cho mối tương quan bán nguyệt bình phương." (tr.615)R2f2R2

Người giới thiệu

  • Algina, J., Keselman, HJ, & Penfield, RD Khoảng tin cậy RD cho Hệ số tương quan nhiều bán cầu bình phương. PDF
  • Smithson, M. (2001). Khoảng tin cậy chính xác cho các kích thước và tham số hiệu ứng hồi quy khác nhau: Tầm quan trọng của phân phối không trung tâm trong các khoảng tính toán. Đo lường giáo dục và tâm lý, 61 (4), 605-632.

1
Dường như không ai ở đây (bao gồm cả bạn) biết định nghĩa về dân số R bình phương của bạn. Do đó IMHO đây là một cách tiếp cận có vấn đề nghiêm trọng.
Stéphane Laurent

@ StéphaneLaurent Cảm ơn vì điều đó. Tôi thú nhận rằng cho đến thời điểm này tôi chưa thấy dân số r-vuông là một tài sản của sự tranh chấp. Ví dụ, tôi có thể đề xuất một quy trình tạo dữ liệu và sẽ có một hình vuông r được tiếp cận khi kích thước mẫu mô phỏng của tôi đạt đến vô cùng. Và tương tự, tôi giả sử rằng có một quy trình tạo dữ liệu cho dữ liệu của mình và do đó, nếu có thể lấy một mẫu vô hạn, tôi có thể tính được bình phương dân số thực.
Jeromy Anglim

Có nhưng tôi có ấn tượng rằng bạn cũng giả định một quá trình tạo ra cho những người dự đoán. Tôi không thể hiểu làm thế nào điều này có thể có ý nghĩa cho một mô hình tuyến tính nói chung.
Stéphane Laurent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.