Quy tắc ngón tay cái cho kích thước mẫu tối thiểu cho hồi quy bội


72

Trong bối cảnh đề xuất nghiên cứu về khoa học xã hội, tôi đã được hỏi câu hỏi sau:

Tôi đã luôn đi hơn 100 m (trong đó m là số lượng dự đoán) khi xác định cỡ mẫu tối thiểu cho nhiều hồi quy. Điều này có phù hợp không?

Tôi nhận được câu hỏi tương tự rất nhiều, thường với các quy tắc khác nhau. Tôi cũng đã đọc những quy tắc như vậy khá nhiều trong các sách giáo khoa khác nhau. Đôi khi tôi tự hỏi liệu sự phổ biến của một quy tắc về các trích dẫn có dựa trên mức độ thấp của tiêu chuẩn được đặt ra hay không. Tuy nhiên, tôi cũng nhận thức được giá trị của các heuristic tốt trong việc đơn giản hóa việc ra quyết định.

Câu hỏi:

  • Tiện ích của các quy tắc đơn giản cho kích thước mẫu tối thiểu trong bối cảnh các nhà nghiên cứu ứng dụng thiết kế nghiên cứu nghiên cứu là gì?
  • Bạn có đề xuất một quy tắc thay thế cho kích thước mẫu tối thiểu cho nhiều hồi quy không?
  • Ngoài ra, chiến lược thay thế nào bạn muốn đề xuất để xác định cỡ mẫu tối thiểu cho hồi quy bội? Cụ thể, sẽ tốt nếu giá trị được gán cho mức độ mà bất kỳ chiến lược nào có thể dễ dàng được áp dụng bởi một người không thống kê.

Câu trả lời:


36

Tôi không phải là người hâm mộ các công thức đơn giản để tạo kích thước mẫu tối thiểu. Ít nhất, bất kỳ công thức nên xem xét kích thước hiệu ứng và các câu hỏi quan tâm. Và sự khác biệt giữa hai bên của một điểm cắt là tối thiểu.

Cỡ mẫu là vấn đề tối ưu hóa

  • Mẫu lớn hơn là tốt hơn.
  • Cỡ mẫu thường được xác định bằng những cân nhắc thực dụng.
  • Cỡ mẫu nên được xem là một sự cân nhắc trong một vấn đề tối ưu hóa trong đó chi phí về thời gian, tiền bạc, công sức, v.v. để có được những người tham gia bổ sung được cân nhắc với lợi ích của việc có thêm người tham gia.

Một nguyên tắc thô

Xét về các quy tắc rất thô sơ trong bối cảnh điển hình của các nghiên cứu tâm lý học quan sát liên quan đến những thứ như kiểm tra khả năng, thang đo thái độ, các biện pháp nhân cách, v.v., đôi khi tôi nghĩ đến:

  • n = 100 là đủ
  • n = 200 là tốt
  • n = 400 + càng tuyệt

Các quy tắc này được đặt nền tảng trong khoảng tin cậy 95% liên quan đến tương quan ở các mức tương ứng này và mức độ chính xác mà tôi muốn hiểu về mặt lý thuyết về mối quan hệ. Tuy nhiên, nó chỉ là một heuristic.

G G 3

Nhiều hồi quy kiểm tra nhiều giả thuyết

  • Bất kỳ câu hỏi phân tích sức mạnh đòi hỏi phải xem xét kích thước hiệu ứng.
  • Phân tích công suất cho hồi quy bội được thực hiện phức tạp hơn bởi thực tế là có nhiều hiệu ứng bao gồm bình phương r tổng thể và một cho mỗi hệ số riêng lẻ. Hơn nữa, hầu hết các nghiên cứu bao gồm nhiều hơn một hồi quy bội. Đối với tôi, đây là lý do hơn nữa để dựa nhiều hơn vào các heuristic chung và suy nghĩ về kích thước hiệu ứng tối thiểu mà bạn muốn phát hiện.

  • Liên quan đến hồi quy bội, tôi thường nghĩ nhiều hơn về mức độ chính xác trong việc ước tính ma trận tương quan cơ bản.

Độ chính xác trong ước tính tham số

Tôi cũng thích thảo luận của Ken Kelley và các đồng nghiệp về Tính chính xác trong Ước tính Thông số.

  • Xem trang web của Ken Kelley cho các ấn phẩm
  • Như được đề cập bởi @Dmitrij, Kelley và Maxwell (2003) PDF MIỄN PHÍ có một bài viết hữu ích.
  • Ken Kelley đã phát triển MBESSgói trong R để thực hiện phân tích kích thước mẫu liên quan đến độ chính xác trong ước tính tham số.

17

nR2R2Radj2R21(1R2)n1np1R2

pn1Radj2kR2k

require(Hmisc)
dop <- function(k, type) {
  z <- list()
  R2 <- seq(.01, .99, by=.01)
  for(a in k) z[[as.character(a)]] <-
    list(R2=R2, pfact=if(type=='relative') ((1/R2) - a) / (1 - a) else
         (1 - R2 + a) /  a)
  labcurve(z, pl=TRUE, ylim=c(0,100), adj=0, offset=3,
           xlab=expression(R^2), ylab=expression(paste('Multiple of ',p)))
}
par(mfrow=c(1,2))
dop(c(.9, .95, .975), 'relative')
dop(c(.075, .05, .04, .025, .02, .01), 'absolute')

nhập mô tả hình ảnh ở đâyR2R2Radj2

Nếu bất cứ ai đã nhìn thấy điều này đã được in sẵn xin vui lòng cho tôi biết.


1
R^2R2Radj2NNR^2R2

@FrankHarrell: nhìn vào đây tác giả dường như đang sử dụng các lô 260-263 theo cách tương tự như các bài trong bài viết của bạn ở trên.
user603

5
Radj2R2

12

(+1) thực sự là một câu hỏi quan trọng, theo ý kiến ​​của tôi, câu hỏi.

4m4

Hầu hết các kích thước mẫu được liên kết với sức mạnh của các thử nghiệm cho giả thuyết bạn sẽ kiểm tra sau khi bạn phù hợp với mô hình hồi quy bội.

Có một máy tính đẹp có thể hữu ích cho nhiều mô hình hồi quy và một số công thức đằng sau hậu trường. Tôi nghĩ rằng một máy tính linh mục như vậy có thể dễ dàng được áp dụng bởi người không thống kê.

Có lẽ bài viết của K.Kelley và SEMaxwell có thể hữu ích để trả lời các câu hỏi khác, nhưng tôi cần thêm thời gian trước để nghiên cứu vấn đề.


11

mm=500500600

mm+1nm1m+1nO(m+1n)n=k(m+1)kO(1k)kk1020301,2,,26,27,28,29,


Bạn nói 10 đến 20 là tốt, nhưng điều này cũng phụ thuộc vào kích thước của phương sai lỗi (có thể liên quan đến những thứ khác)? Ví dụ: giả sử chỉ có một biến dự đoán. Nếu được biết rằng phương sai lỗi thực sự rất nhỏ, thì có vẻ như 3 hoặc 4 điểm dữ liệu có thể đủ để ước tính độ dốc và đánh chặn một cách đáng tin cậy. Mặt khác, nếu biết rằng phương sai lỗi là rất lớn, thì thậm chí 50 điểm dữ liệu có thể không đầy đủ. Tôi có hiểu lầm gì không?
đánh dấu999

Bạn có thể vui lòng cung cấp bất kỳ tài liệu tham khảo cho phương trình đề xuất của bạn n=k(m+1)?
Sosi

6

Trong Tâm lý học:

N>50+8mN>104+m

Các quy tắc khác có thể được sử dụng là ...

50

1030


1
'Quy tắc' đầu tiên của bạn không có m trong đó.
Dason

Quy tắc ngón tay cái đầu tiên của ông được viết là N = 50 + 8 m, mặc dù người ta đã đặt câu hỏi liệu thuật ngữ 50 có thực sự cần thiết hay không
Sosi

Tôi đã thêm một quy tắc mới và phức tạp hơn có tính đến kích thước hiệu ứng của mẫu. Điều này cũng đã được trình bày bởi Green (1991).
Sosi

2
Các trích dẫn đầy đủ cho các tài liệu tham khảo Green (1991) và Harris (1985) là gì?
Hatshepsut

2

Tôi đồng ý rằng máy tính công suất là hữu ích, đặc biệt là để xem ảnh hưởng của các yếu tố khác nhau đến sức mạnh. Theo nghĩa đó, máy tính bao gồm nhiều thông tin đầu vào sẽ tốt hơn nhiều. Đối với hồi quy tuyến tính, tôi thích máy tính hồi quy ở đây bao gồm các yếu tố như lỗi trong Xs, tương quan giữa các X và hơn thế nữa.


0

R2

( pdf )

Tất nhiên, như được thừa nhận bởi bài báo, (không tương đối) không thiên vị không nhất thiết có nghĩa là có đủ sức mạnh thống kê. Tuy nhiên, tính toán công suất và kích thước mẫu thường được thực hiện bằng cách chỉ định các hiệu ứng mong đợi; trong trường hợp hồi quy bội, điều này hàm ý một giả thuyết về giá trị của các hệ số hồi quy hoặc ma trận tương quan giữa các hồi quy và kết quả phải được thực hiện. Trong thực tế, nó phụ thuộc vào sức mạnh của mối tương quan của các biến hồi quy với kết quả và giữa chúng (rõ ràng, càng mạnh thì càng tốt cho mối tương quan với kết quả, trong khi mọi thứ trở nên tồi tệ hơn với tính đa hình). Ví dụ, trong trường hợp cực đoan của hai biến cộng tuyến hoàn hảo, bạn không thể thực hiện hồi quy bất kể số lượng quan sát và thậm chí chỉ với 2 biến số.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.