Tác động của việc nhân đôi kích thước mẫu lên giá trị p là gì


7

Giả sử rằng chúng là mối quan hệ cơ bản giữa hai biến trong hồi quy OLS [kiểm tra giả thuyết null], thì tác động lên giá trị p của việc nhân đôi kích thước mẫu là gì? (giả sử rằng mẫu ban đầu là đại diện cho dân số, và mẫu tiếp theo cũng là đại diện).

Rõ ràng tôi nhận thức được rằng miễn là có mối quan hệ cơ bản, thì việc tăng kích thước mẫu sẽ làm giảm giá trị p, nhưng tôi quan tâm tìm hiểu thêm về bản chất của mối quan hệ giữa p và n.


1
Tôi giả sử bạn đang nghĩ về giá trị liên quan đến được tính cho từng hệ số hồi quy. Tôi không có câu trả lời, nhưng nếu bạn muốn tự mình khám phá vấn đề này, bạn sẽ muốn xem xét kích thước mẫu đó tác động đến giá trị đó theo hai cách. Thứ nhất, tăng N có nghĩa là lỗi tiêu chuẩn giảm và do đó cao hơn . Thứ hai, với một cho trước , tăng N sẽ tăng df (đôi khi được gọi là trong phân phối ), theo thuật ngữ này sẽ làm tăng giá trị liên quan đến đó . ptpttvtpt
Ian_Fin

2
@Ian_Fin, Tăng mức độ tự do với giảm giá trị p, tất cả những thứ khác được giữ bằng nhau.
not_bonferroni

@not_bonferroni Điểm tốt! Tôi đã phải suy nghĩ về việc mọi thứ trở nên "ngày càng có ý nghĩa" và gõ sai từ.
Ian_Fin

1
Tăng kích thước mẫu sẽ có xu hướng tăng giá trị p khi giả thuyết null là đúng và giảm khi null là sai. Tuy nhiên, đây chỉ là những khuynh hướng vì giá trị p là ngẫu nhiên. Đặc biệt, có hai cách mạnh khác nhau để đọc câu hỏi này: một mối lo ngại hành vi của p-giá trị tiên nghiệm và những mối quan tâm khác dự đoán thay đổi trong p-giá trị sau khi thực hiện hồi quy trên một tập hợp dữ liệu cụ thể : nói cách khác, có điều kiện trên giá trị p đã cho. Giải thích nào là dự định?
whuber

@whuber: tại sao bạn lại mong giá trị p tăng khi null là đúng? Giả sử, khi tất cả các giả định cổ điển được đáp ứng, các giá trị p được xây dựng từ phân phối t sẽ khiến tôi mong đợi các giá trị p thống nhất tiêu chuẩn cho bất kỳn?
Christoph Hanck

Câu trả lời:


7

Đối với thử nghiệm T, chúng tôi có các quy tắc như "Nhân đôi kích thước mẫu làm tăng thống kê thử nghiệm bằng cách 2 ". Điều này có thể khiến bạn nghĩ rằng có một mối quan hệ đơn giản giữa kích thước mẫu và giá trị p.

Trong thực tế, mối quan hệ giữa kích thước mẫu và giá trị p phụ thuộc vào mối quan hệ giữa kích thước mẫu và thống kê kiểm tra và mối quan hệ giữa thống kê kiểm tra và giá trị p. Những mối quan hệ sẽ khác nhau cho mỗi bài kiểm tra.

Đối với trường hợp đơn giản nhất, thử nghiệm Z một phía, chúng ta có thể thấy mối quan hệ này là gì. Giả sử một biến ngẫu nhiênX có nghĩa là μ và phương sai σ2. Uppose mà chúng tôi đang thử nghiệm nếu giá trị trung bình củaX khác biệt đáng kể so với ν. Thống kê kiểm traZ(x¯-ν)nσ.

Giá trị p bằng một trừ đi CDF của Z thống kê (điều này giả định rằng sự khác biệt giữa các phương tiện là tích cực, một đối số tương tự hoạt động nếu sự khác biệt là tiêu cực).

Đối với phân phối bình thường, CDF là Φ(t)= =0,5+0,5erf(x-μtσt2). Trong đó erf (x) là hàm lỗi.

Theo giả thuyết null có nghĩa là bằng Z thống kê có một ý nghĩa 0 và phương sai 1. Phân phối thực tế củaZ có ý nghĩa của (x¯-ν)nσ và phương sai 1.

Kích thước hiệu ứng của sự khác biệt giữa các phương tiện là (x¯-ν)σ. Gọi kích thước hiệu ứngb, sau đó giá trị mong đợi của Zbn.

Dành cho Z CDF là Φ(z)= =0,5+0,5erf(z2). Trong đó erf (x) là hàm lỗi.

Dĩ nhiên Z thống kê là một biến ngẫu nhiên, ở đây chúng ta sẽ xem xét mối quan hệ giữa kích thước mẫu và giá trị p cho giá trị mong đợi của Z.

Theo sau đó là CDF của Z thống kê là Φ(z)= =0,5+0,5erf(bn2)

Đây là mối quan hệ giữa giá trị p và cỡ mẫu

p= =0,5-0,5erf(bn2)

Mối quan hệ thay đổi theo giá trị của n. Cho rất lớnnchúng ta có thể sử dụng một chuỗi mở rộng để xem hành vi giới hạn. Theo wolfram alpha đó là:

limnp= =e-0,5b2n(1ebn+Ôi(1(bn)2))

Đó là một sự phân rã khá nhanh về 0. Có sự phụ thuộc lớn vào kích thước hiệu ứng, tất nhiên nếu sự khác biệt giữa các phương tiện lớn hơn thì giá trị p sẽ co lại nhanh hơn khi việc lấy mẫu của bạn được cải thiện.

Một lần nữa, hãy nhớ rằng điều này chỉ dành cho thử nghiệm Z và T, nó không áp dụng cho các thử nghiệm khác.


Nguyên tắc cơ bản cho chúng ta biết rằng (1) giá trị p là các đại lượng ngẫu nhiên ; (2) chúng phụ thuộc vào cỡ mẫu; nhưng (3) chúng cũng phụ thuộc vào trạng thái thực tế của tự nhiên - nghĩa là, không chỉ phụ thuộc vào giả thuyết null đúng hay sai, mà còn phụ thuộc vào phân phối cụ thể nào chi phối kết quả. Vì câu trả lời của bạn dường như không nhận ra (1) hoặc (3), nên rất khó xác định thông tin của nó có thông tin hoặc đáng tin cậy như thế nào.
whuber

@whuber Tôi thừa nhận rằng ký hiệu của tôi là xấu nên hơi không rõ ràng. Tôi đề cập đến (3), trạng thái tự nhiên là kích thước ảnh hưởng của sự khác biệt giữa các phương tiện dân số. Bạn nói đúng về (1), tôi đã không coi giá trị p như một biến ngẫu nhiên, tôi đang tìm kiếm một quy tắc ngón tay cái như "Nhân đôi kích thước mẫu dẫn đến tăng thống kê T2". Tôi đã xem xét ảnh hưởng của kích thước mẫu đến giá trị p dự kiến. Điều tốt là bạn đã chỉ ra nó để tôi có thể làm rõ điều này cho các độc giả trong tương lai.
Hugh

@Hugh câu hỏi của OP liên quan đến các thử nghiệm tham số từ các mô hình OLS, được kết nối trực tiếp với các thử nghiệm Z hoặc T khi xem xét các thử nghiệm dựa trên Wald. Tuy nhiên, bạn có thể nói liệu các lỗi tiêu chuẩn của hệ số hồi quy có tỷ lệ thuận với hệ số không1/nnhư với các xét nghiệm Z hoặc T khác?
AdamO

5

Trước tiên chúng ta điều tra ảnh hưởng đến giá trị t . Sau đó chúng ta có thể suy ra ngay hiệu ứng trên giá trị p.

Điều này có lẽ được minh họa tốt nhất bởi một ví dụ mô phỏng được lựa chọn tốt trong đó minh họa các tính năng nổi bật nhất. Vì chúng tôi đang nhìnH0 là sai (và về cơ bản chúng tôi đang xem xét các thuộc tính liên quan đến sức mạnh) nên tập trung vào thử nghiệm một đầu (theo hướng "chính xác") vì nhìn vào đuôi sai sẽ không thấy nhiều hành động và sẽ không nói chúng tôi rất quan tâm.

Vì vậy, ở đây chúng ta có một tình huống (tại n = 100) trong đó hiệu ứng đủ lớn để thống kê đôi khi có ý nghĩa. Sau đó, chúng tôi thêm vào mẫu đầu tiên một bản vẽ thứ hai từ cùng một phân phối giá trị x liên tục (ở đây thống nhất nhưng không quan trọng đối với hiệu ứng quan sát được) có cùng kích thước với mẫu thứ nhất, dẫn đến tăng gấp đôi kích thước mẫu, nhưng hoàn toàn bao gồm cả mẫu đầu tiên.

Đồ thị giá trị t cho độ dốc với mẫu ban đầu so với mẫu lớn hơn

Những gì chúng tôi quan sát không phải là giá trị p đi xuống, chỉ là nó có xu hướng đi xuống (nhiều điểm nằm trên đường chéo hơn bên dưới nó); chúng ta có thể thấy rằng sự thay đổi trong các giá trị t giảm, do đó, có ít hơn trong vùng 0. Nhiều giá trị p tăng lên. Khá nhiều mẫu không đáng kể đã trở nên quan trọng khi chúng tôi thêm nhiều dữ liệu, nhưng một số mẫu có ý nghĩa trở nên không đáng kể.

[Ở đây chúng tôi đang xem xét thống kê t cho hệ số độ dốc trong một hồi quy đơn giản, mặc dù về mặt định tính các vấn đề tương tự rộng hơn.]

Một biểu đồ của các giá trị p thay vì các giá trị t truyền tải về cơ bản cùng một thông tin. Thật vậy, nếu bạn đặt dấu tick ở các khoảng bên phải trên các trục ở trên, bạn có thể gắn nhãn chúng với giá trị p thay vào đó ... nhưng trên cùng (và bên phải) sẽ hiển thị giá trị p thấp và phía dưới (/ bên trái) sẽ là được dán nhãn với giá trị p lớn hơn. [Trên thực tế, việc vẽ các giá trị p chỉ đè bẹp mọi thứ vào góc và không rõ ràng những gì đang diễn ra.]


2

Nói chung, khi null tương ứng là sai, dự kiến ​​phân rã các giá trị p như trong hình bên dưới, trong đó tôi báo cáo giá trị p trung bình từ nghiên cứu mô phỏng nhỏ cho bội số mẫu có kích thước n=25từ bb*n=25cho đến bb*n=29*25một hệ số hồi quy tuyến tính đơn giản bằng đến 0,1 và độ lệch chuẩn củaσbạn= =0,5.

Vì các giá trị p được giới hạn từ bên dưới bằng 0, cuối cùng phân rã phải làm phẳng.

Khoảng tin cậy 90% (vùng màu xanh lam mờ) chỉ ra rằng, hơn nữa, độ biến thiên của các giá trị p cũng giảm theo kích thước mẫu.

nhập mô tả hình ảnh ở đây

Rõ ràng, khi một trong hai σbạn nhỏ hơn hoặc nlớn hơn, các giá trị p sẽ gần bằng 0 nhanh hơn khi tăng bb, do đó diện mạo của cốt truyện sẽ phẳng hơn.

Mã số:

reps <- 5000
B <- seq(1,30,by=2)
n <- 25

sigma.u <- .5
pvalues <- matrix(NA,reps,length(B))
for (bb in 1:length(B)){
     for (i in 1:reps){
          x <- rnorm(B[bb]*n)
          y <- .1*x + rnorm(B[bb]*n,sd=sigma.u)
          pvalues[i,bb] <- summary(lm(y~x))$coefficients[2,4]     
     }
}
plot(B,colMeans(pvalues),type="l", lwd=2, col="purple", ylim=c(0,.9))
ConfidenceInterval <- apply(pvalues, 2, quantile, probs = c(.1,.9))
x.ax <- c(B,rev(B))
y.ax <- c(ConfidenceInterval[1,],rev(ConfidenceInterval[2,]))
polygon(x.ax,y.ax, col=alpha("blue",alpha = .2), border=NA)

Vì giá trị p là một đại lượng ngẫu nhiên, điều quan trọng là phải giải thích rằng trục dọc trong ô của bạn hiển thị các ước tính của bạn về giá trị p dự kiến thay vì chính giá trị p. Trong ánh sáng này, cho thấy sự thay đổi giữa các giá trị p cho bất kỳ giá trị nàoBsẽ là một sự bổ sung cần thiết cho phân tích của bạn.
whuber

@whuber, đó là những gì tôi đã cố gắng nhấn mạnh bằng cách viết "mong đợi", nhưng hy vọng, rõ ràng hơn một chút như thế này bây giờ.
Christoph Hanck

3
+1 nhưng "làm phẳng" có lẽ sẽ biến mất nếu bạn định âm mưu log(p)thay vì pchính nó.
amip

@amoeba: có, chạy cùng một kịch bản cho giá trị log xuất hiện để tạo ra một đường thẳng.
Christoph Hanck
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.