Đối với thử nghiệm T, chúng tôi có các quy tắc như "Nhân đôi kích thước mẫu làm tăng thống kê thử nghiệm bằng cách 2-√ ". Điều này có thể khiến bạn nghĩ rằng có một mối quan hệ đơn giản giữa kích thước mẫu và giá trị p.
Trong thực tế, mối quan hệ giữa kích thước mẫu và giá trị p phụ thuộc vào mối quan hệ giữa kích thước mẫu và thống kê kiểm tra và mối quan hệ giữa thống kê kiểm tra và giá trị p. Những mối quan hệ sẽ khác nhau cho mỗi bài kiểm tra.
Đối với trường hợp đơn giản nhất, thử nghiệm Z một phía, chúng ta có thể thấy mối quan hệ này là gì. Giả sử một biến ngẫu nhiênX có nghĩa là μ và phương sai σ2. Uppose mà chúng tôi đang thử nghiệm nếu giá trị trung bình củaX khác biệt đáng kể so với ν. Thống kê kiểm traZ Là (x¯- ν)n√σ.
Giá trị p bằng một trừ đi CDF của Z thống kê (điều này giả định rằng sự khác biệt giữa các phương tiện là tích cực, một đối số tương tự hoạt động nếu sự khác biệt là tiêu cực).
Đối với phân phối bình thường, CDF là Φ ( t ) = 0,5 + 0,5 ⋅ e r f(x -μtσt2√). Trong đó erf (x) là hàm lỗi.
Theo giả thuyết null có nghĩa là bằng Z thống kê có một ý nghĩa 0 và phương sai 1. Phân phối thực tế củaZ có ý nghĩa của (x¯- ν)n√σ và phương sai 1.
Kích thước hiệu ứng của sự khác biệt giữa các phương tiện là (x¯- ν)σ. Gọi kích thước hiệu ứngb, sau đó giá trị mong đợi của Z Là bn--√.
Dành cho Z CDF là Φ ( z) = 0,5 + 0,5 ⋅ e r f(z2√). Trong đó erf (x) là hàm lỗi.
Dĩ nhiên Z thống kê là một biến ngẫu nhiên, ở đây chúng ta sẽ xem xét mối quan hệ giữa kích thước mẫu và giá trị p cho giá trị mong đợi của Z.
Theo sau đó là CDF của Z thống kê là Φ ( z) = 0,5 + 0,5 ⋅ e r f(bn√2√)
Đây là mối quan hệ giữa giá trị p và cỡ mẫu
p = 0,5 - 0,5 ⋅ e r f(bn√2√)
Mối quan hệ thay đổi theo giá trị của n. Cho rất lớnnchúng ta có thể sử dụng một chuỗi mở rộng để xem hành vi giới hạn. Theo wolfram alpha đó là:
limn → ∞p =e- 0,5b2n(1e bn√+ O (1( bn√)2) )
Đó là một sự phân rã khá nhanh về 0. Có sự phụ thuộc lớn vào kích thước hiệu ứng, tất nhiên nếu sự khác biệt giữa các phương tiện lớn hơn thì giá trị p sẽ co lại nhanh hơn khi việc lấy mẫu của bạn được cải thiện.
Một lần nữa, hãy nhớ rằng điều này chỉ dành cho thử nghiệm Z và T, nó không áp dụng cho các thử nghiệm khác.