Bây giờ tôi hiểu rõ hơn những gì đã làm tôi lo lắng về các bài kiểm tra t ghép đôi và không ghép đôi và các giá trị p liên quan. Tìm ra đã là một hành trình thú vị, và đã có nhiều bất ngờ trên đường đi. Một bất ngờ đã xảy ra từ một cuộc điều tra về sự đóng góp của Michael. Điều này là không thể chấp nhận được về mặt lời khuyên thực tế. Hơn nữa, anh ấy nói những gì tôi nghĩ hầu như tất cả các nhà thống kê đều tin, và anh ấy có một vài sự ủng hộ để ủng hộ điều này. Tuy nhiên, như một phần của lý thuyết, nó không đúng theo nghĩa đen. Tôi đã phát hiện ra điều này bằng cách tìm ra các công thức cho các giá trị p, và sau đó suy nghĩ cẩn thận về cách sử dụng các công thức để dẫn đến các ví dụ ngược. Tôi là một nhà toán học bằng cách đào tạo, và ví dụ phản biện là một "ví dụ phản biện của nhà toán học". Đó không phải là thứ bạn sẽ bắt gặp trong các số liệu thống kê thực tế, điều mà tôi đã cố gắng tìm hiểu khi tôi hỏi câu hỏi ban đầu của mình.
Đây là mã R đưa ra ví dụ ngược lại:
vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
X <- rnorm(vLength)
Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
Paired <- t.test(X,Y,var.equal=T,paired=T)
NotPaired <- t.test(X,Y,var.equal=T,paired=F)
c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))
Lưu ý các tính năng sau: X và Y là hai bộ 10 có sự khác biệt rất lớn và gần như không đổi. Đối với nhiều số liệu quan trọng, tương quan là 1.000 .... Giá trị p cho thử nghiệm không ghép đôi nhỏ hơn khoảng 10 ^ 40 lần so với giá trị p cho thử nghiệm được ghép nối. Vì vậy, điều này mâu thuẫn với tài khoản của Michael, với điều kiện người ta đọc tài khoản của anh ta theo nghĩa đen, theo kiểu nhà toán học. Ở đây kết thúc một phần câu trả lời của tôi liên quan đến câu trả lời của Michael.
Dưới đây là những suy nghĩ được nhắc nhở bởi câu trả lời của Peter. Trong cuộc thảo luận về câu hỏi ban đầu của tôi, tôi đã phỏng đoán trong một nhận xét rằng hai phân phối cụ thể của các giá trị p có âm thanh khác nhau trên thực tế là giống nhau. Bây giờ tôi có thể chứng minh điều này. Điều quan trọng hơn là bằng chứng cho thấy bản chất cơ bản của giá trị p, cơ bản đến nỗi không có văn bản nào (mà tôi bắt gặp) cả hai phải giải thích. Có thể tất cả các nhà thống kê chuyên nghiệp đều biết bí mật, nhưng với tôi, định nghĩa về giá trị p luôn có vẻ kỳ lạ và giả tạo. Trước khi cho đi bí mật của nhà thống kê, hãy để tôi chỉ định câu hỏi.
Đặt và chọn ngẫu nhiên và độc lập hai ngẫu nhiên từ một số phân phối bình thường. Có hai cách để nhận giá trị p từ lựa chọn này. Một là sử dụng thử nghiệm t không ghép đôi, và thứ hai là sử dụng thử nghiệm t ghép đôi. Phỏng đoán của tôi là sự phân phối các giá trị p mà người ta nhận được là giống nhau trong hai trường hợp. Khi tôi mới bắt đầu nghĩ về nó, tôi đã quyết định rằng phỏng đoán này là điên rồ và sai: bài kiểm tra không ghép đôi có liên quan đến thống kê t trên bậc tự do, và bài kiểm tra ghép nối với một t- thống kê vềnn > 1nn - 12 ( n - 1 )n - 1bậc tự do. Hai phân phối này là khác nhau, vậy làm thế nào trên trái đất các phân phối giá trị p có thể giống nhau? Chỉ sau khi suy nghĩ nhiều hơn, tôi mới nhận ra rằng sự bác bỏ rõ ràng này của tôi là quá dễ dãi.
Câu trả lời đến từ những cân nhắc sau đây. Giả sử là một pdf liên tục (nghĩa là tích phân của nó có giá trị một). Thay đổi tọa độ sẽ chuyển đổi phân phối liên quan thành phân phối đồng đều trên . Công thức là
và điều này được giải thích rất nhiều trong nhiều văn bản. Điều mà các văn bản không chỉ ra trong bối cảnh của các giá trị p là đây chính xác là công thức mang lại giá trị p từ thống kê t, khi[ 0 , 1 ] p = ∫ ∞ t f (f: ( 0 , ∞ ) → ( 0 , ∞ )[ 0 , 1 ]f ( - ∞ , ∞ ) [ 0 , ∞ )
p = ∫∞tf( s )dS
flà pdf cho phân phối t. (Tôi đang cố gắng duy trì cuộc thảo luận đơn giản nhất có thể, bởi vì nó thực sự đơn giản. Một cuộc thảo luận đầy đủ hơn sẽ đối xử với các thử nghiệm t một mặt và hai mặt hơi khác nhau, các yếu tố của 2 có thể phát sinh và thống kê t có thể nằm trong thay vì trong . Tôi bỏ qua tất cả sự bừa bộn đó.)
( - ∞ , ∞ )[ 0 , ∞ )
Chính xác cùng một cuộc thảo luận áp dụng khi tìm giá trị p liên quan đến bất kỳ phân phối tiêu chuẩn nào khác trong thống kê. Một lần nữa, nếu dữ liệu được phân phối ngẫu nhiên (lần này theo một số phân phối khác nhau), thì các giá trị p kết quả sẽ được phân phối đồng đều trong .[ 0 , 1 ]
Làm thế nào điều này áp dụng cho các bài kiểm tra t ghép đôi và không ghép đôi của chúng tôi? Điểm này nằm trong thử nghiệm t được ghép nối, với các mẫu được chọn độc lập và ngẫu nhiên, như trong mã của tôi ở trên, giá trị của t thực sự tuân theo phân phối t (với độ tự do). Vì vậy, các giá trị p xuất phát từ việc sao chép lựa chọn X và Y nhiều lần tuân theo phân phối đồng đều trên . Điều tương tự cũng đúng với phép thử t không ghép đôi, mặc dù lần này phân phối t có bậc tự do. Tuy nhiên, giá trị p mà kết quả cũng có phân phối đồng đều trên , theo đối số chung tôi đã đưa ra ở trên. Nếu mã của Peter ở trên được áp dụng để xác định giá trị p, thì chúng ta sẽ có hai phương pháp riêng biệt để vẽ một mẫu ngẫu nhiên từ phân phối thống nhất trên[ 0 , 1 ] 2 ( n - 1 ) [ 0 , 1 ] [ 0 , 1 ]n - 1[ 0 , 1 ]2 ( n - 1 )[ 0 , 1 ][ 0 , 1 ] . Tuy nhiên hai câu trả lời không độc lập.