Biểu đồ hộp so với khoảng Tukey-Kramer


10

Tài liệu trợ giúp "notch" ( hoặc văn bản gốc ) từ boxplot trong 'R' đưa ra các thông tin sau:

Nếu các rãnh của hai ô không trùng nhau thì đây là 'bằng chứng mạnh mẽ' cho thấy hai trung vị khác nhau (Chambers et al, 1983, p. 62). Xem boxplot.stats để biết các tính toán được sử dụng.

và ' boxplot.stats ' đưa ra những điều sau đây:

Các rãnh (nếu được yêu cầu) mở rộng đến +/- 1,58 IQR / sqrt (n). Điều này dường như được dựa trên các tính toán tương tự như công thức với 1,57 trong Chambers et al (1983, p. 62), được đưa ra trong McGill et al (1978, p. 16). Chúng dựa trên sự bình thường tiệm cận của kích thước mẫu trung bình và gần bằng nhau cho hai trung vị được so sánh, và được cho là khá nhạy cảm với các phân phối cơ bản của các mẫu. Ý tưởng dường như là đưa ra khoảng tin cậy khoảng 95% cho sự khác biệt ở hai trung vị.

Bây giờ tôi đã quen thuộc hơn với việc sử dụng phiên bản JMP của thử nghiệm Tukey-Kramer để so sánh các phương tiện của các cột. Tài liệu cho JMP cung cấp cho điều này:

Hiển thị một bài kiểm tra có kích thước cho tất cả sự khác biệt giữa các phương tiện. Đây là bài kiểm tra Tukey hoặc Tukey-Kramer HSD (sự khác biệt có ý nghĩa trung thực). (Tukey 1953, Kramer 1956). Thử nghiệm này là thử nghiệm cấp độ alpha chính xác nếu kích thước mẫu giống nhau và bảo thủ nếu kích thước mẫu khác nhau (Hayter 1984).

Câu hỏi: Bản chất của mối liên hệ giữa hai phương pháp là gì? Có cách nào để biến đổi cái này thành cái kia không?

Có vẻ như người ta đang tìm kiếm khoảng 95% CI cho trung vị và xác định xem có sự trùng lặp hay không; và cái còn lại là "thử nghiệm alpha chính xác" (các mẫu của tôi có cùng kích thước) để xác định xem trung vị của hai bộ mẫu có nằm trong phạm vi hợp lý của nhau không.

Tôi tham khảo các gói, nhưng tôi quan tâm đến toán học đằng sau logic.

Câu trả lời:


11

Theo như boxplot được ghi chú, tài liệu tham khảo McGill et al [1] được đề cập trong câu hỏi của bạn có chứa các chi tiết khá đầy đủ (không phải tất cả mọi thứ tôi nói ở đây đều được đề cập rõ ràng ở đó, nhưng tuy nhiên nó đủ chi tiết để tìm ra nó).

Khoảng này là một khoảng mạnh mẽ nhưng dựa trên Gaussian

MR

M±1.7×1.25R/(1.35N)

Ở đâu:

  • 1.35σσR/1.35σ

  • 1.2514nf02f0f012πσ0.3989σ12Nf0=π/2σ/N1.253σ/N

    N

    1.25R/(1.35N)

  • Vì vậy, tất cả những gì còn lại để thảo luận là yếu tố 1.7.

    Lưu ý rằng nếu chúng ta so sánh một mẫu với một giá trị cố định (giả sử trung bình giả định), chúng ta sẽ sử dụng 1,96 cho thử nghiệm 5%; do đó, nếu chúng ta có hai lỗi tiêu chuẩn rất khác nhau (một tương đối lớn, một rất nhỏ), đó sẽ là về yếu tố sử dụng (vì nếu null là đúng, sự khác biệt sẽ gần như hoàn toàn do sự thay đổi của một lỗi lớn hơn lỗi tiêu chuẩn và lỗi nhỏ có thể - xấp xỉ - được coi là đã được sửa chữa một cách hiệu quả).

    1.96/21.386

    rr:11.96/1+1/r

Đặt tất cả chúng (1.35,1.25 và 1.7) lại với nhau cho khoảng 1,57. Một số nguồn nhận được 1,58 bằng cách tính chính xác hơn 1,35 hoặc 1,25 (hoặc cả hai) nhưng như một sự thỏa hiệp giữa 1.386 và 1.96, 1.7 đó thậm chí không chính xác với hai con số quan trọng (đó chỉ là giá trị thỏa hiệp của sân bóng), vì vậy độ chính xác bổ sung là vô nghĩa (họ có thể vừa làm tròn toàn bộ thành 1.6 và được thực hiện với nó).

Lưu ý rằng không có điều chỉnh cho nhiều so sánh ở bất cứ đâu ở đây.


Có một số điểm tương đồng khác biệt trong giới hạn độ tin cậy đối với sự khác biệt trong Tukey-Kramer HSD :

y¯iy¯j±qα;k;Nk2σ^ε1ni+1nj

Nhưng lưu ý rằng

  • c.1ni+1njk.1nik.1nj1.961.96/2

  • nó dựa trên phương tiện, không phải trung bình (vì vậy không có 1.35)

  • q2

Vì vậy, trong khi một số ý tưởng đằng sau hình thức các thành phần có phần giống nhau, thì chúng thực sự khá khác biệt trong những gì chúng đang làm.

[1] McGill, R., Tukey, JW và Larsen, WA (1978) Biến thể của các ô vuông. Thống kê người Mỹ 32, 12 bóng16.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.