Báo cáo mức độ tự do cho bài kiểm tra tiếng Wales


14

Phép thử t của Welch cho các phương sai không bằng nhau (còn được gọi là WelchTHER Satterthwaite hoặc Welch-Aspin) thường có mức độ tự do không nguyên . Làm thế nào những mức độ tự do này được trích dẫn khi báo cáo kết quả của bài kiểm tra?

"Thông thường là làm tròn xuống số nguyên gần nhất trước khi tham khảo các bảng t tiêu chuẩn" theo nhiều nguồn khác nhau * - điều này có nghĩa là hướng làm tròn này là bảo thủ. ** Một số phần mềm thống kê cũ cũng sẽ làm điều này (ví dụ: Graphpad Prism trước phiên bản 6 ) và một số máy tính trực tuyến vẫn làm. Nếu thủ tục này đã được sử dụng, báo cáo mức độ tự do làm tròn có vẻ phù hợp. (Mặc dù sử dụng một số phần mềm tốt hơn có thể phù hợp hơn nữa!)

Nhưng phần lớn các gói hiện đại sử dụng phần phân số nên trong trường hợp này có vẻ như phần này nên được trích dẫn. Tôi không thể thấy nó phù hợp để trích dẫn hơn hai chữ số thập phân, vì một phần nghìn mức độ tự do sẽ chỉ có tác động không đáng kể đến giá trị p .

Nhìn quanh học giả Google, tôi có thể thấy các bài báo trích dẫn df dưới dạng một số nguyên, với một chữ số thập phân hoặc có hai chữ số thập phân. Có hướng dẫn nào về độ chính xác để sử dụng không? Ngoài ra, nếu phần mềm sử dụng phần phân đoạn đầy đủ, thì df được trích dẫn phải được làm tròn xuống đến số lượng hình mong muốn (ví dụ: đến 1 dp hoặc như một số nguyên) phù hợp với Tính toán bảo thủ, hoặc có vẻ hợp lý hơn đối với tôi, được làm tròn theo quy ước ( tới mức gần nhất ) sao cho đến 1 dp hoặc cho toàn bộ gần nhất?7.5845...7.577.5845...7.68

Chỉnh sửa: ngoài việc biết cách báo cáo lý thuyết nhất về df không nguyên, thì cũng tốt để biết mọi người làm gì trong thực tế . Có lẽ các tạp chí và hướng dẫn phong cách có yêu cầu riêng của họ. Tôi sẽ tò mò những gì hướng dẫn phong cách có ảnh hưởng như APA yêu cầu. Từ những gì tôi có thể nhận thấy (hướng dẫn của họ không có sẵn miễn phí trực tuyến), APA có một ưu tiên chung là hầu hết mọi thứ sẽ xuất hiện ở hai vị trí thập phân, ngoại trừ giá trị p (có thể là hai hoặc ba dp) và tỷ lệ phần trăm (làm tròn đến phần trăm gần nhất) - bao gồm độ dốc hồi quy, thống kê t , thống kê F ,χ2thống kê và như vậy. Điều này khá phi logic, lưu ý rằng vị trí thập phân thứ hai chiếm một con số có ý nghĩa rất khác nhau và cho thấy độ chính xác khá khác nhau, trong 2,47 so với 982,47, nhưng có thể giải thích số lượng Welch df với hai vị trí thập phân mà tôi thấy trong mẫu không khoa học của mình .

ví dụ: Ruxton, GD Bài kiểm tra phương sai không bằng nhau là một cách thay thế không được sử dụng cho bài kiểm tra t của Sinh viên và bài kiểm tra MannTHER Whitney U , Sinh thái học hành vi (Tháng 7/8/2006) 17 (4): 688-690 doi: 10.1093 / Beheco / hòm

Mặc dù chính phép gần đúng của Welch-Satterthwaite có thể có hoặc không bảo thủ, và trong trường hợp không bảo thủ, làm tròn các bậc tự do không đảm bảo cho việc bù tổng thể.


1
Tôi đã không nghiên cứu thực tế thực tế - đó là lý do tại sao đây là một nhận xét và không phải là một câu trả lời - nhưng tôi hy vọng nó sẽ được dựa trên phán đoán liên quan đến việc báo cáo các số liệu quan trọng. Đối với df tương đối cao, thường thì thay đổi ở vị trí thập phân đầu tiên sẽ không thay đổi giá trị p (theo mức độ chính xác được báo cáo), do đó làm tròn thành một số nguyên là tốt. Đối với df rất thấp và giá trị cực đoan của t , đạo hàm | νtthể vượt quá0,01, cho thấy trong trường hợp này đóνnên được báo cáo cho chỉ có một con số đáng kể ít hơnpriêng của mình. |νFν(t)|0.01νp
whuber

@whuber Đó thực sự là một quan sát hữu ích, đặc biệt khi được thực hiện cùng với câu trả lời của Glen_b. Làm thế nào thấp là "rất thấp" cho ? (Sự nghi ngờ của tôi từ mẫu giấy tờ mà tôi đã gặp là "thực tế thực tế" có thể không giống với "thực hành tốt"! để biết hướng dẫn báo cáo phổ biến là gì.)ν
Silverfish

Câu trả lời:


10

Tôi chưa nghiên cứu thực tế thực tế, vì vậy câu trả lời này không thể giải quyết khía cạnh đó của câu hỏi. Theo nguyên tắc chung, tôi hy vọng việc xử lý các chữ số có nghĩa trong báo cáo mức độ tự do (df) sẽ dựa trên phán đoán liên quan đến các số liệu quan trọng.

Nguyên tắc là phải nhất quán : sử dụng độ chính xác trong một đại lượng phù hợp với độ chính xác được sử dụng trong một đại lượng khác có liên quan đến nó. Cụ thể, khi báo cáo giá trị y = f ( x ) khi x được đưa cho bội số gần nhất của một giá trị nhỏ h (chẳng hạn như h = 1xy=f(x)xhcho sáu vị trí sau dấu thập phân), độ chính xác tương đối tính theoy đượctrung gian bởi hàmfh=12×106yf

suphkh|f(x+k)f(x)|h|ddxf(x)|.

Phép tính gần đúng áp dụng khi liên tục khác nhau trên khoảng [ x - h , x + h ] .f[xh,x+h]

Trong ứng dụng hiện tại, là giá trị p , x là bậc tự do νypxν

y=f(x)=f(ν)=Fν(t)

nơi là số liệu thống kê Welch-Satterthwaite và F ν là CDF của Student t phân phối với ν bậc tự do.tFνtν

Đối với df khá cao , thường là một sự thay đổi ở vị trí thập phân đầu tiên sẽ không thay đổi giá trị p ở tất cả (với mức độ chính xác báo cáo), do đó làm tròn đến một số nguyên là tốt ( h = 1 / 2 nhưng h | dνh=1/2rất nhỏ). Đối với các giá trị df rất thấp và cực trị của thống kêt, độ lớn của đạo hàm| h|ddxf(x)|tthể vượt quá0,01, cho thấy trong trường hợp này đóνnên được báo cáo cho chỉ có một nơi ít thập phân hơnpriêng của mình.|νFν(t)|0.01νp

Xem cho chính mình với biểu đồ đường viền được dán nhãn này về độ lớn của đạo hàm cho df thấp nhất (hợp lý) và phạm vi điều đó sẽ được quan tâm (bởi vì chúng có thể dẫn đến giá trị p thấp).|t|

Figure

Các nhãn hiển thị logarit cơ sở 10 của đạo hàm. Do đó, tại các điểm giữa - ( k + 1 ) trên cốt truyện này, thay đổi df báo cáo trong j thứ diễn ra sau dấu thập phân có khả năng sẽ thay đổi được báo cáo p-giá trị duy nhất trong ( j + k ) thứ và sau đó nơi. Ví dụ: giả sử bạn làm tròn giá trị p thành 10 - 6 (sáu chữ số thập phân). Hãy xem xét các số liệu thống kê ν = 2,5t = 8 . Những vị trí này nằm gần - 3k(k+1)jth(j+k)th106ν=2.5t=83đăng nhập đường viền. Do đó, nên được báo cáo thành 6 + ( - 3 ) = 3 chữ số thập phân.ν6+(3)=3

Các khu vực màu xanh nhạt, đối với lớn nhất , là những điều đáng quan tâm, bởi vì chúng cho thấy những thay đổi nhỏ trong ν có ảnh hưởng lớn nhất đến giá trị p.kν

Tương phản điều này với tình huống cho df cao hơn (từ đến 30 hiển thị):430

Figure 2

Sự ảnh hưởng của về độ chính xác của p nhanh chóng suy yếu như ν tăng.νpν


1
Đây là một đóng góp rất hữu ích cho việc thiết lập theo những nguyên tắc nào người ta phải làm tròn mức độ tự do (+50!); Tôi hy vọng một người trả lời sau này có thể điền vào những khoảng trống về thực hành thực tế.
Cá bạc

7

Thông thường làm tròn xuống số nguyên gần nhất trước khi tham khảo các bảng t tiêu chuẩn

Lý do đó là một quy ước là vì các bảng không có df noninteger. Không có lý do để làm điều đó khác.

Điều này có ý nghĩa vì sự điều chỉnh này là bảo thủ.

Chà, thống kê không thực sự có phân phối t, bởi vì mẫu số bình phương của anh ta không thực sự có phân phối chi bình phương tỷ lệ. Đó là một xấp xỉ có thể có hoặc không bảo thủ trong một số trường hợp cụ thể - làm tròn df xuống có thể không chắc chắn là bảo thủ khi chúng tôi xem xét phân phối chính xác của thống kê trong một trường hợp cụ thể.

(bằng cách nội suy hoặc bằng cách thực sự crunch các số cho phân phối t với df đó?)

Giá trị p từ các phân phối t (áp dụng cdf cho thống kê t) có thể được tính bằng nhiều phép tính gần đúng khá chính xác, do đó chúng được tính toán hiệu quả thay vì được nội suy.

Tôi không thể thấy nó phù hợp để trích dẫn đến hơn hai chữ số thập phân

Tôi đồng ý.

Có hướng dẫn nào về độ chính xác để sử dụng không?

Một khả năng có thể là điều tra mức độ gần đúng của Welch-Satterthwaite cho giá trị p nằm trong vùng tỷ lệ phương sai chung đó và không trích dẫn độ chính xác tương đối nhiều hơn so với đề xuất trong df (lưu ý rằng df trên chi bình phương trong hình vuông của mẫu số chỉ đưa ra một xấp xỉ cho một cái gì đó không phải là bình phương chi dù sao).


1
Tôi nên làm rõ lại "làm tròn xuống là bảo thủ". Bản thân xấp xỉ Welch-Satterthwaite có thể hoặc không thể bảo thủ. Nhưng quá trình làm tròn xuống chắc chắn là - nếu bắt đầu gần đúng không bảo thủ, thì ít nhất nó sẽ kém hơn sau khi làm tròn xuống. Ngược lại, làm tròn số (ví dụ: "7.5845 vòng gần nhất 8") chắc chắn không phải là điều chỉnh bảo thủ. Tôi có thể làm với việc tìm một cách tốt hơn để diễn đạt điều này, nhưng tôi hy vọng quan điểm của tôi là rõ ràng!
Cá bạc

"Một khả năng có thể là điều tra mức độ gần đúng của Welch-Satterthwaite cho giá trị p nằm trong vùng tỷ lệ phương sai chung đó" - điều này rất hợp lý và dường như là cách tiếp cận nguyên tắc. Đây có phải là một cái gì đó thường được thực hiện? Một số gợi ý để thực hiện sẽ là tốt đẹp. Trong thực tế tôi nghi ngờ hướng dẫn phong cách tạp chí thường có tiếng nói cuối cùng về vấn đề này! Nhưng tôi không biết họ nói gì - chắc chắn có nhiều cách thực hành trong các bài báo mà tìm kiếm của tôi xuất hiện.
Cá bạc

Để cố gắng tránh nhầm lẫn cho độc giả trong tương lai, tôi đã cố gắng làm rõ lại việc làm tròn bảo thủ trong cơ thể câu hỏi. Cảm ơn đã chọn nó lên.
Cá bạc

I don't think anything like it is commonly done, but I don't think that means it shouldn't be. How much of explaining why one rounds/truncates to a certain point gets into the paper would clearly depend on the journal/editor/referees.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.