Bởi vì, giả sử lỗi bình thường có hiệu quả tương tự như giả định rằng lỗi lớn không xảy ra! Phân phối bình thường có đuôi rất nhẹ, các lỗi nằm ngoài độ lệch chuẩn có xác suất rất thấp, các lỗi nằm ngoài độ lệch chuẩn ± 6 thực sự không thể xảy ra. Trong thực tế, giả định đó hiếm khi đúng. Khi phân tích các bộ dữ liệu nhỏ, gọn gàng từ các thí nghiệm được thiết kế tốt, điều này có thể không quan trọng lắm, nếu chúng ta phân tích tốt các phần dư. Với dữ liệu chất lượng kém hơn, nó có thể quan trọng hơn nhiều.±3±6
Khi sử dụng các phương pháp dựa trên khả năng (hoặc bayesian), tác động của tính quy phạm này (như đã nói ở trên, đây thực sự là "không có lỗi lớn" - giả định!) Là làm cho suy luận rất ít mạnh mẽ. Kết quả phân tích bị ảnh hưởng quá nhiều bởi các lỗi lớn! Điều này phải là như vậy, vì giả sử "không có lỗi lớn" buộc các phương thức của chúng tôi phải hiểu các lỗi lớn là lỗi nhỏ và điều đó chỉ có thể xảy ra bằng cách di chuyển tham số giá trị trung bình để làm cho tất cả các lỗi nhỏ hơn. Một cách để tránh điều đó là sử dụng cái gọi là "phương pháp mạnh mẽ", xem http://web.archive.org/web/20160611192739/http://www.stats.ox.ac.uk/pub/StatMeth/Robust .pdf
Nhưng Andrew Gelman sẽ không thực hiện điều này, vì các phương pháp mạnh mẽ thường được trình bày theo một cách rất phi thường. Sử dụng các lỗi phân phối t trong các mô hình khả năng / bayesian là một cách khác nhau để có được các phương thức mạnh mẽ, vì phân phối có đuôi nặng hơn bình thường, do đó cho phép tỷ lệ lớn hơn của các lỗi lớn. Số lượng mức độ của tham số tự do nên được cố định trước, không được ước tính từ dữ liệu, vì ước tính như vậy sẽ phá hủy các thuộc tính mạnh mẽ của phương thức (*) (đây cũng là một vấn đề rất khó, hàm khả năng cho ν , số mức độ tự do, có thể không bị ràng buộc, dẫn đến các công cụ ước tính rất không hiệu quả (thậm chí không nhất quán).tν
Ví dụ, nếu bạn nghĩ (sợ) rằng cứ 1 trong 10 quan sát có thể là "lỗi lớn" (trên 3 sd), thì bạn có thể sử dụng phân phối với 2 bậc tự do, tăng số đó nếu tỷ lệ lỗi lớn được cho là nhỏ hơn.t
Tôi nên lưu ý rằng những gì tôi đã nói ở trên là dành cho các mô hình có lỗi phân phối độc lập . Hiện cũng đã được đề nghị của đa biến t -distribution (mà không phải là độc lập) như phân phối lỗi. Propsal đó là chỉ trích nặng nề trong giấy "quần áo mới của hoàng đế: một bài phê bình của đa biến t mô hình hồi quy" của TS Breusch, JC Robertson và AH Welsh, trong Statistica Neerlandica (1997) Vol. 51, số 3, tr. 269-286, nơi họ chỉ ra rằng đa biến t phân phối lỗi là theo kinh nghiệm không thể phân biệt từ bình thường. Nhưng sự chỉ trích đó không ảnh hưởng đến mô hình t độc lập . ttttt
(*) Một tài liệu tham khảo nêu rõ điều này là MASS của Venables & Ripley --- Thống kê ứng dụng hiện đại với S (trên trang 110 trong phiên bản thứ 4).