Tôi nghĩ rằng các bài kiểm tra về tính quy phạm có thể hữu ích khi đồng hành với các bài kiểm tra đồ họa. Chúng phải được sử dụng đúng cách, mặc dù. Theo tôi, điều này có nghĩa là không bao giờ nên sử dụng nhiều bài kiểm tra phổ biến, như các bài kiểm tra Shapiro-Wilk, Anderson-Darling và Jarque-Bera.
Trước khi tôi giải thích quan điểm của mình, hãy để tôi đưa ra một vài nhận xét:
- Trong một bài báo thú vị gần đây, Rochon et al. đã nghiên cứu tác động của thử nghiệm Shapiro-Wilk đối với thử nghiệm t hai mẫu. Quy trình hai bước kiểm tra tính quy phạm trước khi thực hiện kiểm tra t không phải là không có vấn đề. Sau đó, một lần nữa, không phải là thủ tục hai bước của điều tra đồ họa bình thường trước khi thực hiện kiểm tra t. Sự khác biệt là tác động của cái sau khó điều tra hơn nhiều (vì nó sẽ yêu cầu một nhà thống kê điều tra đồ họa thông thường lần hoặc hơn ...).100 , 000
- Chẳng hạn, rất hữu ích khi định lượng tính phi quy tắc bằng cách tính độ lệch mẫu, ngay cả khi bạn không muốn thực hiện kiểm tra chính thức.
- Tính quy phạm đa biến có thể khó đánh giá bằng đồ họa và sự hội tụ đến phân phối tiệm cận có thể chậm đối với thống kê đa biến. Do đó, các thử nghiệm về tính quy tắc sẽ hữu ích hơn trong môi trường đa biến.
- Các thử nghiệm về tính quy tắc có lẽ đặc biệt hữu ích cho các học viên sử dụng số liệu thống kê dưới dạng tập hợp các phương pháp hộp đen . Khi tính quy phạm bị từ chối, người hành nghề nên được báo động và, thay vì thực hiện một quy trình chuẩn dựa trên giả định về tính quy tắc, hãy cân nhắc sử dụng một quy trình không tham số, áp dụng chuyển đổi hoặc tư vấn một nhà thống kê có kinh nghiệm hơn.
- Như đã được chỉ ra bởi những người khác, nếu đủ lớn, CLT thường tiết kiệm trong ngày. Tuy nhiên, những gì "đủ lớn" khác nhau cho các lớp phân phối khác nhau.viết sai rồi
(Theo định nghĩa của tôi), một bài kiểm tra về tính quy tắc được hướng tới một lớp các lựa chọn thay thế nếu nó nhạy cảm với các lựa chọn thay thế từ lớp đó, nhưng không nhạy cảm với các lựa chọn thay thế từ các lớp khác. Ví dụ điển hình là các xét nghiệm được hướng tới các lựa chọn thay thế xiên hoặc kurtotic . Các ví dụ đơn giản nhất sử dụng độ lệch mẫu và kurtosis làm thống kê kiểm tra.
Các xét nghiệm có tính định hướng được cho là thường được ưu tiên hơn so với các xét nghiệm omnibus (chẳng hạn như các xét nghiệm Shapiro-Wilk và Jarque-Bera) vì thông thường chỉ có một số loại phi bình thường là mối quan tâm đối với một thủ tục suy luận cụ thể .
Chúng ta hãy xem xét nghiệm của sinh viên là một ví dụ. Giả sử rằng chúng ta có một mẫu iid từ một bản phân phối với độ lệch và (thừa) kurtosisNếu đối xứng về giá trị trung bình của nó, . Cả và đều là 0 cho phân phối bình thường.γ= E( X- μ )3σ3κ = E( X- μ )4σ4- 3.Xγ= 0γκ
Theo các giả định về tính đều đặn, chúng tôi có được sự mở rộng tiệm cận sau cho cdf của thống kê kiểm tra :
Tviết sai rồiP( Tviết sai rồi≤ x ) = Φ ( x ) + n- 1 / 216γ( 2 x2+ 1 ) ϕ ( x )- n- 1x ( 112κ ( x2- 3 ) - 118γ2( x4+ 2 x2- 3 ) - 14( x2+ 3 ) ) ϕ ( x ) + o ( n- 1) ,
trong đó là cdf và là pdf của phân phối chuẩn thông thường.Φ ( ⋅ )ϕ ( ⋅ )
γ xuất hiện lần đầu tiên trong thuật ngữ , trong khi xuất hiện trong thuật ngữ . Các tiệm cận thực hiện là nhiều hơn nữa nhạy cảm với độ lệch từ bình thường dưới dạng độ lệch so với hình thức nhọn.viết sai rồi- 1 / 2κviết sai rồi- 1 T nTviết sai rồi
Nó có thể được xác minh bằng cách sử dụng mô phỏng rằng điều này cũng đúng với nhỏ . Do đó, bài kiểm tra t của Học sinh rất nhạy cảm với độ lệch nhưng tương đối mạnh mẽ đối với các đuôi nặng và điều hợp lý là sử dụng một bài kiểm tra cho tính quy phạm hướng vào các phương án nghiêng trước khi áp dụng bài kiểm tra t .viết sai rồi
Như một quy luật tự nhiên ( không phải là quy luật tự nhiên), suy luận về phương tiện rất nhạy cảm với sự sai lệch và suy luận về phương sai rất nhạy cảm với kurtosis.
Sử dụng một bài kiểm tra trực tiếp cho tính bình thường có lợi ích là có được sức mạnh cao hơn đối với các lựa chọn thay thế '' nguy hiểm '' và sức mạnh thấp hơn đối với các lựa chọn ít '' nguy hiểm '' hơn, có nghĩa là chúng ta ít từ chối sự bình thường vì những sai lệch so với tính bình thường đã thắng 't ảnh hưởng đến hiệu suất của thủ tục suy luận của chúng tôi. Tính phi quy phạm được định lượng theo cách có liên quan đến vấn đề hiện tại. Điều này không phải lúc nào cũng dễ dàng để làm đồ họa.
Khi trở nên lớn hơn, độ lệch và kurtosis trở nên ít quan trọng hơn - và các xét nghiệm theo chỉ đạo có khả năng phát hiện nếu các đại lượng này lệch khỏi 0 thậm chí chỉ một lượng nhỏ. Trong các trường hợp như vậy, chẳng hạn, có vẻ hợp lý để kiểm tra xem hay (nhìn vào thuật ngữ đầu tiên của bản mở rộng ở trên) thay vì liệu . Điều này quan tâm đến một số vấn đề mà chúng ta phải đối mặt khi trở nên lớn hơn.viết sai rồi| γ| ≤1| viết sai rồi- 1 / 216γ( 2 z2α / 2+ 1 ) ϕ ( zα / 2) | ≤ 0,01
γ= 0viết sai rồi