Tôi sẽ không gọi 'số mũ' đặc biệt rất lệch. Nhật ký của nó rõ ràng là lệch trái, ví dụ, và độ lệch của nó chỉ là 2.
1) Sử dụng kiểm tra t với dữ liệu theo cấp số nhân và n gần 500 là ổn :
a) Tử số của thống kê kiểm tra sẽ ổn: Nếu dữ liệu là số mũ độc lập với thang đo chung (và không nặng hơn đuôi), thì trung bình của chúng được phân phối gamma với tham số hình dạng bằng số lượng quan sát. Phân phối của nó trông rất bình thường đối với tham số hình dạng lớn hơn khoảng 40 hoặc hơn (tùy thuộc vào độ chính xác của đuôi bạn cần bao xa).
Điều này có khả năng chứng minh toán học, nhưng toán học không phải là khoa học. Dĩ nhiên, bạn có thể kiểm tra nó qua mô phỏng, nhưng nếu bạn sai về cấp số nhân, bạn có thể cần các mẫu lớn hơn. Đây là phân phối của tổng mẫu (và do đó, nghĩa là mẫu) của dữ liệu theo cấp số nhân trông như thế nào khi n = 40:
Xiên rất nhẹ. Độ lệch này giảm khi căn bậc hai của cỡ mẫu. Vì vậy, tại n = 160, nó chỉ bằng một nửa. Tại n = 640, một phần tư là xiên:
Rằng điều này là đối xứng hiệu quả có thể được nhìn thấy bằng cách lật nó về giá trị trung bình và vẽ nó trên đầu trang:
Màu xanh là bản gốc, màu đỏ được lật. Như bạn thấy, chúng gần như trùng hợp.
-
n = 40
n = 500
-
c) Tuy nhiên, điều thực sự quan trọng là sự phân phối của toàn bộ thống kê dưới giá trị null. Định mức của tử số là không đủ để làm cho thống kê t có phân phối t. Tuy nhiên, trong trường hợp dữ liệu theo cấp số nhân, đó cũng không phải là vấn đề lớn:
n = 40n = 500n = 500
Tuy nhiên, lưu ý rằng đối với dữ liệu thực sự theo cấp số nhân, độ lệch chuẩn sẽ chỉ khác nhau nếu phương tiện khác nhau. Nếu giả định theo cấp số nhân là trường hợp, thì theo null, không cần phải lo lắng về các phương sai dân số khác nhau, vì chúng chỉ xảy ra theo phương án thay thế. Vì vậy, một thử nghiệm t phương sai bằng nhau vẫn sẽ ổn (trong trường hợp gần đúng tốt nhất mà bạn thấy trong biểu đồ thậm chí có thể tốt hơn một chút).
2) Ghi nhật ký vẫn có thể cho phép bạn hiểu ý nghĩa của nó, mặc dù
đăng nhậpλ1≠ logλ2λ1≠ λ2
[Nếu bạn thực hiện kiểm tra đó trong nhật ký, tôi sẽ có xu hướng đề nghị thực hiện kiểm tra phương sai bằng nhau trong trường hợp đó.]
Vì vậy - với sự can thiệp đơn thuần có lẽ là một hoặc hai câu biện minh cho kết nối, tương tự như những gì tôi có ở trên - bạn sẽ có thể viết kết luận của mình không phải về nhật ký của số liệu tham gia, mà là về chính số liệu tham gia.
3) Có rất nhiều thứ khác bạn có thể làm!
a) bạn có thể làm một bài kiểm tra phù hợp với dữ liệu theo cấp số nhân. Thật dễ dàng để có được một thử nghiệm dựa trên tỷ lệ khả năng. Khi điều đó xảy ra, đối với dữ liệu theo cấp số nhân, bạn có được một thử nghiệm F mẫu nhỏ (dựa trên tỷ lệ phương tiện) cho tình huống này trong trường hợp một đuôi; LRT hai đuôi thường không có tỷ lệ bằng nhau ở mỗi đuôi đối với cỡ mẫu nhỏ. (Điều này sẽ có sức mạnh tốt hơn so với thử nghiệm t, nhưng sức mạnh cho thử nghiệm t sẽ khá hợp lý và tôi hy vọng sẽ không có nhiều sự khác biệt ở kích thước mẫu của bạn.)
b) bạn có thể thực hiện kiểm tra hoán vị - thậm chí dựa trên kiểm tra t nếu bạn muốn. Vì vậy, điều duy nhất thay đổi là tính toán của giá trị p. Hoặc bạn có thể thực hiện một số thử nghiệm lấy mẫu lại khác, chẳng hạn như thử nghiệm dựa trên bootstrap. Điều này sẽ có sức mạnh tốt, mặc dù nó sẽ phụ thuộc một phần vào thống kê kiểm tra mà bạn chọn liên quan đến phân phối bạn có.
c) bạn có thể thực hiện một bài kiểm tra không tham số dựa trên xếp hạng (chẳng hạn như Wilcoxon-Mann-Whitney). Nếu bạn giả sử rằng nếu các phân phối khác nhau, thì chúng chỉ khác nhau bởi một yếu tố tỷ lệ (phù hợp với nhiều phân phối sai lệch bao gồm cả số mũ), thì bạn thậm chí có thể có được khoảng tin cậy cho tỷ lệ của các tham số tỷ lệ.
[Vì mục đích đó, tôi khuyên bạn nên làm việc theo thang đo log (sự thay đổi vị trí trong các bản ghi là nhật ký của sự thay đổi tỷ lệ). Nó sẽ không thay đổi giá trị p, nhưng nó sẽ cho phép bạn lũy thừa ước tính điểm và giới hạn CI để có được một khoảng cho sự thay đổi tỷ lệ.]
Điều này cũng vậy, có xu hướng có sức mạnh khá tốt nếu bạn ở trong tình huống theo cấp số nhân, nhưng có thể không tốt bằng sử dụng thử nghiệm t.
Một tham chiếu xem xét một tập hợp các trường hợp rộng hơn đáng kể cho sự thay thế dịch chuyển vị trí (ví dụ với cả sự không đồng nhất về phương sai và độ lệch trong giá trị null) là
Fagerland, MW và L. Sandvik (2009),
"Hiệu suất của năm thử nghiệm vị trí hai mẫu cho các phân phối sai lệch với phương sai không bằng nhau,"
Các thử nghiệm lâm sàng đương đại , 30 , 490 phản 496
Nó thường có xu hướng đề xuất thử nghiệm U của Welch (một trong những thử nghiệm cụ thể được xem xét bởi Welch và là thử nghiệm duy nhất mà họ đã thử nghiệm). Nếu bạn không sử dụng chính xác cùng một thống kê tiếng Wales, các khuyến nghị có thể thay đổi phần nào (mặc dù có thể không nhiều). [Lưu ý rằng nếu các bản phân phối của bạn theo cấp số nhân, bạn sẽ quan tâm đến một giải pháp thay thế quy mô trừ khi bạn ghi nhật ký ... trong trường hợp đó bạn sẽ không có phương sai không bằng nhau.]