Tôi có một bộ dữ liệu với hàng chục ngàn quan sát về dữ liệu chi phí y tế. Dữ liệu này rất lệch về bên phải và có rất nhiều số không. Dường như thế này cho hai nhóm người (trong trường hợp này là hai nhóm tuổi với> 3000 obs mỗi người):
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 0.0 0.0 4536.0 302.6 395300.0
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.0 0.0 0.0 4964.0 423.8 721700.0
Nếu tôi thực hiện kiểm tra t của Welch trên dữ liệu này, tôi sẽ nhận được kết quả:
Welch Two Sample t-test
data: x and y
t = -0.4777, df = 3366.488, p-value = 0.6329
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-2185.896 1329.358
sample estimates:
mean of x mean of y
4536.186 4964.455
Tôi biết nó không đúng khi sử dụng kiểm tra t trên dữ liệu này vì nó rất không bình thường. Tuy nhiên, nếu tôi sử dụng thử nghiệm hoán vị cho sự khác biệt của phương tiện, tôi sẽ nhận được gần như cùng một giá trị p mọi lúc (và nó trở nên gần hơn với nhiều lần lặp hơn).
Sử dụng gói perm trong R và permTS với Monte Carlo chính xác
Exact Permutation Test Estimated by Monte Carlo
data: x and y
p-value = 0.6188
alternative hypothesis: true mean x - mean y is not equal to 0
sample estimates:
mean x - mean y
-428.2691
p-value estimated from 500 Monte Carlo replications
99 percent confidence interval on p-value:
0.5117552 0.7277040
Tại sao thống kê kiểm tra hoán vị xuất hiện rất gần với giá trị t.test? Nếu tôi lấy nhật ký của dữ liệu thì tôi nhận được giá trị p t.test là 0,28 và tương tự từ phép thử hoán vị. Tôi nghĩ rằng các giá trị kiểm tra t sẽ có nhiều rác hơn những gì tôi đang ở đây. Điều này đúng với nhiều bộ dữ liệu khác mà tôi có như thế này và đang tự hỏi tại sao thử nghiệm t dường như hoạt động khi không nên.
Mối quan tâm của tôi ở đây là chi phí cá nhân không phải là iid Có nhiều nhóm người với sự phân bổ chi phí rất khác nhau (phụ nữ so với nam giới, bệnh mãn tính, v.v.) dường như làm hỏng yêu cầu iid đối với định lý giới hạn trung tâm, hoặc tôi không nên lo lắng về điều đó?