Kiểm tra T chỉ sử dụng dữ liệu tóm tắt trong một ô vuông

Tôi có tóm tắt 5 số (tối thiểu, Q1, Median, Q3, max) từ hai ô vuông và muốn kiểm tra xem trung bình của các nhóm trong hai ô có khác nhau đáng kể hay không.

Tôi muốn làm điều này bằng cách sử dụng kiểm tra t nhưng tôi không có sẵn dữ liệu cho mình (chỉ tóm tắt 5 số).

Có cách nào để kiểm tra sự khác biệt của giá trị trung bình không? Hoặc một xấp xỉ thô cho một bài kiểm tra t? Ngoài ra, tôi biết kích thước mẫu và giá trị trung bình.

t-test boxplot

— James Stanley
nguồn

Bạn có tình cờ biết độ lệch chuẩn là tốt?

— Glen_b -Reinstate Monica

Không, tôi không có. Nếu tôi biết điều đó thì tôi sẽ không gặp phải vấn đề này :)

Có một xấp xỉ với độ lệch chuẩn mà tôi có thể sử dụng không?

Cả hai nhóm đều có cỡ mẫu 30.

Vui lòng chỉnh sửa thông tin có liên quan vào câu hỏi của bạn

— Glen_b -Reinstate Monica

Vì bạn có phương tiện mẫu và giả thuyết của bạn liên quan đến phương tiện dân số, tôi đã giả định rằng bạn chắc chắn sẽ muốn sử dụng phương tiện mẫu trong phần tiếp theo.

Với một số giả định phân phối, bạn chắc chắn có thể nhận được ở đâu đó.

Nếu cỡ mẫu khá lớn, bạn có thể giả định một phân phối để mở rộng quy mô các IQRs để ước tính và chỉ coi nó như một z-test. (n = 30 không thực sự "lớn") $\sigma$

ví dụ như nếu bạn giả bình thường, dân số khoảng tứ phân vị là khoảng 1,35 , vì vậy nếu mẫu là đủ lớn rằng dân IQR được ước tính với ít lỗi, bạn có thể ước lượng và có một bài kiểm tra hiệu quả trong việc bình thường. $\sigma$ $\sigma$

Trong trường hợp này, nếu bạn đừng cho rằng chênh lệch bằng nhau, sau đó bạn sẽ có được , sau đó tính toán và sau đó đi $\tilde{\sigma_i}=\text{IQR}_i/1.35$ $\tilde{\sigma}_D^2 = \tilde{\sigma}_1^2/n_1+\tilde{\sigma}_2^2/n_2$ và tra cứu các bảng z. $z^* = \frac{\bar{x}_1-\bar{x}_2}{\tilde{\sigma}_D}$

[Bằng cách kiểm tra, tôi vừa thực hiện một mô phỏng trong đó tôi đã tạo ra các mẫu bình thường có kích thước 30 (với phương sai bằng nhau, mặc dù tôi không cho rằng nó trong tính toán) và thử nghiệm là chống phản xạ (tức là tỷ lệ lỗi loại I là cao hơn danh nghĩa), vì vậy khi bạn cố gắng thực hiện kiểm tra 5%, có vẻ như bạn thực sự nhận được một nơi nào đó trong khu vực 6,8% (xấp xỉ sẽ có thể tồi tệ hơn một chút nếu phương sai khác nhau). Nếu bạn có thể chịu đựng điều đó, thì có lẽ tốt. Tất nhiên, bạn có thể hạ thấp mức ý nghĩa để bù cho sự chống đối nhưng tôi sẽ có xu hướng cắn viên đạn và thử tùy chọn 2. Tuy nhiên, khi kích thước mẫu đạt 200 hoặc hơn, thì điều này hoạt động khá tốt.]
Nếu một trong hai cỡ mẫu không lớn, bạn vẫn có thể làm một cái gì đó, nhưng việc phân phối số liệu thống kê sẽ phụ thuộc vào phương pháp chính xác mà các tứ phân được tính toán cũng như các cỡ mẫu cụ thể.

Đặc biệt, bạn có thể

$\sigma^2$

b. không đưa ra một giả định về phương sai bằng nhau và sử dụng một thống kê kiểm tra gần giống với thống kê loại Welch-Satterthwaite.

Trong trường hợp đầu tiên, phân phối của thống kê kiểm tra có thể thu được khá đơn giản bằng cách mô phỏng từ phân phối giả định. (Trong trường hợp thứ hai, mọi thứ phức tạp hơn một chút vì phân phối sẽ phụ thuộc vào cách chênh lệch chênh lệch - nhưng vẫn có thể thực hiện được một số thứ.)

Nếu bạn chưa sẵn sàng để đưa ra một số giả định phân phối, bạn vẫn có thể ràng buộc độ lệch chuẩn của mẫu và do đó, có được giới hạn trên và dưới trên thống kê t; tuy nhiên, giới hạn có thể không rất hẹp.

Nếu bạn chưa có phương tiện mẫu, bạn có thể sử dụng trung bình theo cách tương tự của kiểm tra t. Nếu bạn giả định tính quy tắc (hoặc thậm chí chỉ là đối xứng và tồn tại của phương tiện) thì trung bình sẽ ước tính các phương tiện tương ứng; tuy nhiên, vì chúng ta chỉ cần đối phó với sự khác biệt về phương tiện, các giả định yếu hơn đáng kể sẽ đủ để điều này hoạt động như một bài kiểm tra.

Trong trường hợp này, bạn có thể nhận được các giá trị tới hạn (hoặc thực tế, giá trị p) thông qua mô phỏng khá dễ dàng, nhưng phân phối null theo giả định thông thường khá gần với phân phối t; một xấp xỉ khá tốt với giá trị p có thể được lấy từ các bảng t, nhưng mức độ tự do phù hợp thấp hơn đáng kể so với bạn có được từ một bài kiểm tra t (gần một nửa!) - và thống kê kiểm tra nên được thu nhỏ cũng như vậy, vì phương sai không chính xác tương ứng.

Điều này sẽ không có sức mạnh đặc biệt tốt ở mức bình thường, nhưng nó sẽ có sức mạnh tốt đối với những sai lệch so với tính bình thường.

Ví dụ, cho một thống kê của hình thức này:

$t^* = \frac{\tilde{x}_1-\tilde{x}_2}{q_1^2/n+q_2^2/n}$

$\tilde{x_i}$ $i$ $q_i$ $i$ $n$

$t^*$ $c\cdot t_{40}$ $c=1.064$

$c$ $n$

— Glen_b -Reinstate Monica
nguồn

σ

$\sigma$

Bạn có giả sử phương sai bằng nhau?

— Glen_b -Reinstate Monica

Tôi đã thực hiện chỉnh sửa theo tùy chọn 1 không giả sử phương sai bằng nhau đưa ra một số chi tiết và thực hiện một nghiên cứu mô phỏng nhỏ với n = 30.

— Glen_b -Reinstate Monica

Cũng thêm một số ý kiến về những gì có thể được thực hiện nếu bạn không có phương tiện.

— Glen_b -Reinstate Monica