Có một tài liệu tham khảo hợp pháp hóa việc sử dụng thử nghiệm z chưa được kiểm tra để so sánh hai tỷ lệ không?


8

Kiểm tra z để so sánh hai tỷ lệ là z=p^1p^2Var(p^1p^2) . Thông thường nó được định nghĩa rằng

Var(p^1p^2)=p^(1p^)(1/n1+1/n2),

Ở đâu

p^=n1p^1+n2p^2n1+n2.

Có bất kỳ tài liệu tham khảo bằng văn bản nào hợp pháp hóa tôi thay vào đó để sử dụng phương sai không được chia sẻ, đó là

Var(p^1p^2)=p^1(1p^1)n1+p^2(1p^2)n2?

Câu trả lời:


8

Có khá nhiều thảo luận về điều này trên trang web AP .

Bạn có thể sử dụng bất kỳ số liệu thống kê nào bạn muốn, miễn là bạn rõ ràng về những gì bạn làm và xem phân phối null phù hợp để tính giá trị p hoặc ngưỡng.

Nhưng một số thống kê tốt hơn so với những người khác; trong trường hợp này, bạn sẽ tìm kiếm (a) phân phối null dễ dàng tính toán và (b) sức mạnh để phát hiện sự khác biệt.

Nhưng tôi không biết lý do tại sao bạn lại thích phương sai không phân biệt so với phương sai gộp cho thử nghiệm, mặc dù nó có thể được ưu tiên trong việc tính toán khoảng tin cậy cho sự khác biệt.


+1 Đó là một cuộc thảo luận tốt mà bạn tìm thấy. Tuy nhiên, dường như không thực sự giải quyết được câu hỏi, đó là liệu bằng cách nào đó, thống kê gộp có thể được sửa chữa để đưa ra kích thước thử nghiệm mong muốn và - có lẽ - mang lại sức mạnh lớn hơn. Để giải quyết vấn đề này, tôi đã cung cấp một câu trả lời riêng.
whuber

Liên kết của bạn không đi đến một cuộc thảo luận; nó đi đến một trang với quan điểm của Charles Peltier. Không chắc chắn tại sao đây là câu trả lời được chọn vì nó không trả lời bất cứ điều gì cho tôi. Sử dụng bất cứ số liệu thống kê nào không đủ cụ thể.
Jarad

2
@Jarad Một định nghĩa của từ "thảo luận" là "cách xử lý chi tiết về một chủ đề cụ thể"; đó là những gì tôi muốn nói Câu trả lời được chọn được chọn bởi người đặt câu hỏi. Bằng cách "sử dụng bất cứ số liệu thống kê nào bạn muốn", tôi đã đề cập đến phần "... tham chiếu hợp pháp hóa tôi ..." một phần của câu hỏi.
Karl

9

Phương sai không liên kết có xu hướng quá nhỏ. Điều này là do theo giả thuyết null, vẫn sẽ có sự thay đổi cơ hội theo hai tỷ lệ quan sát được, mặc dù các xác suất cơ bản là bằng nhau. Sự thay đổi cơ hội này góp phần vào phương sai gộp nhưng không phải là phương sai không được chia.

Kết quả là, cho thống kê chưa được phân tích thậm chí không có phân phối chuẩn bình thường. Chẳng hạn, khi và xác suất thực là cả , phương sai của chỉ bằng thay vì . Bằng cách sử dụng các bảng của phân phối chuẩn thông thường, bạn sẽ nhận được giá trị p không chính xác: chúng sẽ có xu hướng nhỏ một cách giả tạo, quá thường xuyên từ chối null khi bằng chứng không thực sự ở đó.z n1=n21/2z1/21

Tuy nhiên, người ta tự hỏi liệu điều này có thể được sửa chữa. Nó có thể. Câu hỏi đặt ra là liệu giá trị đã được hiệu chỉnh , dựa trên các ước tính chưa được tạo, có thể có sức mạnh lớn hơn để phát hiện các sai lệch so với giả thuyết không. Một vài mô phỏng nhanh cho thấy đây không phải là trường hợp: thử nghiệm gộp (so với thử nghiệm chưa được điều chỉnh đúng) có cơ hội từ chối null tốt hơn bất cứ khi nào null là sai. Vì vậy, tôi đã không bận tâm để tìm ra công thức cho sự điều chỉnh chưa được chỉnh sửa; nó dường như vô nghĩa.z

Tóm lại, bài kiểm tra không có kết quả là sai, nhưng với một sự điều chỉnh thích hợp, nó có thể được thực hiện hợp pháp. Tuy nhiên, nó dường như kém hơn so với thử nghiệm gộp.


Bạn nói "Chẳng hạn, khi và xác suất thực là cả 1/2, phương sai của z chỉ bằng 1/2 thay vì 1." Nhưng nếu phương sai không được tạo ra quá nhỏ, phương sai của z sẽ quá lớn và tôi nghĩ nó sẽ chỉ hơi quá lớn. n1=n2
Karl

Tha thứ cho tôi nhưng tôi không thể làm theo tấm gương của bạn. Tại sao phương sai của phải là 1? Những giá trị nào bạn giả sử cho và ? zp^1p^2
thủy tinh

@lassy có phương sai đơn vị (không có triệu chứng) theo cách xây dựng : sự khác biệt đã được chuẩn hóa bằng cách chia cho phương sai ước tính của nó. zp1^p1^
whuber

Tôi không muốn làm phiền bạn nhưng thực sự tôi không hiểu tại sao nếu có phương sai đơn vị bằng cách xây dựng thì bạn nói rằng phương sai của nó có thể là . Dường như với tôi rằng phương sai của nó bằng trong một trường hợp và trong cái khác. Xin lỗi, tôi không hiểu làm thế nào những đại lượng này có tỷ lệ 2: 1. Thật vậy, trong trường hợp chúng giống nhau. z1/2p^(1p^)2np^1(1p^1)n+p^2(1p^2)np^1=p^2
thủy tinh

Tôi không đồng ý chút nào. Tại sao cũng không nói rằng việc xây dựng khoảng tin cậy cho sự khác biệt giữa hai tỷ lệ mâu thuẫn với phân phối bình thường? Thật vậy, đầu tiên: trong mọi trường hợp không thể có phân phối , bởi vì nó không phải là một kết hợp trung bình (hoặc tổng hoặc tuyến tính) của các biến ngẫu nhiên bình thường. Ngược lại, nó hội tụ trực tiếp vào phân phối bình thường khi phân kỳ (hoặc và , nếu bạn thích). Thứ hai: các công cụ ước lượng gộp và không gộp là cả chính xác và nhất quán. ztnn1n2
thủy tinh
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.