Kiểm định giả thuyết cho sự bằng nhau của tỷ lệ với 3 mẫu


9

Tôi có một bộ dữ liệu về dữ liệu thông tin khách hàng của điện thoại di động với hai người. Cột đầu tiên chứa danh mục nhất định mà tài khoản rơi vào (A, B hoặc C) và cột thứ hai chứa là giá trị nhị phân cho việc tài khoản đó đã bị hủy. ví dụ

A | cancelled
C | active
B | active
A | cancelled

những gì tôi muốn làm là đưa ra một số loại thử nghiệm giả thuyết để kiểm tra xem liệu tỷ lệ tài khoản loại A, B và C có khác nhau đối với tài khoản đang hoạt động so với tài khoản bị hủy hay không - giả thuyết khống là chúng giống nhau. Vì vậy, nó giống như một bài kiểm tra giả thuyết về tỷ lệ ngoại trừ tôi không biết làm thế nào để làm điều này cho 3 giá trị


6
Bạn có thể sử dụng thử nghiệm để kiểm tra sự bằng nhau về tỷ lệ giữa ba nhóm. χ2

Tôi cũng nghĩ rằng tôi có thể thực hiện ba bài kiểm tra giả thuyết A vs B, B vs C và A vs C, để xem chúng có khác nhau không
user1893354

5
Bạn có thể, nhưng lưu ý rằng sau đó bạn sẽ phải sửa cho các vấn đề của nhiều so sánh.

Cảm ơn bạn vì câu trả lời. Tôi chỉ tò mò ý của bạn là gì bởi các vấn đề của nhiều so sánh? Hay cụ thể hơn, tại sao ba phương pháp kiểm tra giả thuyết lại bất lợi. Cảm ơn!
user1893354

3
Ngươi là hai vấn đề với việc sử dụng ba bài kiểm tra giả thuyết. Đầu tiên, chúng phụ thuộc lẫn nhau vì mỗi cặp sử dụng lại một số dữ liệu. Thứ hai, nếu chúng thực sự độc lập, thì khả năng ít nhất một trong số chúng sẽ có ý nghĩa ngay cả khi null là đúng - nghĩa là, khả năng xảy ra lỗi dương tính giả - sẽ lớn hơn gần gấp ba lần so với sai mong muốn tỷ lệ dương. Vấn đề thứ hai cho thấy thử nghiệm cần được điều chỉnh, nhưng vấn đề thứ nhất cho thấy việc tìm ra sự điều chỉnh phù hợp có thể có vấn đề. Cách tiếp cận tránh được những vấn đề này. χ2
whuber

Câu trả lời:


13

Tôi sẽ căn cứ vào câu trả lời của mình nói chung và chèn ý kiến ​​về cách vấn đề của bạn phù hợp với khung kiểm tra. Nói chung, chúng ta có thể kiểm tra sự bằng nhau về tỷ lệ bằng cách sử dụng phép thử trong đó giả thuyết null điển hình, , như sau:H 0χ2H0

H0:p1=p2=...=pk

tức là tất cả các tỷ lệ đều bằng nhau. Bây giờ trong trường hợp của bạn, giả thuyết không có giá trị như sau:

H A :  tại leat một  p i  khác với  i = 1 , 2 , 3

H0:p1=p2=p3
và giả thuyết thay thế là
HA: at leat one pi is different for i=1,2,3

Bây giờ để thực hiện thử nghiệm chúng tôi cần tính toán thống kê kiểm tra sau: Giá trị của thống kê kiểm tra làχ2

χ2=i=1n(OiEi)2Ei

Ở đâu

  • χ2 = Thống kê kiểm tra tích lũy của Pearson, phương pháp tiếp cận một cách bất hợp pháp phân phốiχ2
  • Oi = tần số quan sát được
  • Ei = tần số dự kiến ​​(lý thuyết), được khẳng định bằng giả thuyết null
  • n = số lượng ô trong bảng

Trong trường hợp của bạn vì chúng ta có thể nghĩ vấn đề này là bảng sau: n=6nhập mô tả hình ảnh ở đây

Bây giờ một khi chúng ta có thống kê kiểm tra, chúng ta có hai lựa chọn về cách tiến hành hoàn thành kiểm tra giả thuyết.

Tùy chọn 1) Chúng tôi có thể so sánh thử nghiệm tĩnh mình với giá trị tới hạn phù hợp theo giả thuyết null. Điều đó có nghĩa là, nếu là đúng, thì thống kê từ bảng dự phòng với các hàng và cột sẽ có phân phối với độ sự tự do. Sau khi tính toán giá trị tới hạn của chúng tôi nếu chúng tôi có thì chúng tôi sẽ từ chối giả thuyết khống. Rõ ràng nếu thì chúng ta không từ chối giả thuyết khống. χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

Về mặt đồ họa (tất cả các số được tạo thành) đây là: nhập mô tả hình ảnh ở đây

Từ biểu đồ, nếu thống kê kiểm tra của chúng tôi tương ứng với thống kê kiểm tra màu xanh thì chúng tôi sẽ không từ chối giả thuyết khống vì thống kê kiểm tra này không nằm trong khu vực quan trọng (ví dụ: ). Ngoài ra, thống kê kiểm tra màu xanh lá cây không nằm trong khu vực quan trọng và vì vậy chúng tôi sẽ bác bỏ giả thuyết khống nếu chúng tôi tính toán thống kê kiểm tra màu xanh lá cây.χ2χ2<χ

Trong ví dụ của bạn, mức độ tự do của bạn bằng

df=(R1)×(C1)=(21)×(31)=1×2=2

Tùy chọn 2) chúng ta có thể tính giá trị p liên quan đến thống kê kiểm tra theo giả thuyết null và nếu giá trị p này nhỏ hơn một số -level được chỉ định thì chúng ta có thể từ chối giả thuyết null. Nếu giá trị p lớn hơn -level thì chúng ta không từ chối giả thuyết null. Lưu ý rằng giá trị p là xác suất mà phân phối lớn hơn thống kê kiểm tra.α χ 2 ( R - 1 ) × ( C - 1 )ααχ(R1)×(C1)2

Về mặt đồ họa chúng ta có điều đó nhập mô tả hình ảnh ở đây

trong đó giá trị p được tính là diện tích lớn hơn thống kê kiểm tra của chúng tôi (khu vực bóng mờ màu xanh trong ví dụ).

Vì vậy, nếu thì không thể từ chối giả thuyết null , khác,H 0α>p-valueH0

if từ chối giả thuyết nullH 0αp-valueH0

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.