Tôi đang xem một bảng tính excel tuyên bố sẽ tính toán , nhưng tôi không nhận ra cách làm này và tôi tự hỏi liệu tôi có thiếu thứ gì không.
Đây là dữ liệu mà nó đang phân tích:
+------------------+----------+----------+
| Total Population | Observed | Expected |
+------------------+----------+----------+
| 2000 | 42 | 32.5 |
| 2000 | 42 | 32.5 |
| 2000 | 25 | 32.5 |
| 2000 | 21 | 32.5 |
+------------------+----------+----------+
Và đây là số tiền nó làm cho mỗi nhóm để tính chi bình phương:
P = (sum of all observed)/(sum of total population) = 0.01625
A = (Observed - (Population * P)) ^2
B = Total Population * P * (1-P)
ChiSq = A/B
Vì vậy, đối với mỗi nhóm, là:
2.822793
2.822793
1.759359
4.136448
Và tổng số Chi Square là : 11.54139
.
Tuy nhiên, mọi ví dụ tôi đã thấy khi tính toán hoàn toàn khác với điều này. Tôi sẽ làm cho mỗi nhóm:
chiSq = (Observed-Expected)^2 / Expected
Và do đó, với ví dụ trên tôi sẽ nhận được tổng giá trị vuông 11.3538
.
Câu hỏi của tôi là - tại sao trong bảng excel họ lại tính toán theo cách này? Đây có phải là một cách tiếp cận được công nhận?
CẬP NHẬT
Lý do tôi muốn biết điều này là tôi đang cố gắng sao chép những kết quả này bằng ngôn ngữ R. Tôi đang sử dụng hàm chisq.test và nó không xuất hiện với cùng số với bảng Excel. Vì vậy, nếu bất cứ ai biết cách thực hiện phương pháp này trong R, nó sẽ rất hữu ích!
CẬP NHẬT 2
Nếu có ai quan tâm, đây là cách tôi tính toán trong R:
res <- matrix(c((2000-42), 42, (2000-42), 42, (2000-25), 25, (2000-21), 21), 2, 4)
chisq.test(res)
x=c(42,42,25,21);chisq.test(cbind(x,2000-x))