Là chi bình phương luôn luôn là một bài kiểm tra một phía?


48

Một bài báo đã xuất bản ( pdf ) chứa 2 câu sau:

Hơn nữa, việc báo cáo sai có thể do áp dụng các quy tắc không chính xác hoặc do thiếu kiến ​​thức về kiểm tra thống kê. Ví dụ: tổng df trong ANOVA có thể được coi là lỗi df trong báo cáo thử nghiệm hoặc nhà nghiên cứu có thể chia giá trị p được báo cáo của thử nghiệm hoặc cho hai để có được giá trị một phía , trong khi giá trị của thử nghiệm hoặc đã là thử nghiệm một phía.Fχ2Fppχ2F

Tại sao họ có thể nói như vậy? Bài kiểm tra chi bình phương là bài kiểm tra hai mặt. (Tôi đã hỏi một trong những tác giả, nhưng không nhận được phản hồi.)

Tôi đang nhìn cái gì đó?


Hãy xem bài tập 4.14 của phiên bản 2004 của Lý thuyết và Phương pháp Kinh tế lượng của Davidson & Mackinnon để biết ví dụ (đặc biệt) khi Chi bình phương được sử dụng cho bài kiểm tra hai đuôi. Chỉnh sửa: giải thích tuyệt vời tại đây: itl.nist.gov/div898/handbook/eda/section3/eda58.htm
Tối đa

Câu trả lời:


50

Bài kiểm tra chi bình phương về cơ bản luôn là bài kiểm tra một phía . Đây là một cách lỏng lẻo để suy nghĩ về nó: bài kiểm tra chi bình phương về cơ bản là bài kiểm tra 'mức độ phù hợp'. Đôi khi nó được gọi một cách rõ ràng như vậy, nhưng ngay cả khi nó không, về bản chất nó vẫn thường là một sự phù hợp. Ví dụ: phép thử độc lập bình phương trên bảng tần số 2 x 2 là (loại) kiểm tra mức độ phù hợp của hàng đầu tiên (cột) với phân phối được chỉ định bởi hàng thứ hai (cột) và ngược lại , đồng thời. Do đó, khi giá trị chi bình phương nhận ra nằm ở đuôi bên phải của phân phối, nó biểu thị mức độ phù hợp kém và nếu nó đủ xa, liên quan đến một số ngưỡng được chỉ định trước, chúng tôi có thể kết luận rằng nó rất kém đến mức chúng tôi không tin dữ liệu là từ phân phối tham chiếu đó.

Nếu chúng ta sử dụng kiểm tra chi-squared như một thử nghiệm hai mặt, chúng tôi cũng sẽ lo lắng nếu số liệu thống kê đã quá xa vào trái phía của phân phối chi-squared. Điều này có nghĩa là chúng tôi lo lắng sự phù hợp có thể là quá tốt . Điều này chỉ đơn giản là không phải là một cái gì đó chúng ta thường lo lắng. (Như một ghi chú lịch sử, điều này có liên quan đến tranh cãi về việc Mendel có làm sai lệch dữ liệu của anh ấy không. Ý tưởng là dữ liệu của anh ấy quá tốt để trở thành sự thật. Xem tại đây để biết thêm thông tin nếu bạn tò mò.)


9
+1 để đề cập đến việc sử dụng hai mặt với các thí nghiệm hạt đậu của Mendel: thật đáng nhớ và đi vào trọng tâm của câu hỏi.
whuber

2
+1 cho một câu hỏi hay và một câu trả lời xuất sắc. @Joel W: Tôi hoàn toàn có thể giới thiệu video Khan Academys trong bài kiểm traχ2
Max Gordon

9
Tóm tắt của tôi về điều này là là một thử nghiệm hai mặt mà chúng ta thường chỉ quan tâm đến một trong các đuôi của phân phối, cho thấy nhiều bất đồng, thay vì ít bất đồng hơn mong đợi. χ2
Frank Harrell

5
Ủng hộ chế độ xem 2 đuôi: "Xác suất hai đuôi vượt quá +/- z cho phân phối chuẩn thông thường bằng với xác suất đuôi phải trên z bình phương cho phân phối chi bình phương với df = 1. Ví dụ: hai xác suất chuẩn bình thường của đuôi là 0,05 rơi xuống dưới -1,96 và trên 1,96 bằng với xác suất chi bình phương đuôi phải ở trên (1,96) bình phương = 3,84 khi df = 1. " Agresti, 2007 (tái bản lần thứ 2) trang 11
Joel W.

5
Đúng rồi. Bình phương một số z mang lại một phương sai chi bình phương. Ví dụ: az của 2 (hoặc, -2!) Khi bình phương bằng 4, giá trị chi bình phương tương ứng. Giá trị p hai đuôi liên quan đến điểm z là 2 là 0,04550026; và giá trị p một đầu được liên kết với giá trị chi bình phương là 4 (df = 1) là 0,04550026. Một thử nghiệm z hai đuôi tương ứng với một thử nghiệm chi bình phương một đuôi. Nhìn vào đuôi bên trái của phân phối chi bình phương sẽ tương ứng với việc tìm kiếm các điểm z gần với z = 0 hơn bạn có thể mong đợi.
gung - Tái lập Monica

12

Là chi bình phương luôn luôn là một bài kiểm tra một phía?

Điều đó thực sự phụ thuộc vào hai điều:

  1. giả thuyết nào đang được thử nghiệm. Nếu bạn đang kiểm tra phương sai của dữ liệu thông thường so với một giá trị được chỉ định, thì hoàn toàn có thể xử lý các đuôi trên hoặc dưới của hình vuông chi (một đuôi) hoặc cả hai đuôi của phân phối. Chúng ta phải nhớ rằng Thống kê loại không phải là phép thử chi bình phương duy nhất trong thị trấn!(OE)2E

  2. cho dù mọi người đang nói về giả thuyết thay thế là một hoặc hai mặt (bởi vì một số người sử dụng 'hai đuôi' để chỉ một phương án hai mặt, bất kể điều gì xảy ra với phân phối mẫu của thống kê . Vì vậy, ví dụ, nếu chúng ta đang xem xét nghiệm tỷ lệ hai mẫu, ai đó có thể viết bằng null rằng hai tỷ lệ này bằng nhau và trong cách viết khác làπ1π2và sau đó nói về nó như là 'hai đuôi', nhưng kiểm tra nó bằng cách sử dụng bình phương chi chứ không phải kiểm tra z, và vì vậy chỉ nhìn vào phần đuôi trên của phân phối thống kê kiểm tra (vì vậy, nó có hai đuôi sự phân bố của sự khác biệt về tỷ lệ mẫu, nhưng một sự thay đổi về mặt phân phối của thống kê chi bình phương thu được từ đó - theo cách tương tự như khi bạn thực hiện thống kê kiểm tra t , bạn chỉ nhìn vào một cái đuôi trong phân phối của ).|T||T|

Điều đó có nghĩa là, chúng ta phải rất cẩn thận về những gì chúng ta muốn nói đến bằng cách sử dụng 'kiểm tra chi bình phương' chính xác về ý nghĩa của chúng ta khi chúng ta nói 'một đuôi' so với 'hai đuôi'.

Trong một số trường hợp (hai tôi đã đề cập; có thể có nhiều hơn), có thể có ý nghĩa hoàn hảo để gọi nó là hai đuôi, hoặc có thể hợp lý để gọi nó là hai đuôi nếu bạn chấp nhận một số sự lỏng lẻo của việc sử dụng thuật ngữ.

Nó có thể là một tuyên bố hợp lý để nói rằng nó chỉ bao giờ một lần nếu bạn hạn chế thảo luận đối với các loại kiểm tra chi bình phương cụ thể.



Cảm ơn bạn rất nhiều vì đã đề cập đến bài kiểm tra phương sai. Đó thực sự là một cách sử dụng thử nghiệm khá thú vị và cũng là lý do tại sao tôi kết thúc trên trang này ^^
Tobbey

5

Phép thử chi bình phương của giả thuyết rằng phương sai là có thể là một hoặc hai đuôi theo nghĩa chính xác giống như phép thử t của giả thuyết rằng giá trị trung bình là có thể là một hoặc hai đuôi.(n1)s2/σ2σ2(mμ)n/sμ


1

Câu trả lời của @ gung là chính xác và là cách thảo luận về nên được đọc. Tuy nhiên, sự nhầm lẫn có thể phát sinh từ một cách đọc khác:χ2

Thật dễ dàng để hiểu một là 'hai mặt' theo nghĩa là thống kê kiểm tra thường bao gồm một tổng số khác biệt bình phương từ cả hai phía của phân phối ban đầu.χ2

Cách đọc này sẽ gây nhầm lẫn về cách thống kê kiểm tra được tạo ra với các đuôi của thống kê kiểm tra đang được xem xét.


Bạn có thể giải thích về "một mặt của phân phối ban đầu" sẽ là gì không? Thậm chí không rõ ràng "phân phối ban đầu" đề cập đến điều gì cũng như nó liên quan đến thống kê chi bình phương như được tính toán từ dữ liệu.
whuber

Ví dụ: tổng bình phương độc lập bình phương là . Các quy tắc là phân phối 'bản gốc'. Chỉ số kết hợp thông tin từ cả hai đuôi của phân phối chuẩn bên dưới. nχ2χ2
phỏng đoán

OK, nhưng tôi vẫn không thể tìm ra những gì bạn đang tương phản với điều đó. Bạn có thể cung cấp một ví dụ về thống kê kiểm tra không hai mặt có thể được sử dụng trong ANOVA và cho biết cách nó được kết nối với các đuôi của một số phân phối?
whuber

Tôi không đối chiếu nó với bất cứ điều gì. Tôi đang chỉ ra một lý do tại sao mọi người có thể nhầm lẫn về biệt ngữ một mặt / hai mặt trong bối cảnh của . Thật đơn giản để các chuyên gia thấy rằng bản thân thử nghiệm thường là thử nghiệm một phía trên chỉ số được tính toán. Những người khác có thể có một số dữ liệu và suy nghĩ về độ lệch so với giá trị trung bình theo cả hai hướng, thường được đưa vào một chỉ số . Họ sẽ nghe thấy những điều dọc theo 'suy nghĩ về độ lệch so với giá trị trung bình theo cả hai hướng = thử nghiệm hai mặt'. Do đó một sự hiểu lầm. χ2χ2χ2
phỏng đoán

Tôi đang yêu cầu một sự tương phản chỉ để giúp hiểu những gì bạn đang cố gắng để mô tả. Tôi chưa thể xác định đó là gì.
whuber

0

Tôi cũng đã có một số vấn đề để hiểu được câu hỏi này, nhưng sau một số thử nghiệm, dường như vấn đề của tôi chỉ đơn giản là cách các bài kiểm tra được đặt tên.

Trong SPSS là một ví dụ, bảng 2x2 có thể có thêm phép kiểm tra số đo. Có hai cột cho giá trị p, một cột cho "Pearson Chi-Sqare", "Sửa liên tục", v.v. và một cặp cột khác cho thử nghiệm chính xác của Fisher trong đó có một cột cho thử nghiệm 2 mặt và một cột khác cho thử nghiệm 2 mặt và một cột khác cho thử nghiệm 2 mặt Thử nghiệm 1 mặt.

Đầu tiên tôi nghĩ rằng 1 và 2 mặt biểu thị một phiên bản 1 hoặc 2 mặt của bài kiểm tra hình chis, có vẻ kỳ quặc. Tuy nhiên, hóa ra điều này biểu thị công thức cơ bản của giả thuyết thay thế trong thử nghiệm về sự khác biệt giữa các tỷ lệ, tức là thử nghiệm z. Vì vậy, phép thử tỷ lệ 2 mặt thường hợp lý đã đạt được trong SPSS với phép thử số đo, trong đó phép đo số đo được so sánh với giá trị ở đuôi trên (1 mặt) của phân phối. Đoán đây là những gì các câu trả lời khác cho câu hỏi ban đầu đã chỉ ra, nhưng tôi phải mất một thời gian để nhận ra điều đó.

Nhân tiện, cùng một loại công thức được sử dụng trong openepi.com và có thể các hệ thống khác.



0

χ2 kiểm tra phương sai có thể là một hoặc hai mặt: Thống kê kiểm tra là và giả thuyết null là: s (độ lệch mẫu) = (một giá trị tham khảo). Giả thuyết thay thế có thể là: (a) , (b) , (c) . tính toán giá trị p liên quan đến sự bất đối xứng của phân phối.(n1)s2σ2σs>σs<σsσ


1
Chào mừng đến với CV! Tôi nghĩ câu trả lời của Ray Koopman đã bao gồm điểm này.
Cá bạc

-1

Các thử nghiệm và F là các thử nghiệm một phía vì chúng tôi không bao giờ có giá trị âm của và F. Đối với , tổng chênh lệch của bình phương quan sát và dự kiến ​​được chia cho tỷ lệ dự kiến ​​(tỷ lệ ), do đó chi bình phương luôn là một số dương hoặc nó có thể gần bằng 0 ở bên phải khi không có sự khác biệt. Vì vậy, thử nghiệm này luôn luôn là một thử nghiệm một phía bên phải. Giải thích cho bài kiểm tra F là tương tự.χ2χ2χ2

Đối với thử nghiệm F, chúng tôi so sánh giữa phương sai nhóm với tổng phương sai trong nhóm (sai số trung bình bình phương với . Nếu tổng bình phương giữa và trong tổng bình phương bằng nhau, chúng tôi nhận được giá trị F là 1.SSwdfw

Vì về cơ bản nó là tỷ lệ của tổng bình phương, giá trị không bao giờ trở thành số âm. Do đó, chúng tôi không có kiểm tra bên trái và kiểm tra F luôn là kiểm tra một bên phải. Kiểm tra số liệu của phân phối và F, chúng luôn dương. Đối với cả hai thử nghiệm, bạn đang xem liệu thống kê được tính có nằm ở bên phải của giá trị tới hạn hay không. χ2

Phân phối Chi-vuông và F


1
Thống kê kiểm tra không cần lấy giá trị âm để chúng tôi xem xét cả hai đuôi. Ví dụ, xem xét một thử nghiệm F cho tỷ lệ của hai phương sai.
Glen_b ngày

Thử nghiệm F là thử nghiệm một mặt Glen_b.
Daniel

3
Thử nghiệm F cho sự bằng nhau của phương sai, có một thống kê rằng tỷ lệ của hai ước tính phương sai KHÔNG phải là một mặt; có một giá trị gần đúng với nó đặt giá trị lớn hơn của hai phương sai mẫu trên tử số, nhưng nó chỉ thực sự đúng nếu df giống nhau. Nhưng nếu bạn không thích điều đó thì sẽ có bất kỳ số ví dụ nào khác. Thống kê cho bài kiểm tra tổng xếp hạng không thể âm tính nhưng bài kiểm tra có hai đuôi. Tôi có thể cung cấp các ví dụ khác nếu cần.
Glen_b ngày

@Ferdi Thật không may, có một cái gì đó rõ ràng sai với ví dụ ở đó - nó nói rằng đó là hai mặt nhưng sau đó ngụ ý nó chỉ từ chối các giá trị lớn của thống kê. Nếu nhỏ hơn chúng ta gần như không bao giờ quan sát giá trị lớn cho tỷ lệ, vì vậy, thống kê sẽ chỉ có xu hướng từ chối khi biến nó thành một chiều. σ12σ22σ12>σ22
Glen_b ngày
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.