Một mô hình có ý nghĩa tâm lý có thể hướng dẫn chúng ta.
Đạo hàm của một bài kiểm tra hữu ích
Bất kỳ biến thể trong các quan sát có thể được quy cho các biến thể giữa các đối tượng. Chúng ta có thể tưởng tượng rằng mỗi đối tượng, ở một mức độ nào đó, đưa ra một giá trị số cho kết quả của phương pháp 1 và một giá trị số cho kết quả của phương pháp 2. Sau đó, họ so sánh các kết quả này. Nếu hai cái này đủ khác nhau, đối tượng sẽ đưa ra lựa chọn xác định, nhưng nếu không thì đối tượng sẽ tuyên bố ràng buộc. (Điều này liên quan đến sự tồn tại của ngưỡng phân biệt đối xử .)
Sự khác biệt giữa các đối tượng gây ra sự khác biệt trong các quan sát thử nghiệm. Sẽ có một cơ hội nhất định của phương pháp ủng hộ 1, một cơ hội nhất định π 2 của phương pháp ủng hộ 2 và một cơ hội nhất định π 0 của một cà vạt.π1π2π0
Thật công bằng khi cho rằng đối tượng trả lời độc lập với nhau. Theo đó, khả năng quan sát đối tượng ủng hộ phương pháp 1, n 2 đối tượng ủng hộ phương pháp 2 và n 0 đối tượng đưa ra quan hệ, là đa phương thức . Ngoài một hằng số chuẩn hóa (không liên quan), logarit của khả năng bằngn1n2n0
n1đăng nhập( π1) + n2đăng nhập( π2) + n0đăng nhập( π0) .
Cho rằng , điều này được tối đa hóa khi π i = n i / n trong đó n = n 0 + n 1 + n 2 là số đối tượng.π0+π1+π2=0πi=ni/nn=n0+n1+n2
Để kiểm tra giả thuyết khống rằng hai phương pháp được coi là tốt như nhau, chúng tôi tối đa hóa khả năng chịu sự hạn chế của giả thuyết này. Mang trong tâm trí các mô hình tâm lý và gọi của một ngưỡng giả, chúng tôi sẽ phải sống với khả năng rằng (cơ hội quan hệ) là khác không. Cách duy nhất để phát hiện một khuynh hướng ủng hộ một mô hình trên những lời dối trá khác trong cách π 1 và π 2 bị ảnh hưởng: nếu mô hình 1 được ưa chuộng, sau đó π 1 nên tăng và π 2 giảm, và ngược lại . Giả sử biến thể là đối xứngπ0π1π2π1π2, tình huống không ưu tiên xảy ra khi . (Kích thước của π 0 sẽ cho chúng ta biết điều gì đó về ngưỡng - về khả năng phân biệt đối xử - nhưng mặt khác không cung cấp thông tin về sở thích.)π1=π2π0
Khi không có mô hình ưa thích, khả năng tối đa xảy ra khi và, một lần nữa,π0=n0/n. Cắm vào hai giải pháp trước đó, chúng tôi tính toán sự thay đổi về khả năng tối đa,G:π1=π2=n1+n22/nπ0=n0/nG
G= ( n1đăng nhậpn1n+ n2đăng nhậpn2n+ n0đăng nhậpn0n)- ( n1đăng nhập( n1+ n2) / 2n+ n2đăng nhập( n1+ n2) / 2n+ n0đăng nhậpn0n)= n1đăng nhập2 n1n1+ n2+ n2đăng nhập2 n2n1+ n2.
Kích thước của giá trị này - không thể âm - cho chúng ta biết giả thuyết null đáng tin cậy như thế nào: khi nhỏ, dữ liệu được "giải thích" gần như hoàn toàn với giả thuyết null (hạn chế) như nói chung; khi giá trị lớn, giả thuyết null sẽ không đáng tin cậy.G
Lý thuyết ước tính khả năng tối đa (tiệm cận) nói rằng ngưỡng hợp lý cho sự thay đổi này là một nửa so với lượng tử của phân bố chi bình phương với một bậc tự do (do hạn chế duy nhất π 1 = π 2 áp đặt bởi giả thuyết khống). Như thường lệ, α là kích thước của thử nghiệm này, thường được lấy là 5% ( 0,05 ) hoặc 1% ( 0,01 ). Các lượng tử tương ứng là 3,841459 và 6,634897 .1−απ1=π2α0.050.013.8414596.634897
Thí dụ
Giả sử trong số đối tượng, n 1 = 3 phương thức ưu tiên 1 và n 2 = 9 phương pháp ưu tiên 2. Điều đó ngụ ý có n 0 = 20 - 3 - 9 = 8 quan hệ. Khả năng là tối đa, sau đó, cho π 1 = 3 / 20 = 0,15 và pi 2 = 9 / 20 = 0,45 , nơi nó có một giá trị - 20,208 ...n=20n1=3n2=9n0=20−3−9=8π1=3/20=0.15π2=9/20=0.45−20.208…. Theo giả thuyết khả năng được thay tối đa cho , nơi giá trị của nó chỉ là - 21,778 . Sự khác biệt của G = - 20,208 - ( - 21,778 ) = 1,57 là ít hơn một nửa số α = ngưỡng 5% 3,84 . Do đó, chúng tôi không bác bỏ giả thuyết khống.π1=π2=6/20=0.30−21.778G=−20.208−(−21.778)=1.57α=3.84
Về quan hệ và kiểm tra thay thế
Nhìn lại công thức của , lưu ý rằng số lượng mối quan hệ ( n 0 ) không xuất hiện . Trong ví dụ, nếu chúng ta thay vào đó quan sát n = 100 đối tượng và trong số đó có 3 phương pháp ưa thích 1, 9 phương pháp 2 ưa thích và 100 - 3 - 9 = 88 còn lại được buộc, kết quả sẽ giống nhau.Gn0n=10039100 - 3 - 9 = 88
Chia tách các mối quan hệ và gán một nửa cho phương pháp 1 và một nửa cho phương pháp 2 là hợp lý theo trực giác, nhưng nó dẫn đến một thử nghiệm ít mạnh mẽ hơn . Chẳng hạn, đặt và n 2 = 15 . Hãy xem xét hai trường hợp:n1= 5n2= 15
môn học, vì vậy có n 0 = 0 quan hệ. Thử nghiệm khả năng tối đa sẽ từ chối null cho bất kỳ giá trị nào của α lớn hơn 0,02217 . Một thử nghiệm khác thường được sử dụng trong tình huống này (vì không có mối quan hệ nào) là thử nghiệm nhị thức; nó sẽ từ chối null cho bất kỳ giá trị nào của α lớn hơn 0,02660 . Do đó, hai thử nghiệm thường cho kết quả giống nhau, vì các giá trị quan trọng này khá gần nhau.n = 20n0= 0α0,02217α0,02660
môn học, vì vậy có n 0 = 80 quan hệ. Thử nghiệm khả năng tối đavẫnsẽtừ chối null cho bất kỳ giá trị nào của α lớn hơn 0,02217 . Các thử nghiệm nhị thức sẽ từ chối null chỉ đối với bất kỳ giá trị của α lớn hơn 0,3197 . Hai bài kiểm tra cho kết quả hoàn toàn khác nhau. Cụ thể, 80 mối quan hệ đã làm suy yếu khả năng của phép thử nhị thức để phân biệt một sự khác biệt mà lý thuyết khả năng tối đa cho thấy là có thật.n = 100n0= 80α0,02217α0.319780
Cuối cùng, hãy xem xét cách tiếp cận bảng dự phòng 3 × 1 đề xuất trong câu trả lời khác. Xét đối tượng với n 1 = 3 phương pháp ưu tiên 1, n 2 = 10 phương pháp ưu tiên 2 và n 0 = 7 với các mối quan hệ. "Bảng" chỉ là vectơ ( n 0 , n 1 , n 2 ) = ( 7 , 3 , 10 ) . Thống kê chi bình phương của nó làn = 20n1= 3n2= 10n0= 7( n0, n1, n2) = ( 7 , 3 , 10 ) với hai bậc tự do. Giá trị p là 0,1572 , điều này sẽ khiến hầu hết mọi người kết luận rằng không có sự khác biệt giữa các phương pháp. Thay vào đó, kết quả khả năng tối đa thay cho giá trị p là 0,04614 , sẽ từ chối kết luận này ở mức α = 5%.3.70,15720,04614α =
Với đối tượng, giả sử chỉ có 1 phương pháp được ưu tiên 1, chỉ có 2 phương pháp được ưa thích 2 và có 97 mối quan hệ. Theo trực giác có rất ít bằng chứng cho thấy một trong những phương pháp này có xu hướng được ưa chuộng. Nhưng lần này, thống kê chi bình phương 182,42 rõ ràng, không thể thay đổi, (nhưng khá sai) cho thấy có một sự khác biệt (giá trị p nhỏ hơn 10 - 15 ).n = 1001297182,4210- 15
Trong cả hai trường hợp , cách tiếp cận chi bình phương nhận được câu trả lời hoàn toàn sai: trong trường hợp đầu tiên, nó thiếu sức mạnh để phát hiện sự khác biệt đáng kể trong khi trong trường hợp thứ hai (với rất nhiều mối quan hệ), nó cực kỳ tự tin về sự khác biệt không đáng kể. Vấn đề không phải là bài kiểm tra chi bình phương là xấu; vấn đề là nó kiểm tra một giả thuyết khác: cụ thể là, liệu . Theo mô hình khái niệm của chúng tôi, giả thuyết này là vô nghĩa tâm lý, bởi vì nó lẫn lộn thông tin về sở thích (cụ thể là, pi 1 và π 2 ) với thông tin về ngưỡng của phân biệt đối xử (cụ thể là,π1= π2= π0π1π2 ). Đây là một minh chứng tốt đẹp về nhu cầu sử dụng bối cảnh nghiên cứu và kiến thức về chủ đề (tuy nhiên được đơn giản hóa) trong việc lựa chọn một bài kiểm tra thống kê.π0