1. Một ví dụ nổi tiếng về tâm lý học và ngôn ngữ học được mô tả bởi Herb Clark (1973; sau Coleman, 1964): "Ngụy biện ngôn ngữ như cố định: Một phê bình về thống kê ngôn ngữ trong nghiên cứu tâm lý học."
Clark là một nhà tâm lý học thảo luận về các thí nghiệm tâm lý trong đó một mẫu đối tượng nghiên cứu đưa ra phản ứng với một tập hợp các tài liệu kích thích, thường là những từ khác nhau được rút ra từ một số xác chết. Ông chỉ ra rằng quy trình thống kê tiêu chuẩn được sử dụng trong các trường hợp này, dựa trên các biện pháp lặp lại ANOVA, và được Clark gọi là , coi người tham gia là một yếu tố ngẫu nhiên nhưng (có lẽ ngầm) xử lý các tài liệu kích thích (hoặc "ngôn ngữ") như cố định. Điều này dẫn đến các vấn đề trong việc diễn giải kết quả kiểm tra giả thuyết về yếu tố điều kiện thí nghiệm: tự nhiên chúng tôi muốn giả định rằng kết quả dương tính cho chúng tôi biết điều gì đó về cả dân số mà chúng tôi đã rút ra mẫu người tham gia cũng như dân số lý thuyết mà chúng tôi đã rút ra các tài liệu ngôn ngữ. Nhưng FF1 , bằng cách coi người tham gia là ngẫu nhiên và kích thích là cố định, chỉ cho chúng ta biết về tác động của yếu tố điều kiện đối với những người tham gia tương tự khác phản ứng vớicác kích thích chính xác tương tự. Tiến hànhphân tích F 1 khi cả người tham gia và kích thích được xem một cách thích hợp là ngẫu nhiên có thể dẫn đến tỷ lệ lỗi Loại 1 vượt quá mức α danh nghĩa- thường là 0,05 - với mức độ tùy thuộc vào các yếu tố như số lượng và độ biến thiên của kích thích và thiết kế của thí nghiệm. Trong trường hợp này, việc phân tích thích hợp hơn, ít nhất là trong khuôn khổ ANOVA cổ điển, là sử dụng những gì được gọi là gần F thống kê dựa trên tỷ lệ củatổ hợp tuyến tính củaF1F1αF nghĩa là hình vuông.
Bài báo của Clark đã tạo ra một sự nổi bật trong tâm lý học vào thời điểm đó, nhưng đã thất bại trong việc tạo ra một vết lõm lớn trong văn học tâm lý rộng lớn hơn. . trong các mô hình hiệu ứng hỗn hợp, trong đó mô hình hỗn hợp cổ điển ANOVA có thể được xem là trường hợp đặc biệt. Một số trong những bài báo gần đây bao gồm Baayen, Davidson, & Bates (2008), Murayama, Sakaki, Yan, & Smith (2014), và ( ahem ) Judd, Westfall, & Kenny (2012). Tôi chắc chắn có một số tôi đang quên.
2. Không chính xác. Có nhiều phương pháp để xem liệu một yếu tố có tốt hơn được đưa vào như một hiệu ứng ngẫu nhiên hay không trong mô hình (xem ví dụ, Pinheiro & Bates, 2000, tr. 83-87; tuy nhiên, hãy xem Barr, Levy, Scheepers, & Tily, 2013). Và tất nhiên, có các kỹ thuật so sánh mô hình cổ điển để xác định xem một yếu tố tốt hơn có được bao gồm như một hiệu ứng cố định hay không (ví dụ, -tests). Nhưng tôi nghĩ rằng việc xác định liệu một yếu tố được coi là cố định hay ngẫu nhiên thường tốt nhất là một câu hỏi khái niệm, được trả lời bằng cách xem xét thiết kế nghiên cứu và bản chất của các kết luận được rút ra từ nó.F
Một trong những người hướng dẫn thống kê tốt nghiệp của tôi, Gary McClelland, thích nói rằng có lẽ câu hỏi cơ bản của suy luận thống kê là: "So với cái gì?" Theo Gary, tôi nghĩ chúng ta có thể đóng khung câu hỏi khái niệm mà tôi đã đề cập ở trên như: Lớp tham chiếu của các kết quả thử nghiệm giả định mà tôi muốn so sánh kết quả quan sát thực tế của mình là gì? Ở trong bối cảnh tâm lý học và xem xét một thiết kế thử nghiệm trong đó chúng ta có một mẫu Đối tượng phản ứng với một mẫu Từ được phân loại theo một trong hai Điều kiện (thiết kế cụ thể được thảo luận bởi Clark, 1973), tôi sẽ tập trung vào hai khả năng:
- Tập hợp các thử nghiệm trong đó, đối với mỗi thử nghiệm, chúng tôi vẽ một mẫu Đối tượng mới, một mẫu Từ mới và một mẫu lỗi mới từ mô hình tổng quát. Theo mô hình này, Chủ đề và Từ ngữ đều là hiệu ứng ngẫu nhiên.
- Tập hợp các thử nghiệm trong đó, đối với mỗi thử nghiệm, chúng tôi vẽ một mẫu Đối tượng mới và một mẫu lỗi mới, nhưng chúng tôi luôn sử dụng cùng một bộ Từ . Theo mô hình này, Chủ đề là các hiệu ứng ngẫu nhiên nhưng Từ là hiệu ứng cố định.
Để thực hiện điều này hoàn toàn cụ thể, dưới đây là một số sơ đồ từ (trên) 4 bộ kết quả giả thuyết từ 4 thí nghiệm mô phỏng theo Mô hình 1; (bên dưới) 4 bộ kết quả giả thuyết từ 4 thử nghiệm mô phỏng theo Mô hình 2. Mỗi thử nghiệm xem kết quả theo hai cách: (bảng bên trái) được nhóm theo Đối tượng, với Chủ đề theo Điều kiện có nghĩa được vẽ và gắn với nhau cho từng Đối tượng; (bảng bên phải) được nhóm theo từ, với các ô hình hộp tóm tắt phân phối câu trả lời cho mỗi từ. Tất cả các thí nghiệm liên quan đến 10 Đối tượng phản ứng với 10 từ và trong tất cả các thử nghiệm, "giả thuyết khống" không có sự khác biệt về Điều kiện là đúng trong dân số có liên quan.
Cả hai chủ đề và từ ngẫu nhiên: 4 thí nghiệm mô phỏng
Lưu ý ở đây rằng trong mỗi thử nghiệm, cấu hình phản hồi cho Chủ đề và Từ hoàn toàn khác nhau. Đối với Đối tượng, đôi khi chúng tôi nhận được phản hồi tổng thể thấp, đôi khi phản hồi cao, đôi khi Đối tượng có xu hướng hiển thị sự khác biệt lớn về Điều kiện và đôi khi Đối tượng có xu hướng hiển thị chênh lệch Điều kiện nhỏ. Tương tự như vậy, đối với các từ, đôi khi chúng ta nhận được các từ có xu hướng gợi ra các phản hồi thấp và đôi khi nhận được các từ có xu hướng gợi ra các phản hồi cao.
Đối tượng ngẫu nhiên, Từ cố định: 4 thí nghiệm mô phỏng
Lưu ý ở đây là trên 4 thử nghiệm mô phỏng, các Chủ đề trông khác nhau mỗi lần, nhưng cấu hình phản hồi cho các từ về cơ bản trông giống nhau, phù hợp với giả định rằng chúng tôi đang sử dụng cùng một bộ Từ cho mọi thử nghiệm trong mô hình này.
Sự lựa chọn của chúng tôi về việc chúng tôi nghĩ Mô hình 1 (Đối tượng và Từ cả ngẫu nhiên) hay Mô hình 2 (Đối tượng ngẫu nhiên, Từ cố định) cung cấp lớp tham chiếu phù hợp cho kết quả thử nghiệm mà chúng tôi thực sự quan sát có thể tạo ra sự khác biệt lớn đối với đánh giá của chúng tôi về việc thao tác Điều kiện "đã làm việc." Chúng tôi mong đợi sự thay đổi cơ hội nhiều hơn trong dữ liệu trong Mô hình 1 so với Mô hình 2, vì có nhiều "bộ phận chuyển động" hơn. Vì vậy, nếu kết luận mà chúng tôi muốn đưa ra phù hợp hơn với các giả định của Mô hình 1, trong đó độ biến thiên cơ hội tương đối cao hơn, nhưng chúng tôi phân tích dữ liệu của chúng tôi theo các giả định của Mô hình 2, trong đó biến thiên cơ hội tương đối thấp hơn, thì lỗi Loại 1 của chúng tôi tỷ lệ để kiểm tra sự khác biệt Điều kiện sẽ được tăng lên ở một mức độ nào đó (có thể khá lớn). Để biết thêm thông tin, xem các tài liệu tham khảo dưới đây.
Tài liệu tham khảo
Baayen, rh, Davidson, DJ, & Bates, DM (2008). Mô hình hiệu ứng hỗn hợp với các hiệu ứng ngẫu nhiên chéo cho các đối tượng và vật phẩm. Tạp chí của bộ nhớ và ngôn ngữ, 59 (4), 390-412. PDF
Barr, DJ, Levy, R., Scheepers, C., & Tily, HJ (2013). Cấu trúc hiệu ứng ngẫu nhiên để kiểm tra giả thuyết xác nhận: Giữ cho nó tối đa. Tạp chí bộ nhớ và ngôn ngữ, 68 (3), 255-278. PDF
Clark, HH (1973). Ngụy biện ngôn ngữ như cố định: Một bài phê bình về thống kê ngôn ngữ trong nghiên cứu tâm lý học. Tạp chí học tập bằng lời nói và hành vi bằng lời nói, 12 (4), 335-359. PDF
Coleman, EB (1964). Tổng quát hóa cho một dân số ngôn ngữ. Báo cáo tâm lý, 14 (1), 219-226.
Judd, CM, Westfall, J., & Kenny, DA (2012). Xử lý các kích thích như một yếu tố ngẫu nhiên trong tâm lý học xã hội: một giải pháp mới và toàn diện cho một vấn đề phổ biến nhưng phần lớn bị bỏ qua. Tạp chí tính cách và tâm lý xã hội, 103 (1), 54. PDF
Murayama, K., Sakaki, M., Yan, VX, & Smith, GM (2014). Lạm phát lỗi loại I trong phân tích người tham gia truyền thống đến độ chính xác siêu hình: Một quan điểm mô hình hiệu ứng hỗn hợp tổng quát. Tạp chí Tâm lý học Thực nghiệm: Học tập, Trí nhớ và Nhận thức. PDF
Pinheiro, JC, & Bates, DM (2000). Các mô hình hiệu ứng hỗn hợp trong S và S-PLUS. Mùa xuân.
Raaijmakers, JG, Schrijnemakers, J., & Gremmen, F. (1999). Làm thế nào để đối phó với những lời ngụy biện về ngôn ngữ có hiệu lực cố định ngôn ngữ: Những quan niệm sai lầm phổ biến và giải pháp thay thế. Tạp chí bộ nhớ và ngôn ngữ, 41 (3), 416-426. PDF