Phản hồi này sẽ thảo luận về các mô hình có thể từ góc độ đo lường , trong đó chúng ta được cung cấp một tập hợp các biến hoặc các biện pháp có liên quan (biểu hiện) được quan sát, được sử dụng để đo lường một cấu trúc được xác định rõ nhưng không thể quan sát trực tiếp (nói chung, trong một phản xạ cách), sẽ được coi là một biến tiềm ẩn . Nếu bạn không quen thuộc với mô hình đo lường đặc điểm tiềm ẩn, tôi sẽ đề xuất hai bài viết sau: Cuộc tấn công của các nhà tâm lý học , bởi Denny Borsbooom, và Mô hình biến đổi tiềm ẩn: Một khảo sát , bởi Anders Skrondal và Sophia Rabe-Hesketh. Trước tiên tôi sẽ thực hiện một hồi quy nhẹ với các chỉ số nhị phân trước khi xử lý các mục có nhiều loại phản hồi.
Một cách để chuyển đổi dữ liệu cấp thứ tự thành thang đo khoảng là sử dụng một số loại mô hình Phản hồi vật phẩm . Một ví dụ nổi tiếng là mô hình Rasch , mở rộng ý tưởng của mô hình thử nghiệm song song từ lý thuyết thử nghiệm cổ điển để đối phó với các mặt hàng được ghi nhị phânthông qua mô hình tuyến tính hiệu ứng hỗn hợp tổng quát (với liên kết logit) (trong một số triển khai phần mềm 'hiện đại'), trong đó xác suất chứng thực một mặt hàng nhất định là một chức năng của 'độ khó vật phẩm' và 'khả năng cá nhân' (giả sử không có tương tác giữa vị trí của một người trên đặc điểm tiềm ẩn được đo và vị trí vật phẩm trên cùng thang đo logit - có thể được nắm bắt thông qua một tham số phân biệt vật phẩm bổ sung hoặc tương tác với các đặc điểm riêng của từng cá thể - được gọi là chức năng của vật phẩm khác biệt ). Cấu trúc cơ bản được giả định là không có chiều cao và logic của mô hình Rasch chỉ là người được hỏi có một 'số lượng cấu trúc' nhất định - hãy nói về trách nhiệm của chủ thể (khả năng của anh ấy / cô ấy),θθ
N= 766α = 0,971[ 0,967 ; 0,975 ]). Ban đầu, năm loại phản hồi đã được đề xuất (1 = 'Không bao giờ', 2 = 'Hiếm khi', 3 = 'Đôi khi', 4 = 'Thường xuyên' và 5 = 'Luôn luôn') cho mỗi mục. Chúng tôi ở đây sẽ chỉ xem xét các câu trả lời được ghi điểm nhị phân.
(Ở đây, phản hồi cho các mục loại Likert đã được mã hóa thành phản hồi nhị phân (1/2 = 0, 3-5 = 1) và chúng tôi xem xét rằng mỗi mục đều phân biệt đối xử ngang nhau giữa các cá nhân, do đó tính song song giữa các đường cong của vật phẩm (Rasch mô hình).)
x
Đối với các mặt hàng đa hình với các danh mục được đặt hàng, có một số lựa chọn: mô hình tín dụng một phần , mô hình thang đánh giá hoặc mô hình phản hồi được phân loại , để đặt tên nhưng một số ít được sử dụng trong nghiên cứu ứng dụng. Hai cái đầu tiên thuộc về cái gọi là "họ Rasch" của các mô hình IRT và chia sẻ các thuộc tính sau: (a) tính đơn điệu của hàm xác suất phản hồi (đường cong phản hồi của vật phẩm / danh mục), (b) đủ số điểm cá nhân (có độ trễ tham số được coi là cố định), (c) tính độc lập cục bộ có nghĩa là phản ứng với các mục là độc lập, có điều kiện dựa trên đặc điểm tiềm ẩn và (d) không có chức năng của mục vi phân có nghĩa là, có điều kiện về đặc điểm tiềm ẩn, các phản ứng không phụ thuộc vào các biến số cụ thể của từng cá nhân bên ngoài (ví dụ: giới tính, tuổi tác, dân tộc, SES).
Mở rộng ví dụ trước cho trường hợp năm loại phản ứng được tính toán một cách hiệu quả, một bệnh nhân sẽ có xác suất cao hơn trong việc lựa chọn loại 3 đến 5, so với người được lấy mẫu từ dân số nói chung, không có bất kỳ rối loạn nào liên quan đến lo âu. So với mô hình của vật phẩm nhị phân được mô tả ở trên, các mô hình này xem xét tích lũy (ví dụ: tỷ lệ trả lời 3 so với 2 hoặc ít hơn) hoặc ngưỡng danh mục liền kề (tỷ lệ trả lời 3 so với 2), cũng được thảo luận trong Phân loại của Agresti's Phân tích dữ liệu(chương 12). Sự khác biệt chính giữa các mô hình đã nói ở trên nằm ở cách chuyển đổi từ loại phản ứng này sang loại khác: mô hình tín dụng một phần không cho rằng sự khác biệt giữa bất kỳ vị trí ngưỡng nhất định và giá trị trung bình của vị trí ngưỡng trên đặc điểm tiềm ẩn là bằng hoặc thống nhất giữa các mặt hàng, trái với mô hình thang đánh giá. Một sự khác biệt tinh tế giữa các mô hình đó là một số trong số chúng (như phản hồi được phân loại không giới hạn hoặc mô hình tín dụng một phần) cho phép các tham số phân biệt đối xử không đồng đều giữa các mục. Xem Áp dụng mô hình lý thuyết trả lời vật phẩm để đánh giá các thuộc tính câu hỏi và thang đo của Reeve và Fayers, hoặc Cơ sở của lý thuyết trả lời vật phẩm , của Frank B. Baker, để biết thêm chi tiết.
Bởi vì trong trường hợp trước, chúng tôi đã thảo luận về việc giải thích các đường cong xác suất phản hồi cho các mục được ghi điểm nhị phân, chúng ta hãy xem các đường cong phản ứng của mục có nguồn gốc từ một mô hình phản hồi được phân loại, làm nổi bật các mục tiêu tương tự:
(Mô hình phản hồi được phân loại không giới hạn, cho phép phân biệt đối xử không đồng đều giữa các mục.)
Ở đây, các quan sát sau đây xứng đáng được xem xét:
- [ 2 ; 2,5 ]
- Có một sự thay đổi tổng thể, từ trái sang phải, giữa mục đánh giá chất lượng giấc ngủ và những người đánh giá tình trạng nghiêm trọng hơn, mặc dù rối loạn giấc ngủ không phải là hiếm. Điều này được mong đợi: xét cho cùng, ngay cả những người trong dân số nói chung cũng có thể gặp khó khăn khi ngủ, không phụ thuộc vào tình trạng sức khỏe của họ và những người bị trầm cảm hoặc lo lắng nghiêm trọng có khả năng biểu hiện những vấn đề như vậy. Tuy nhiên, 'người bình thường' (nếu điều này có ý nghĩa gì) dường như không có dấu hiệu rối loạn hoảng sợ (xác suất họ chọn loại phản ứng cao nhất là 0 đối với những người nằm trong phạm vi trung gian trở lên của đặc điểm tiềm ẩn, [ 0; 1]).
θ
Bên cạnh việc được coi là mô hình đo lường thực sự , điều làm cho mô hình Rasch hấp dẫn là điểm tổng, như một thống kê đầy đủ , có thể được sử dụng làm đại diện thay thế cho điểm số tiềm ẩn. Ngoài ra, thuộc tính đầy đủ dễ dàng bao hàm sự phân tách của các tham số mô hình (người và vật phẩm) (trong trường hợp vật phẩm đa hình, người ta không nên quên rằng mọi thứ đều áp dụng ở cấp độ của loại phản ứng vật phẩm), do đó gây nghiện.
Một đánh giá tốt của hệ thống phân cấp mô hình IRT, với thực hiện R, có sẵn trong bài viết Mair và Hatzinger của công bố trên Tạp chí của phần mềm thống kê : Mở rộng Rasch Làm mẫu: erm trọn gói cho việc áp dụng các mô hình IRT trong R . Các mô hình khác bao gồm các mô hình log-linear , mô hình không tham số, như mô hình Mokken hoặc mô hình đồ họa .
Ngoài R, tôi không biết về triển khai Excel, nhưng một số gói thống kê đã được đề xuất cho chủ đề này: Làm thế nào để bắt đầu với việc áp dụng lý thuyết phản hồi mục và sử dụng phần mềm nào?
Cuối cùng, nếu bạn muốn nghiên cứu mối quan hệ giữa một tập hợp các mục và biến phản ứng mà không cần dùng đến mô hình đo lường, một số hình thức lượng tử hóa biến đổi thông qua tỷ lệ tối ưu cũng có thể thú vị. Ngoài việc triển khai R được thảo luận trong các luồng đó, các giải pháp SPSS cũng được đề xuất trên các luồng liên quan .
Người giới thiệu
- Pilkonis, P., Choi, S., Reise, S., Stover, A. và Riley, W. et al. (2011). Các ngân hàng vật phẩm để giải thích sự đau khổ về cảm xúc từ hệ thống thông tin đo lường kết quả bệnh nhân được báo cáo (Promis): Trầm cảm, lo lắng và tức giận . Đánh giá , 18 (3), 263 Từ283.
- Choi, S., Gibbons, L. và Crane, P. (2011). lordif: Một gói R để phát hiện chức năng của vi sai bằng cách sử dụng hồi quy logistic thứ tự lai lặp / Mô phỏng đáp ứng vật phẩm và mô phỏng monte carlo . Tạp chí phần mềm thống kê , 39 (8).