Làm thế nào để chuyển đổi dữ liệu thứ tự từ bảng câu hỏi thành dữ liệu khoảng thời gian thích hợp?

Có bất kỳ phương pháp đơn giản nào để chuyển đổi dữ liệu mức thứ tự thành mức khoảng (giống như có cách thực hiện theo cách khác) không? Và có thể thực hiện trong Excel hoặc SPSS?

Có dữ liệu, giả sử: 10 câu hỏi ở cấp thứ tự (nói tỷ lệ 0-5, trong đó 0 = "hoàn toàn không", 5 = "mọi lúc"), tôi muốn điều chỉnh chúng để chúng có thể được coi là phù hợp dữ liệu mức độ cho các mục đích thử nghiệm tham số (phân phối bình thường, thử nghiệm không tham số ra khỏi câu hỏi).

Sẽ vô cùng biết ơn câu trả lời!

— Gil
nguồn

Làm thế nào người ta có thể có các giá trị 6, 7, 8, 9, 10 trên thang điểm 0-5 hoặc tôi bỏ lỡ điều gì?

— ttnphns

Bạn có ý nghĩa gì bởi đơn giản? Để chuyển đổi các biến phân loại thành thang đo hệ mét không phải là một nhiệm vụ đơn giản. Có một số mô hình biến tiềm ẩn (như mô hình IRT), với các giả định nhất định được giữ, cho phép thực hiện điều đó. Một cách khác là nhân rộng tối ưu. Nhưng đối với điều này, tôi cho rằng bạn phải sẵn sàng làm mọi thứ với R và đi sâu vào một số thống kê nâng cao như mô hình biến tiềm ẩn hoặc PCA phi tuyến. Nghe có ổn không?

— Momo

Phản hồi này sẽ thảo luận về các mô hình có thể từ góc độ đo lường , trong đó chúng ta được cung cấp một tập hợp các biến hoặc các biện pháp có liên quan (biểu hiện) được quan sát, được sử dụng để đo lường một cấu trúc được xác định rõ nhưng không thể quan sát trực tiếp (nói chung, trong một phản xạ cách), sẽ được coi là một biến tiềm ẩn . Nếu bạn không quen thuộc với mô hình đo lường đặc điểm tiềm ẩn, tôi sẽ đề xuất hai bài viết sau: Cuộc tấn công của các nhà tâm lý học , bởi Denny Borsbooom, và Mô hình biến đổi tiềm ẩn: Một khảo sát , bởi Anders Skrondal và Sophia Rabe-Hesketh. Trước tiên tôi sẽ thực hiện một hồi quy nhẹ với các chỉ số nhị phân trước khi xử lý các mục có nhiều loại phản hồi.

Một cách để chuyển đổi dữ liệu cấp thứ tự thành thang đo khoảng là sử dụng một số loại mô hình Phản hồi vật phẩm . Một ví dụ nổi tiếng là mô hình Rasch , mở rộng ý tưởng của mô hình thử nghiệm song song từ lý thuyết thử nghiệm cổ điển để đối phó với các mặt hàng được ghi nhị phânthông qua mô hình tuyến tính hiệu ứng hỗn hợp tổng quát (với liên kết logit) (trong một số triển khai phần mềm 'hiện đại'), trong đó xác suất chứng thực một mặt hàng nhất định là một chức năng của 'độ khó vật phẩm' và 'khả năng cá nhân' (giả sử không có tương tác giữa vị trí của một người trên đặc điểm tiềm ẩn được đo và vị trí vật phẩm trên cùng thang đo logit - có thể được nắm bắt thông qua một tham số phân biệt vật phẩm bổ sung hoặc tương tác với các đặc điểm riêng của từng cá thể - được gọi là chức năng của vật phẩm khác biệt ). Cấu trúc cơ bản được giả định là không có chiều cao và logic của mô hình Rasch chỉ là người được hỏi có một 'số lượng cấu trúc' nhất định - hãy nói về trách nhiệm của chủ thể (khả năng của anh ấy / cô ấy), $\theta$ $\theta$

$N=766$ $\alpha=0.971$ $[0.967;0.975]$ ). Ban đầu, năm loại phản hồi đã được đề xuất (1 = 'Không bao giờ', 2 = 'Hiếm khi', 3 = 'Đôi khi', 4 = 'Thường xuyên' và 5 = 'Luôn luôn') cho mỗi mục. Chúng tôi ở đây sẽ chỉ xem xét các câu trả lời được ghi điểm nhị phân.

nhập mô tả hình ảnh ở đây
_{(Ở đây, phản hồi cho các mục loại Likert đã được mã hóa thành phản hồi nhị phân (1/2 = 0, 3-5 = 1) và chúng tôi xem xét rằng mỗi mục đều phân biệt đối xử ngang nhau giữa các cá nhân, do đó tính song song giữa các đường cong của vật phẩm (Rasch mô hình).)}

$x$

Đối với các mặt hàng đa hình với các danh mục được đặt hàng, có một số lựa chọn: mô hình tín dụng một phần , mô hình thang đánh giá hoặc mô hình phản hồi được phân loại , để đặt tên nhưng một số ít được sử dụng trong nghiên cứu ứng dụng. Hai cái đầu tiên thuộc về cái gọi là "họ Rasch" của các mô hình IRT và chia sẻ các thuộc tính sau: (a) tính đơn điệu của hàm xác suất phản hồi (đường cong phản hồi của vật phẩm / danh mục), (b) đủ số điểm cá nhân (có độ trễ tham số được coi là cố định), (c) tính độc lập cục bộ có nghĩa là phản ứng với các mục là độc lập, có điều kiện dựa trên đặc điểm tiềm ẩn và (d) không có chức năng của mục vi phân có nghĩa là, có điều kiện về đặc điểm tiềm ẩn, các phản ứng không phụ thuộc vào các biến số cụ thể của từng cá nhân bên ngoài (ví dụ: giới tính, tuổi tác, dân tộc, SES).

Mở rộng ví dụ trước cho trường hợp năm loại phản ứng được tính toán một cách hiệu quả, một bệnh nhân sẽ có xác suất cao hơn trong việc lựa chọn loại 3 đến 5, so với người được lấy mẫu từ dân số nói chung, không có bất kỳ rối loạn nào liên quan đến lo âu. So với mô hình của vật phẩm nhị phân được mô tả ở trên, các mô hình này xem xét tích lũy (ví dụ: tỷ lệ trả lời 3 so với 2 hoặc ít hơn) hoặc ngưỡng danh mục liền kề (tỷ lệ trả lời 3 so với 2), cũng được thảo luận trong Phân loại của Agresti's Phân tích dữ liệu(chương 12). Sự khác biệt chính giữa các mô hình đã nói ở trên nằm ở cách chuyển đổi từ loại phản ứng này sang loại khác: mô hình tín dụng một phần không cho rằng sự khác biệt giữa bất kỳ vị trí ngưỡng nhất định và giá trị trung bình của vị trí ngưỡng trên đặc điểm tiềm ẩn là bằng hoặc thống nhất giữa các mặt hàng, trái với mô hình thang đánh giá. Một sự khác biệt tinh tế giữa các mô hình đó là một số trong số chúng (như phản hồi được phân loại không giới hạn hoặc mô hình tín dụng một phần) cho phép các tham số phân biệt đối xử không đồng đều giữa các mục. Xem Áp dụng mô hình lý thuyết trả lời vật phẩm để đánh giá các thuộc tính câu hỏi và thang đo của Reeve và Fayers, hoặc Cơ sở của lý thuyết trả lời vật phẩm , của Frank B. Baker, để biết thêm chi tiết.

Bởi vì trong trường hợp trước, chúng tôi đã thảo luận về việc giải thích các đường cong xác suất phản hồi cho các mục được ghi điểm nhị phân, chúng ta hãy xem các đường cong phản ứng của mục có nguồn gốc từ một mô hình phản hồi được phân loại, làm nổi bật các mục tiêu tương tự:

nhập mô tả hình ảnh ở đây
_{(Mô hình phản hồi được phân loại không giới hạn, cho phép phân biệt đối xử không đồng đều giữa các mục.)}

Ở đây, các quan sát sau đây xứng đáng được xem xét:

$[2;2.5]$
Có một sự thay đổi tổng thể, từ trái sang phải, giữa mục đánh giá chất lượng giấc ngủ và những người đánh giá tình trạng nghiêm trọng hơn, mặc dù rối loạn giấc ngủ không phải là hiếm. Điều này được mong đợi: xét cho cùng, ngay cả những người trong dân số nói chung cũng có thể gặp khó khăn khi ngủ, không phụ thuộc vào tình trạng sức khỏe của họ và những người bị trầm cảm hoặc lo lắng nghiêm trọng có khả năng biểu hiện những vấn đề như vậy. Tuy nhiên, 'người bình thường' (nếu điều này có ý nghĩa gì) dường như không có dấu hiệu rối loạn hoảng sợ (xác suất họ chọn loại phản ứng cao nhất là 0 đối với những người nằm trong phạm vi trung gian trở lên của đặc điểm tiềm ẩn, [ 0; 1]).

$\theta$

Bên cạnh việc được coi là mô hình đo lường thực sự , điều làm cho mô hình Rasch hấp dẫn là điểm tổng, như một thống kê đầy đủ , có thể được sử dụng làm đại diện thay thế cho điểm số tiềm ẩn. Ngoài ra, thuộc tính đầy đủ dễ dàng bao hàm sự phân tách của các tham số mô hình (người và vật phẩm) (trong trường hợp vật phẩm đa hình, người ta không nên quên rằng mọi thứ đều áp dụng ở cấp độ của loại phản ứng vật phẩm), do đó gây nghiện.

Một đánh giá tốt của hệ thống phân cấp mô hình IRT, với thực hiện R, có sẵn trong bài viết Mair và Hatzinger của công bố trên Tạp chí của phần mềm thống kê : Mở rộng Rasch Làm mẫu: erm trọn gói cho việc áp dụng các mô hình IRT trong R . Các mô hình khác bao gồm các mô hình log-linear , mô hình không tham số, như mô hình Mokken hoặc mô hình đồ họa .

Ngoài R, tôi không biết về triển khai Excel, nhưng một số gói thống kê đã được đề xuất cho chủ đề này: Làm thế nào để bắt đầu với việc áp dụng lý thuyết phản hồi mục và sử dụng phần mềm nào?

Cuối cùng, nếu bạn muốn nghiên cứu mối quan hệ giữa một tập hợp các mục và biến phản ứng mà không cần dùng đến mô hình đo lường, một số hình thức lượng tử hóa biến đổi thông qua tỷ lệ tối ưu cũng có thể thú vị. Ngoài việc triển khai R được thảo luận trong các luồng đó, các giải pháp SPSS cũng được đề xuất trên các luồng liên quan .

Người giới thiệu

Pilkonis, P., Choi, S., Reise, S., Stover, A. và Riley, W. et al. (2011). Các ngân hàng vật phẩm để giải thích sự đau khổ về cảm xúc từ hệ thống thông tin đo lường kết quả bệnh nhân được báo cáo (Promis): Trầm cảm, lo lắng và tức giận . Đánh giá , 18 (3), 263 Từ283.
Choi, S., Gibbons, L. và Crane, P. (2011). lordif: Một gói R để phát hiện chức năng của vi sai bằng cách sử dụng hồi quy logistic thứ tự lai lặp / Mô phỏng đáp ứng vật phẩm và mô phỏng monte carlo . Tạp chí phần mềm thống kê , 39 (8).

— chl
nguồn

@Momo Cảm ơn. Thật tò mò. Trong khi trả lời (và xác nhận lại câu trả lời này ngày hôm nay), tôi đã không nhận thấy bình luận của bạn đáng giá +1. Xin vui lòng, chỉnh sửa phản hồi của tôi, nơi bạn thấy phù hợp.

— chl

Trong cuốn sách Phân tích dữ liệu phân loại thông thường , Alan Agresti trình bày nhiều vấn đề. Một trong số đó là sự bỏ đi, mà tôi thảo luận trên blog của mình

— Peter Flom - Tái lập Monica
nguồn

Bạn có thể giải thích điều này nhiều hơn một chút? Thoạt đầu, có vẻ như bất kỳ phương pháp nào tuyên bố dịch dữ liệu khách quan sang dữ liệu định kỳ đều là điều kỳ diệu, vì dường như bạn luôn có thể đưa ra các phản ứng bệnh lý không "phá vỡ" bất kỳ phương pháp nào, nhưng tôi có thể bị mất một cái gì đó quan trọng Có vẻ như nó sẽ đòi hỏi một số khái niệm tiên nghiệm về khoảng cách giữa các loại thứ tự - nó đến từ đâu?

— Macro

Các công thức có trong bài đăng trên blog và một cuộc thảo luận đầy đủ trong cuốn sách của Agresti, nhưng về cơ bản, nó sử dụng dữ liệu để tạo ra "tỷ lệ tích lũy trung bình" và sau đó sử dụng chúng làm điểm số. Khoảng cách đến từ tỷ lệ trong mỗi phản hồi, chứ không phải từ bất cứ điều gì trong chính danh mục.

— Peter Flom - Tái lập Monica

+1. Ridits dễ dàng được giải thích là phân số nhỏ hơn (1/2) phần bằng nhau. Do đó, nếu 1, 2, 3, 4, 5 đã quan sát các phân số hoặc xác suất 0,2, 0,4, 0,2, 0,1, 0,1, thì số bỏ của 1 là 0,1; của 2 là 0,4, v.v ... Thoát khỏi các loại điều trị đối xứng và ít có khả năng hơn phân số ít hơn hoặc phân số nhiều hơn để bao gồm 0 hoặc 1 do đó, điều này thường gây khó xử.

— Nick Cox

Tên bỏ đi đã được Bross dự định một cách lịch sự (lưu ý: cần tham khảo) và lời giải thích được cho là vô nghĩa. Tên tốt hơn là chức năng phân phối giữa (Parzen 1993) và chức năng cấp Haberman (1996). Haberman, SJ 1996. Thống kê nâng cao Tập I: Mô tả về quần thể . New York: Mùa xuân. Parzen, E. 1993. Thay đổi biểu đồ PP và hàm lượng tử mẫu liên tục. Truyền thông trong Thống kê - Lý thuyết và Phương pháp 22: 3287-3304.

— Nick Cox

Các bản thân có thể được đẩy qua các hàm lượng tử bình thường hoặc Gaussian.

— Nick Cox