Câu trả lời:
@ Scortchi đã giúp bạn có câu trả lời này trên Mã hóa cho một hiệp phương thức được đặt hàng . Tôi đã lặp lại khuyến nghị về câu trả lời của tôi về Hiệu quả của hai IV nhân khẩu học đối với câu trả lời khảo sát (thang đo Likert) . Cụ thể, khuyến nghị là sử dụng Gertheiss' (2013) ordPens gói , và để tham khảo Gertheiss và Tutz (2009a) cho nền tảng lý thuyết và nghiên cứu mô phỏng.
Hàm cụ thể mà bạn có thể muốn là ordSmooth
* . Điều này về cơ bản làm mịn các hệ số giả qua các cấp của các biến số thứ tự ít khác biệt so với các hệ số cho các cấp bậc liền kề, giúp giảm quá mức và cải thiện dự đoán. Nó thường thực hiện tốt hơn hoặc (đôi khi nhiều) tốt hơn so với ước tính tối đa (nghĩa là bình phương nhỏ nhất trong trường hợp này) của mô hình hồi quy cho dữ liệu liên tục (hoặc theo thuật ngữ, số liệu) khi dữ liệu thực sự là thứ tự. Nó xuất hiện tương thích với tất cả các loại mô hình tuyến tính tổng quát và cho phép bạn nhập các dự đoán danh nghĩa và liên tục dưới dạng ma trận riêng biệt.
Một số tài liệu tham khảo bổ sung từ Gertheiss, Tutz và các đồng nghiệp có sẵn và được liệt kê dưới đây. Một số trong số này có thể chứa các lựa chọn thay thế - thậm chí Gertheiss và Tutz (2009a) thảo luận về việc gợn sóng lại như là một lựa chọn khác. Tôi đã không tự mình tìm hiểu tất cả, nhưng đủ để nói điều này giải quyết vấn đề của @ Erik về quá ít tài liệu về các dự đoán thứ tự!
Người giới thiệu
- Gertheiss, J. (2013, ngày 14 tháng 6). ordPens: Lựa chọn và / hoặc làm mịn các yếu tố dự đoán thứ tự , phiên bản 0.2-1. Lấy từ http://cran.r-project.org/web/packages/ordPens/ordPens.pdf .
- Gertheiss, J., Hogger, S., Oberhauser, C., & Tutz, G. (2011). Lựa chọn các biến độc lập có quy mô thông thường với các ứng dụng để phân loại quốc tế các bộ lõi hoạt động. Tạp chí của Hiệp hội Thống kê Hoàng gia: Sê-ri C (Thống kê ứng dụng), 60 (3), 377
- Gertheiss, J., & Tutz, G. (2009a). Hồi quy hình phạt với dự đoán thứ tự. Đánh giá thống kê quốc tế, 77 (3), 345 Công365. Lấy từ http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf .
- Gertheiss, J., & Tutz, G. (2009b). Lựa chọn tính năng được giám sát trong hồ sơ protein dựa trên khối phổ bằng cách tăng cường khối. Tin sinh học, 25 (8), 1076 trừ1077.
- Gertheiss, J., & Tutz, G. (2009c). Thay đổi tỷ lệ và phương pháp lân cận gần nhất. Tạp chí Hóa học, 23 (3), 149 Đỉnh151 . - Gertheiss, J. & Tutz, G. (2010). Mô hình thưa thớt của các biến giải thích chiến lược.
Biên niên sử thống kê ứng dụng, 4 , 2150 bù2180.
- Hofner, B., Hothorn, T., Kneib, T., & Schmid, M. (2011). Một khuôn khổ cho lựa chọn mô hình không thiên vị dựa trên việc tăng cường. Tạp chí thống kê tính toán và đồ họa, 20 (4), 956 Tiết971. Lấy từ http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf .
- Oelker, M.-R., Gertheiss, J., & Tutz, G. (2012). Chính quy hóa và lựa chọn mô hình với các yếu tố dự báo chiến lược và sửa đổi hiệu ứng trong các mô hình tuyến tính tổng quát. Cục Thống kê: Báo cáo kỹ thuật, số 122 . Lấy từ http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf .
- Oelker, M.-R., & Tutz, G. (2013). Một họ các hình phạt chung cho việc kết hợp các loại hình phạt khác nhau trong các mô hình có cấu trúc tổng quát. Cục Thống kê: Báo cáo kỹ thuật, số 139 . Lấy từ http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf .
- Petry, S., Flexeder, C., & Tutz, G. (2011). Cặp đôi hợp nhất Lasso. Cục Thống kê: Báo cáo kỹ thuật, số 102. Lấy từ http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf .
- Rufibach, K. (2010). Một thuật toán thiết lập hoạt động để ước tính các tham số trong các mô hình tuyến tính tổng quát với các yếu tố dự đoán theo thứ tự. Thống kê tính toán & phân tích dữ liệu, 54 (6), 1442 Từ1456. Lấy từ http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail .
- Tutz, G. (2011, tháng 10). Phương pháp chính quy cho dữ liệu phân loại. Munich: Ludwig-Maximilians-Đại học. Lấy từ http://m.wu.ac.at/it/depeces/statmath/resseminar/talktutz.pdf .
- Tutz, G., & Gertheiss, J. (2013). Xếp hạng theo thang đo dự đoán Câu hỏi cũ về mức độ tỷ lệ và một số câu trả lời.Tâm lý học , 1-20.
Khi có nhiều yếu tố dự đoán và yếu tố dự đoán lợi ích là thứ tự, thường rất khó để quyết định cách mã hóa biến. Mã hóa nó dưới dạng phân loại làm mất thông tin đơn hàng, trong khi mã hóa nó dưới dạng số áp đặt tuyến tính lên các tác động của các danh mục có thể khác xa với hiệu ứng thực sự của chúng. Trước đây, hồi quy đẳng hướng đã được đề xuất như một cách để giải quyết tính không đơn điệu, nhưng nó là một quy trình lựa chọn mô hình dựa trên dữ liệu, giống như nhiều quy trình dựa trên dữ liệu khác, đòi hỏi phải đánh giá cẩn thận mô hình được trang bị cuối cùng và tầm quan trọng các tham số của nó. Đối với trường hợp sau, các spline có thể giảm một phần giả định tuyến tính cứng nhắc, nhưng các số vẫn phải được gán cho các danh mục được đặt hàng và kết quả rất nhạy cảm với các lựa chọn này. Trong bài báo của chúng tôi (Li và Người chăn cừu, 2010, Giới thiệu, đoạn 3-5),
Chúng tôi đã phát triển một gói R, PResiduals , có sẵn từ CRAN. Gói chứa các hàm để thực hiện phương pháp của chúng tôi cho các loại kết quả tuyến tính và thứ tự. Chúng tôi đang làm việc để thêm các loại kết quả khác (ví dụ: tính) và các tính năng (ví dụ: cho phép tương tác). Gói này cũng chứa các hàm để tính toán phần dư của chúng tôi, là phần dư quy mô xác suất, cho các mô hình hồi quy khác nhau.
Người giới thiệu
Li, C. & Người chăn cừu, BE (2010). Kiểm tra sự liên kết giữa hai biến số thứ tự trong khi điều chỉnh cho hiệp phương sai. JASA, 105, 612 Từ620.
Li, C. & Người chăn cừu, BE (2012). Một dư mới cho kết quả thứ tự. Biometrika 99, 473 Bức480.
Nói chung, có rất nhiều tài liệu về các biến số thứ tự là phụ thuộc và ít sử dụng chúng làm công cụ dự đoán. Trong thực tế thống kê, chúng thường được coi là liên tục hoặc phân loại. Bạn có thể kiểm tra xem một mô hình tuyến tính với bộ dự đoán là một biến liên tục có giống như một sự phù hợp hay không, bằng cách kiểm tra các phần dư.
Chúng đôi khi cũng được mã hóa tích lũy. Một ví dụ sẽ là một biến số x1 với các cấp 1,2 và 3 có biến nhị phân giả d1 cho x1> 1 và biến nhị phân giả d2 cho x1> 2. Sau đó, hệ số cho d1 là hiệu ứng bạn nhận được khi bạn tăng số thứ tự của mình lên 2 đến 3 và hệ số cho d2 là hiệu ứng bạn nhận được khi bạn thứ tự từ 2 lên 3.
Điều này làm cho việc giải thích thường dễ dàng hơn, nhưng tương đương với việc sử dụng nó như một biến phân loại cho các mục đích thực tế.
Gelman thậm chí còn gợi ý rằng người ta có thể sử dụng bộ dự đoán thứ tự như là một yếu tố phân loại (cho các hiệu ứng chính) và như là biến liên tục (cho các tương tác) để tăng tính linh hoạt của các mô hình.
Chiến lược cá nhân của tôi thường là xem liệu đối xử với họ như là liên tục có ý nghĩa và kết quả trong một mô hình hợp lý và chỉ sử dụng chúng như là phân loại nếu cần thiết.