Tôi đang sử dụng gói quantreg để tạo mô hình hồi quy bằng cách sử dụng phân vị thứ 99 của các giá trị của tôi trong một tập dữ liệu. Dựa trên lời khuyên từ một câu hỏi stackoverflow trước mà tôi đã hỏi, tôi đã sử dụng cấu trúc mã sau đây.
mod <- rq(y ~ log(x), data=df, tau=.99)
pDF <- data.frame(x = seq(1,10000, length=1000) )
pDF <- within(pDF, y <- predict(mod, newdata = pDF) )
mà tôi hiển thị âm mưu trên đầu dữ liệu của tôi. Tôi đã vẽ sơ đồ này bằng ggplot2, với giá trị alpha cho các điểm. Tôi nghĩ rằng phần đuôi phân phối của tôi không được xem xét đầy đủ trong phân tích của tôi. Có lẽ điều này là do thực tế là có những điểm riêng lẻ, đang bị bỏ qua bởi phép đo loại phần trăm.
Một trong những ý kiến cho rằng
Các họa tiết gói bao gồm các phần về hồi quy lượng tử phi tuyến và cả các mô hình với các spline làm mịn, v.v.
Dựa trên câu hỏi trước đây của tôi, tôi đã giả định một mối quan hệ logarit, nhưng tôi không chắc liệu điều đó có đúng không. Tôi nghĩ rằng tôi có thể trích xuất tất cả các điểm ở khoảng phân vị thứ 99 và sau đó kiểm tra chúng một cách riêng biệt, nhưng tôi không chắc làm thế nào để làm điều đó, hoặc nếu đó là một cách tiếp cận tốt. Tôi sẽ đánh giá cao bất kỳ lời khuyên nào về cách cải thiện việc xác định mối quan hệ này.