Tôi có một bộ dữ liệu chứa nhiều tỷ lệ cộng với 1. Tôi quan tâm đến sự thay đổi của các tỷ lệ này dọc theo một gradient (xem bên dưới để biết dữ liệu).
gradient <- 1:99
A1 <- gradient * 0.005
A2 <- gradient * 0.004
A3 <- 1 - (A1 + A2)
df <- data.frame(gradient = gradient,
A1 = A1,
A2 = A2,
A3 = A3)
require(ggplot2)
require(reshape2)
dfm <- melt(df, id = "gradient")
ggplot(dfm, aes(x = gradient, y = value, fill = variable)) +
geom_area()
Thông tin bổ sung: Không nhất thiết phải tuyến tính, tôi đã làm điều này chỉ để dễ lấy ví dụ. Số lượng ban đầu mà từ đó các tỷ lệ này được tính toán cũng có sẵn. Tập dữ liệu thực có chứa nhiều biến hơn khi thêm tới 1 (ví dụ: B1, B2 & B3, C1 đến C4, v.v.) - vì vậy, một gợi ý cho giải pháp đa biến cũng sẽ hữu ích ... Nhưng bây giờ tôi sẽ sử dụng đơn biến bên thống kê.
Câu hỏi: Làm thế nào người ta có thể phân tích loại dữ liệu như vậy? Tôi đã đọc một chút xung quanh, và có lẽ một mô hình đa quốc gia hoặc một glm là phù hợp? - Nếu tôi chạy 3 (hoặc 2) glms, làm cách nào tôi có thể kết hợp ràng buộc mà các giá trị dự đoán tổng hợp lên tới 1? Tôi không muốn chỉ vẽ loại dữ liệu như vậy, tôi cũng muốn thực hiện một hồi quy sâu hơn như phân tích. Tôi tốt nhất muốn sử dụng R - làm thế nào tôi có thể làm điều này trong R?
proprcspline
trong Stata có thể là thứ bạn đang tìm kiếm (tôi biết bạn muốn sử dụngR
, nhưng có thể đây là điểm khởi đầu): proprcspline tính toán một khối spline bị giới hạn theo tỷ lệ quan sát trong từng loại của yvar cho xvar và đồ thị chúng như một âm mưu khu vực xếp chồng lên nhau. Tùy chọn, các tỷ lệ được làm mịn này có thể được điều chỉnh cho một tập hợp các biến điều khiển (cvars).