Tôi đang chạy mô hình hồi quy LOESS trong R và tôi muốn so sánh kết quả đầu ra của 12 mô hình khác nhau với các cỡ mẫu khác nhau. Tôi có thể mô tả các mô hình thực tế chi tiết hơn nếu nó giúp trả lời câu hỏi.
Dưới đây là các cỡ mẫu:
Fastballs vs RHH 2008-09: 2002
Fastballs vs LHH 2008-09: 2209
Fastballs vs RHH 2010: 527
Fastballs vs LHH 2010: 449
Changeups vs RHH 2008-09: 365
Changeups vs LHH 2008-09: 824
Changeups vs RHH 2010: 201
Changeups vs LHH 2010: 330
Curveballs vs RHH 2008-09: 488
Curveballs vs LHH 2008-09: 483
Curveballs vs RHH 2010: 213
Curveballs vs LHH 2010: 162
Mô hình hồi quy LOESS là một bề mặt phù hợp, trong đó vị trí X và vị trí Y của mỗi sân bóng chày được sử dụng để dự đoán sw, xác suất vung vợt. Tuy nhiên, tôi muốn so sánh giữa tất cả 12 mô hình này, nhưng đặt cùng một khoảng (tức là span = 0,5) sẽ mang lại kết quả khác nhau vì có một loạt các cỡ mẫu như vậy.
Câu hỏi cơ bản của tôi là làm thế nào để bạn xác định khoảng của mô hình của bạn? Một nhịp cao hơn làm giảm sự phù hợp hơn, trong khi một nhịp thấp hơn nắm bắt được nhiều xu hướng hơn nhưng lại gây ra tiếng ồn thống kê nếu có quá ít dữ liệu. Tôi sử dụng nhịp cao hơn cho cỡ mẫu nhỏ hơn và nhịp thấp hơn cho cỡ mẫu lớn hơn.
Tôi nên làm gì? Quy tắc tốt khi cài đặt nhịp cho các mô hình hồi quy LOESS trong R là gì? Cảm ơn trước!