Giải thích về những gì Nate Silver nói về hoàng thổ


23

Trong một câu hỏi tôi đã hỏi gần đây , tôi đã nói rằng đó là một "không" không lớn để ngoại suy với hoàng thổ. Nhưng, trong bài viết gần đây nhất của Nate Silver trên FiveThentyEight.com , ông đã thảo luận về việc sử dụng hoàng thổ để đưa ra dự đoán bầu cử.

Ông đang thảo luận về các chi tiết cụ thể của các dự báo tích cực và bảo thủ với hoàng thổ nhưng tôi tò mò về tính hợp lệ của việc đưa ra các dự đoán trong tương lai với hoàng thổ?

Tôi cũng quan tâm đến cuộc thảo luận này và những lựa chọn thay thế khác có thể có lợi ích tương tự như hoàng thổ.


Nếu biến x của bạn là thời gian, sẽ rất nguy hiểm khi sử dụng hoàng thổ để dự đoán trong tương lai (sẽ nằm ngoài phạm vi của dữ liệu). Nhưng điều đó không có nghĩa là bạn không thể sử dụng hoàng thổ để đưa ra dự đoán tổng quát hơn.
Glen_b -Reinstate Monica

@Glen_b vì tò mò điều gì tôi có thể "nói chung hơn" dự đoán?
a.powell

7
Hãy tưởng tượng một mối quan hệ phi tuyến giữa tỷ lệ người có xu hướng bỏ phiếu cho bên A và tỷ lệ thất nghiệp (cùng với các yếu tố dự đoán khác - chẳng hạn như ảnh hưởng đối với từng quốc gia). Hơn nữa hãy tưởng tượng có số liệu thất nghiệp mới trở nên có sẵn; trong phạm vi các giá trị được trải nghiệm trong tập huấn luyện, nhưng không nhất thiết là giá trị được biểu thị trong tập đó (ví dụ thất nghiệp trong quá khứ là từ 5 đến 12% và hiện chúng tôi có con số 8,3%, dự báo là ổn định). Sau đó, chúng ta có thể sử dụng hoàng thổ để dự đoán tỷ lệ bỏ phiếu A, mà không vượt ra ngoài tỷ lệ thất nghiệp 5-12%.
Glen_b -Reinstate Monica

1
@Glen_b Cảm ơn bạn. Đó là một minh họa tuyệt vời về cách nó có thể được sử dụng để dự báo.
a.powell

Câu trả lời:


28

Vấn đề với lowess hoặc hoàng thổ là nó sử dụng phép nội suy đa thức. Nó được biết đến trong dự báo rằng đa thức có hành vi thất thường ở đuôi. Khi nội suy, đa thức bậc 3 cung cấp mô hình hóa xu hướng tuyệt vời và linh hoạt trong khi ngoại suy vượt quá phạm vi dữ liệu quan sát, chúng phát nổ. Nếu bạn quan sát dữ liệu sau này trong chuỗi thời gian, bạn chắc chắn sẽ cần phải bao gồm một điểm dừng khác trong các spline để có được sự phù hợp tốt.

Các mô hình dự báo, mặc dù, được khám phá tốt ở những nơi khác trong tài liệu. Quá trình lọc như bộ lọc Kalman và bộ lọc hạt cung cấp dự báo tuyệt vời. Về cơ bản, một mô hình dự báo tốt sẽ là bất cứ thứ gì dựa trên chuỗi Markov trong đó thời gian không được coi là một tham số trong mô hình, nhưng (các) trạng thái mô hình trước đó được sử dụng để thông báo dự báo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.