Có gì khác nhau giữa các dự báo về các mẫu trong mẫu của - và trong mẫu của - là gì?


16

Tôi không hiểu chính xác sự khác biệt giữa dự đoán "trong mẫu" và "ngoài mẫu" là gì? Dự báo trong mẫu sử dụng tập hợp con của dữ liệu có sẵn để dự báo các giá trị ngoài thời gian ước tính. Thay vào đó là một dự báo mẫu sử dụng tất cả các dữ liệu có sẵn Có đúng không?

Rất cụ thể là định nghĩa sau đây có đúng không?

Một dự báo mẫu trong sử dụng một tập hợp con của dữ liệu có sẵn để dự báo các giá trị ngoài thời gian ước tính và so sánh chúng với các kết quả thực tế đã biết hoặc tương ứng. Điều này được thực hiện để đánh giá khả năng của mô hình dự báo các giá trị đã biết. Ví dụ: dự báo mẫu trong khoảng từ 1980 đến 2015 có thể sử dụng dữ liệu từ 1980 đến 2012 để ước tính mô hình. Sử dụng mô hình này, người dự báo sau đó sẽ dự đoán các giá trị cho 2013-2015 và so sánh các giá trị dự báo với các giá trị thực tế đã biết. Thay vào đó, dự báo mẫu sẽ sử dụng tất cả dữ liệu có sẵn trong mẫu để ước tính mô hình. Đối với ví dụ trước, ước tính sẽ được thực hiện trong giai đoạn 1980-2015 và (các) dự báo sẽ bắt đầu vào năm 2016.


Bạn có thể cung cấp một số bối cảnh? Các câu trả lời bạn cung cấp cho câu hỏi của riêng bạn có vẻ ổn, nhưng thuật ngữ có thể là chủ đề cụ thể.
IWS

Bạn lấy những định nghĩa đó từ đâu?
gung - Phục hồi Monica

Trong mẫu là dữ liệu mà bạn biết tại thời điểm modell builing và bạn sử dụng để xây dựng mô hình đó. Out-of-sample là dữ liệu chưa được nhìn thấy và bạn chỉ đưa ra dự đoán / dự báo nó. Trong hầu hết các trường hợp, mô hình sẽ thực hiện việc lấy mẫu kém hơn so với trong mẫu trong đó tất cả các tham số đã được hiệu chuẩn.
Ric

@IWS Tôi đã thêm câu hỏi đặc biệt :)
Engin YILMAZ

@Richard Vui lòng đọc câu hỏi đặc biệt mới ...
Engin YILMAZ

Câu trả lời:


30

Theo "mẫu", nó có nghĩa là mẫu dữ liệu mà bạn đang sử dụng để phù hợp với mô hình.

Thứ nhất - bạn có một mẫu
Thứ hai - bạn phù hợp với một mô hình trên mẫu
Thứ ba - bạn có thể sử dụng mô hình để dự báo

Nếu bạn dự báo cho một quan sát là một phần của mẫu dữ liệu - thì đó là dự báo trong mẫu.

Nếu bạn dự báo cho một quan sát không phải là một phần của mẫu dữ liệu - thì đó là dự báo ngoài mẫu.

Vì vậy, câu hỏi bạn phải tự hỏi mình là: Quan sát cụ thể có được sử dụng cho mô hình phù hợp hay không? Nếu nó được sử dụng để lắp mô hình, thì dự báo quan sát là trong mẫu. Nếu không, nó là ngoài mẫu.

nếu bạn sử dụng dữ liệu 1990-2013 để phù hợp với mô hình và sau đó bạn dự báo cho giai đoạn 2011-2013, thì đó là dự báo trong mẫu. nhưng nếu bạn chỉ sử dụng 1990-2010 để phù hợp với mô hình và sau đó bạn dự báo 2011-2013, thì dự báo ngoài mẫu của nó.


Chúng tôi có mẫu từ năm 1990 đến 2013 ,, sau đó chúng tôi phù hợp với mô hình trên mẫu, sau đó chúng tôi dự báo 2011-2013, đây có phải là mẫu không? hoặc Chúng tôi có mẫu từ năm 1990 đến 2013, sau đó chúng tôi phù hợp với mô hình 1990 đến 2010 trên mẫu, chúng tôi dự báo 2011-2013, đây có phải là mẫu không?
Engin YILMAZ

có, nếu bạn sử dụng dữ liệu 1990-2013 để phù hợp với mô hình và sau đó bạn dự báo cho giai đoạn 2011-2013, đó là dự báo trong mẫu. nhưng nếu bạn chỉ sử dụng 1990-2010 để phù hợp với mô hình và sau đó bạn dự báo 2011-2013, thì dự báo ngoài mẫu của nó.
Ngựa của vua Solomon

3

Giả sử trong mẫu của bạn, bạn có một chuỗi gồm 10 điểm dữ liệu. Dữ liệu này có thể được chia thành hai phần - ví dụ 7 điểm dữ liệu đầu tiên để ước tính các tham số mô hình và 3 điểm dữ liệu tiếp theo để kiểm tra hiệu suất mô hình. Sử dụng mô hình được trang bị, các dự đoán được thực hiện cho 7 điểm dữ liệu đầu tiên sẽ được gọi là dự báo trong mẫu và tương tự cho 3 điểm dữ liệu cuối cùng sẽ được gọi ra khỏi dự báo mẫu. Điều này giống như ý tưởng chia dữ liệu thành tập huấn luyện và tập xác thực.


1

Dự báo trong mẫu là quá trình đánh giá chính thức các khả năng dự đoán của các mô hình được phát triển bằng cách sử dụng dữ liệu quan sát để xem hiệu quả của các thuật toán trong việc tái tạo dữ liệu. Nó tương tự như tập huấn luyện trong thuật toán học máy và ngoài mẫu tương tự như tập kiểm tra.


bạn đưa ra một lời giải thích ngắn gọn về dự báo trong mẫu - bạn cũng có thể cung cấp điều tương tự cho ngoài mẫu (tức là một lời giải thích ngắn không chỉ là so sánh với các bộ kiểm tra)?
ReneBt

0

Các sơ đồ dưới đây sẽ giúp bạn hiểu TRONG THỜI GIANOut of Time

nhập mô tả hình ảnh ở đây


-1

Trong Dự báo chuỗi thời gian, 'Mẫu' có nghĩa là dữ liệu đào tạo 'Mẫu ngoài' có nghĩa là dữ liệu thử nghiệm

Trong chuỗi Thời gian, trước tiên, chúng tôi có thể dự đoán kết quả cho dữ liệu 'Mẫu' (tức là tàu). Sau đó, chúng tôi có thể dự báo kết quả cho dữ liệu 'mẫu thử' (tức là thử nghiệm).

model = ARIMA(order = (p,d,q), seasonal_order=(P,D,Q,S))
model.fit(train_data)

train_predictions = model.predict_in_sample()
test_predictions = model.predict(n_periods=len(test_data.index))

predictions = pd.concatenate((train_predictions, test_predictions),axis=0)

Tôi nghĩ rằng câu trả lời của bạn đang bị hạ thấp, bởi vì nó không trả lời câu hỏi - cụ thể là "Rất cụ thể là định nghĩa sau đây có đúng không?" không được quảng cáo
Martin Modrák
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.