Điều chỉnh một trung bình di chuyển theo cấp số nhân cho một cửa sổ di chuyển có nghĩa là gì?


7

Tham số alpha của trung bình di chuyển theo hàm mũ xác định độ mịn mà trung bình áp dụng cho chuỗi thời gian. Theo cách tương tự, kích thước cửa sổ của cửa sổ chuyển động cũng có nghĩa là xác định độ mịn.

Có cách nào để điều chỉnh tham số alpha sao cho độ mịn gần bằng với giá trị trung bình của cửa sổ chuyển động của một kích thước đã cho không? (Không tìm kiếm kết quả giống hệt nhau, rõ ràng, và bù đắp là OK). Vì vậy, giả sử điều chỉnh alpha sao cho chuỗi thời gian kết quả gần nhất có thể với hình dạng được cung cấp bởi cửa sổ di chuyển 3 tháng?

chỉnh sửa : bối cảnh: Tôi đang cố gắng tạo ra nhiều proxy cho độ ẩm của đất, từ dữ liệu lượng mưa, đại diện một cách trừu tượng cho các độ sâu khác nhau (mà tôi cho rằng có liên quan đến trung bình lượng mưa dài hạn). Một cửa sổ chuyển động cho phép tôi tính toán, ví dụ như tổng lượng mưa trong 3 ngày qua, 3 tháng hoặc năm, có thể tương ứng với vài cm trên cùng của đất, mét trên cùng và cột đất mở rộng, tương ứng. Tuy nhiên, một cửa sổ chuyển động yêu cầu dữ liệu từ quá khứ, không phải lúc nào cũng có sẵn (ví dụ: khi bắt đầu một loạt). Nếu trung bình theo cấp số nhân được sử dụng thay thế, thì tôi chỉ cần lưu trữ một giá trị cho mỗi trung bình (trung bình từ bước thời gian trước đó) và giá trị này có thể được khởi tạo với giá trị trung bình dài hạn.


Bạn đang đề cập đến loại bù nào?
Glen_b -Reinstate Monica

@Glen_b: như trong, nếu các đỉnh và đáy trong hai phương tiện được dịch chuyển tương đối với nhau. Tôi không có lý do để mong đợi họ trở thành, nhưng tôi cũng không chắc là họ cũng sẽ như vậy.
ness101

Ồ, xin lỗi, tôi đã giả sử bạn có nghĩa là bạn muốn tìm một tham số alpha ngụ ý các giá trị (/ dự đoán) được gắn gần nhau (gần nghĩa là có điều kiện). Thay vào đó, bạn có dự định một tham số alpha ngụ ý mức độ làm mịn tương tự mặc dù các giá trị có thể khá khác nhau không? (có hiệu lực, một cái gì đó như là chặt chẽ trong sai có điều kiện chứ không phải là đóng trong bình có điều kiện)
Glen_b -Reinstate Monica

Oh, với ý nghĩa của cửa sổ di chuyển của bạn, đó là nhìn lạc hậu hoặc tập trung vào quan sát? (tức là vs ) (hãy nhớ rằng việc làm mịn theo cấp số nhân thường chỉ nhìn về phía sau)y^y=1ki=0k1ytiy^y=12k+1i=kkyti
Glen_b -Reinstate Monica

Đã thêm một số bối cảnh, chỉ trong trường hợp nó có thể giúp làm rõ ý định của câu hỏi. Tuy nhiên, bây giờ tôi nghĩ về nó, tôi tự hỏi liệu một trung bình di chuyển theo cấp số nhân thậm chí có hợp lệ trên dữ liệu lượng mưa (theo cấp số nhân) hay không ...
nè 101

Câu trả lời:


6

Đặt là chuỗi thời gian ban đầu và là kết quả của việc làm mịn với trung bình di chuyển đơn giản với một số chiều rộng cửa sổ. Đặt là hàm trả về phiên bản được làm mịn của bằng cách sử dụng tham số làm mịn .xxmf(x,α)xα

Xác định hàm mất đo lường sự khác biệt giữa trung bình di chuyển cửa sổ và trung bình di chuyển theo cấp số nhân. Một lựa chọn đơn giản sẽ là lỗi bình phương:L

L(α)=xmf(x,α)2

Nếu bạn muốn lỗi không bị thay đổi / thay đổi tỷ lệ, bạn có thể định nghĩa là giá trị âm của chiều cao cực đại của tương quan chéo đã chuẩn hóa.L

Tìm giá trị của thu nhỏ :αL

minαL(α)

Đây là một ví dụ sử dụng tín hiệu hình sin nhiễu và lỗi bình phương trung bình là hàm mất:

nhập mô tả hình ảnh ở đây

Một ví dụ khác sử dụng nhiễu trắng làm tín hiệu:

nhập mô tả hình ảnh ở đây

Hàm mất có vẻ hoạt động tốt và có một mức tối thiểu toàn cầu duy nhất cho hai tín hiệu khác nhau này, cho thấy bộ giải tối ưu hóa 1d tiêu chuẩn có thể hoạt động (như tôi đã sử dụng để chọn ở đây). Nhưng, tôi đã không xác minh rằng đây phải là trường hợp. Nếu nghi ngờ, hãy vẽ đồ thị hàm mất và sử dụng phương pháp tối ưu hóa tinh vi hơn nếu cần thiết.α

Chỉnh sửa :

Đây là một âm mưu của alpha tối ưu (để làm mịn theo cấp số nhân) như là một hàm của kích thước cửa sổ (đối với trung bình di chuyển đơn giản). Âm mưu cho từng tín hiệu hiển thị ở trên.

nhập mô tả hình ảnh ở đây


Hrmm. Vì vậy, đây là một cách tiếp cận đủ công bằng, nhưng nó giả định rằng alpha sẽ khác nhau cho mỗi chuỗi thời gian, cho một kích thước cửa sổ nhất định. Có nhất thiết phải như vậy không? Tôi đã nghĩ rằng có thể có một số giải pháp phân tích chung ...
naught101

Tôi cũng hy vọng như vậy. Đây chỉ là một đối số theo kinh nghiệm, nhưng tôi đã thử một số tín hiệu khác nhau và giá trị của alpha có thể khác nhau, ngay cả khi chiều rộng cửa sổ là như nhau.
dùng20160

Cửa sổ bạn đã sử dụng cho các lô này là gì? Cửa sổ di chuyển theo cấp số nhân của Pandas có đối số "tâm khối lượng (com)" được xác định là: , dường như khớp với độ dài cửa sổ trong một cửa sổ di chuyển bình thường. Âm mưu của bạn cũng có mối quan hệ này? α=1/(1+com)
ness101

1
Tôi đã chỉnh sửa bài đăng để hiển thị alpha tối ưu như là một chức năng của kích thước cửa sổ. Chức năng thực sự trơn tru, nhưng có thể khác nhau tùy thuộc vào tín hiệu. Việc tối ưu hóa chỉ mất ~ 1ms cho 1000 mẫu và ~ 160ms cho các mẫu 1e6, vì vậy nó không quá nặng nề. Nhưng nếu bạn muốn tránh nó, bạn có thể tạo đường cong alpha so với kích thước cửa sổ cho một tín hiệu nguyên mẫu duy nhất, sau đó sử dụng nó để chọn alpha cho các tín hiệu tiếp theo.
dùng20160

1
Ngoài ra, bạn có thể rút ra biểu thức đóng cho một tín hiệu đơn giản với các số liệu thống kê được xác định rõ, sau đó chỉ chấp nhận bất kỳ sai sót nhỏ nào phát sinh từ sự khác biệt giữa tín hiệu mô hình và tín hiệu thực tế của bạn.
dùng20160

2

Nếu tôi hiểu chính xác câu hỏi, vấn đề là một trong những cố gắng làm cho một chuỗi trọng lượng giảm theo cấp số nhân phù hợp với một bộ đồng phục riêng biệt (trọng lượng không đổi với mức cắt):

! [So sánh các hàm trọng lượng EWMA với trung bình di chuyển thông thường

Rõ ràng EWMA giảm nhanh chóng (phù hợp với độ trễ cũ khi trung bình di chuyển bình thường vẫn có trọng lượng cao) hoặc có một cái đuôi tiến xa hơn trong quá khứ, phù hợp với phân bố trọng lượng xấu khi trung bình di chuyển bình thường không có trọng lượng).

Chính xác thì lựa chọn sẽ phù hợp nhất với kết quả từ trọng số đồng đều sẽ phụ thuộc rất nhiều vào cách bạn đo lường hiệu suất và (tự nhiên) vào các đặc điểm của chuỗi (cả trung bình di chuyển thông thường và EWMA chỉ phù hợp một cách hợp lý cho yếu- Ví dụ, loạt văn phòng phẩm, nhưng bao gồm rất nhiều trường hợp có hiệu suất tương đối khác nhau cho các giá trị khác nhau )αα

Câu hỏi khiến cả hai điều này trở nên mơ hồ, vì vậy tôi nghi ngờ không có nhiều điều để nói hơn là "nó phụ thuộc" - về sự giống nhau của trung bình điều kiện hoặc kích thước của phương sai điều kiện ở đây.


0

Chúng ta có thể coi đây là một vấn đề tối ưu hóa siêu tham số.

Chúng tôi có một mục tiêu X_mean là giá trị đích.

Chúng tôi cũng có chức năng mất ví dụ L2 (X_exponential - X_mean).

Chúng tôi đang tìm kiếm một siêu tham số (alpha) cho trung bình di chuyển theo cấp số nhân để giảm thiểu tổn thất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.