Một cách đơn giản hơn để tính Trung bình Di chuyển theo cấp số nhân?


8

Phương án đề xuất:

Đưa ra một chuỗi thời gian , tôi muốn tính trung bình di chuyển có trọng số với một cửa sổ trung bình của điểm, trong đó trọng số ủng hộ các giá trị gần đây hơn các giá trị cũ hơn. NxiN

Khi chọn các trọng số, tôi sử dụng một thực tế quen thuộc là một chuỗi hình học hội tụ đến 1, tức là , với điều kiện được sử dụng vô số thuật ngữ.(12)k

Để có được một số lượng trọng số riêng biệt tổng hợp lại, tôi chỉ cần lấy các số hạng đầu tiên của chuỗi hình học , sau đó bình thường hóa bằng tổng của chúng.( 1N(12)k

Ví dụ, khi , điều này mang lại trọng số không chuẩn hóaN=4

0.0625  0.1250  0.2500  0.5000

mà, sau khi bình thường hóa bằng tổng của họ, cho

0.0667  0.1333  0.2667  0.5333

Trung bình di chuyển sau đó chỉ đơn giản là tổng của sản phẩm của 4 giá trị gần đây nhất so với các trọng số chuẩn hóa này.

Phương pháp này khái quát theo cách rõ ràng để di chuyển các cửa sổ có độ dài , và dường như cũng dễ dàng tính toán.N

Câu hỏi:

Có lý do nào để không sử dụng cách đơn giản này để tính trung bình di chuyển có trọng số bằng cách sử dụng 'trọng số mũ' không?

Tôi hỏi vì mục Wikipedia cho EWMA có vẻ phức tạp hơn. Điều này khiến tôi tự hỏi liệu định nghĩa sách giáo khoa của EWMA có thể có một số thuộc tính thống kê mà định nghĩa đơn giản ở trên không? Hay chúng trong thực tế tương đương?


Làm thế nào bạn bình thường hóa tổng? Bạn có thể mô tả phương pháp bạn đã chọn? Nó không phải là rất rõ ràng từ bài viết. trong đó, sau khi bình thường hóa bằng tổng của chúng, cho 0,0667 0,1333 0,2667 0,5333

Để bắt đầu với giả định của bạn 1) rằng không có giá trị bất thường và không có sự thay đổi cấp độ và không có xu hướng thời gian và không có hình nộm theo mùa; 2) rằng trung bình có trọng số tối ưu có các trọng số rơi trên một đường cong trơn tru có thể mô tả bằng 1 hệ số; 3) rằng phương sai lỗi không đổi; rằng không có loạt nguyên nhân được biết đến; Tại sao tất cả các giả định?
IrishStat

@Ravi: Trong ví dụ đã cho, tổng của bốn số hạng đầu tiên là 0,9375 = 0,0625 + 0,125 + 0,25 + 0,5. Vì vậy, bốn thuật ngữ đầu tiên giữ ~ 93,8% tổng trọng lượng (6,2% nằm ở phần đuôi bị cắt). Sử dụng điều này để có được các trọng số chuẩn hóa tổng hợp lại bằng cách thay đổi tỷ lệ (chia) cho 0,9375. Điều này cho 0,06667, 0,1333, 0,2667, 0,5333.
Assad Ebrahim

2
@IrishStat Tốt nhất là không thu hút mọi người khỏi trang web trong các nhận xét hoặc câu trả lời, vì lời khuyên mà bạn đưa ra không phải là câu hỏi và vì vậy không giúp ích cho những người đọc sau này (ví dụ: xem lý do 1. câu trả lời hàng đầu ở đây ); Nếu đó là lời khuyên phù hợp, nó thường nên ở đây.
Glen_b -Reinstate Monica

1
Lời giải thích chi tiết của EWMA: mathematical-modeling-python.blogspot.dk/2013/11/...
tashuhka

Câu trả lời:


10

Tôi đã thấy rằng tính toán trung bình chạy theo cấp số nhân theo cách sử dụng , làα<1x¯x¯+α(xx¯)α<1

  • một phương pháp một dòng đơn giản,
  • điều đó thật dễ dàng, nếu chỉ xấp xỉ, có thể hiểu được về mặt "số lượng mẫu hiệu quả" (so sánh biểu mẫu này với biểu mẫu để tính trung bình hoạt động),N=α1
  • chỉ yêu cầu mốc thời gian hiện tại (và giá trị trung bình hiện tại) và
  • ổn định về số lượng.

Về mặt kỹ thuật, phương pháp này không kết hợp tất cả lịch sử vào mức trung bình. Hai ưu điểm chính của việc sử dụng cửa sổ đầy đủ (trái ngược với cửa sổ bị cắt cụ thể được thảo luận trong câu hỏi) là trong một số trường hợp, nó có thể dễ dàng phân tích đặc tính của bộ lọc và nó làm giảm các dao động gây ra nếu dữ liệu rất lớn (hoặc nhỏ) giá trị là một phần của tập dữ liệu. Ví dụ, hãy xem xét kết quả của bộ lọc nếu dữ liệu đều bằng 0 ngoại trừ một mốc thời gian có giá trị là .106


Chào bạn Công thức bạn đề xuất có bao gồm tất cả các giá trị trước đó với trọng số giảm dần theo cấp số nhân không? Vì vậy, toàn bộ chuỗi thời gian sẽ được bao gồm, không chỉ là điểm gần đây nhất ? Đề cập đến ví dụ đặt ra trong câu hỏi, bạn có đề xuất cài đặt hoặc để xấp xỉ trung bình di chuyển 4 điểm không? N = 4 α = 0,25 α = 0,5NN=4α=0.25α=0.5
Assad Ebrahim

1
Được rồi, cái đó có lý. Vì vậy, dường như trong trường hợp các giá trị chuỗi thời gian có thể bị ảnh hưởng bởi các quá độ ngắn hạn đáng kể không có ảnh hưởng gì sau một khoảng thời gian nhất định, có thể thuận lợi khi sử dụng EWMA bị cắt bớt với được chọn để khớp với ` đặc điểm của sự liên quan của thông tin lịch sử. EWMA bị cắt ngắn trong trường hợp này sẽ ngăn chặn đột biến có bất kỳ tác động nào đến kết quả ngay cả khi nó xảy ra trong quá khứ gần đây, miễn là nó xảy ra bên ngoài khu vực liên quan đến thông tin ... Chấp nhận câu trả lời của bạn - cảm ơn ! 10 6N106
Assad Ebrahim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.