Sự giống nhau của hai tranforms rời rạc?


14

Trong mô hình khí hậu, bạn đang tìm kiếm một mô hình có thể mô tả đầy đủ khí hậu Trái đất. Điều này bao gồm hiển thị các mô hình bán theo chu kỳ: những thứ như Dao động Nam El Nino. Nhưng xác minh mô hình thường xảy ra trong khoảng thời gian tương đối ngắn, trong đó có dữ liệu quan sát hợp lý (kéo dài ~ 150 năm). Điều này có nghĩa là mô hình của bạn có thể hiển thị các mẫu phù hợp, nhưng bị lệch pha, do đó các so sánh tuyến tính, như tương quan, sẽ không nhận ra rằng mô hình đang hoạt động tốt ..

Các biến đổi Fourier rời rạc thường được sử dụng để phân tích dữ liệu khí hậu ( đây là một ví dụ ), để chọn các mẫu tuần hoàn như vậy. Có bất kỳ thước đo tiêu chuẩn nào về sự giống nhau của hai DFT, có thể được sử dụng làm công cụ xác minh (nghĩa là so sánh giữa DFT cho mô hình và một cho các quan sát) không?

Sẽ có ý nghĩa nếu lấy tích phân tối thiểu của hai DFT bình thường hóa khu vực (sử dụng các giá trị thực tuyệt đối)? Tôi nghĩ rằng điều này sẽ dẫn đến một điểm , trong đó x = 1x[0,1]x= =1chính xác các mẫu giống nhau và x= =0mô hình hoàn toàn khác nhau. Hạn chế của phương pháp này là gì?


3
Bạn đã xem xét sử dụng sự kết hợp (theo nghĩa xử lý tín hiệu, không phải thống kê), một biện pháp quang phổ chéo? Tôi không chắc đó có phải là loại đo lường mà bạn đang tìm kiếm không.
jonsca

@jonsca: Thứ thú vị. Tôi chắc chắn không tìm kiếm nhân quả, nhưng tôi có thể thấy nó hữu ích như thế nào. Ví dụ trên trang wikipedia đó hơi kỳ lạ (tại sao nó không bao gồm áp suất khí quyển như một biến mô hình?). Ngoài ra, tôi không chắc con số 90% đến từ đâu ...
ness101

Đó là một câu hỏi hay. Ví dụ đó đã được thêm vào bài viết kể từ lần cuối tôi đọc nó. Tôi nghi ngờ nó có thể liên quan đến sự kết hợp tập trung vào tần số mỗi ngày và tần số 2 ngày (do đó gắn liền với hiện tượng thủy triều hàng ngày), nhưng đó chỉ là phỏng đoán ...
jonsca

(Tuy nhiên, tôi không biết liệu họ có tích hợp để tìm ra 90% đó không)
jonsca

Câu trả lời:


12

Sự kết hợp quang phổ, nếu được sử dụng đúng cách sẽ làm điều đó. Sự kết hợp được tính toán ở mỗi tần số - và do đó là một vectơ. Do đó, một tổng hợp kết hợp có trọng số sẽ là một biện pháp tốt. Thông thường bạn sẽ muốn cân trọng lượng các kết hợp ở tần số có năng lượng cao trong mật độ phổ công suất. Bằng cách đó, bạn sẽ đo được sự tương đồng ở các tần số thống trị chuỗi thời gian thay vì làm trọng số kết hợp với trọng số lớn, khi nội dung của tần số đó trong chuỗi thời gian là không đáng kể.

Vì vậy, nói một cách đơn giản - ý tưởng cơ bản là tìm tần số mà tại đó biên độ (năng lượng) trong các tín hiệu cao (diễn giải là tần số tạo thành chủ yếu của từng tín hiệu) và sau đó so sánh sự tương đồng ở các tần số này với trọng số cao hơn và so sánh các tín hiệu ở phần còn lại của tần số với trọng số thấp hơn.

Khu vực liên quan đến các câu hỏi thuộc loại này được gọi là phân tích quang phổ chéo. http://www.atmos.washington.edu/~dennis/552_Notes_6c.pdf là một giới thiệu tuyệt vời về phân tích quang phổ chéo.

Độ trễ tối ưu: Cũng xem câu trả lời của tôi ở đây: Cách tương quan hai chuỗi thời gian, với sự khác biệt về thời gian có thể

Thỏa thuận này tìm độ trễ tối ưu, sử dụng sự kết hợp quang phổ. R có chức năng tính toán mật độ phổ công suất, tự động và tương quan chéo, biến đổi Fourier và kết hợp. Bạn phải mã đúng để tìm độ trễ tối ưu để đạt tối đa. kết hợp trọng số. Điều đó nói rằng, một mã cho trọng số của vectơ kết hợp sử dụng mật độ phổ cũng phải được viết. Theo đó bạn có thể tổng hợp các yếu tố có trọng số và tính trung bình để có được sự tương đồng quan sát được ở độ trễ tối ưu.


1
Đó là một nguồn tài nguyên tuyệt vời! Nó liên quan đến việc kiểm tra giả thuyết độc đáo, trong đó rất nhiều tài liệu về sự gắn kết thuận tiện tránh được
jonsca

2

Bạn đã thử một cách tiếp cận khác để phát hiện / mô hình tín hiệu khí hậu, như phân tích sóng con chưa? Vấn đề lớn có thể nảy sinh với DFT trong phân tích khí hậu thực sự là những gì bạn đề cập: các dao động không hoàn toàn theo chu kỳ và chúng thường có các khoảng thời gian khác nhau để chúng thực sự có nhiều dải dao động khác nhau, điều này khá khó hiểu từ góc độ Biến đổi Fourier .

Một phân tích sóng con phù hợp hơn với các tín hiệu khí hậu vì chúng cho phép bạn kiểm tra các khoảng thời gian dao động khác nhau; giống như các tần số khác nhau được phát ở các thời điểm khác nhau bởi một nhạc cụ, bạn có thể kiểm tra các tần số khác nhau trong các khoảng thời gian khác nhau bằng biến đổi sóng con.

Nếu bạn quan tâm, bài viết này của Lau & Weng (1995) sẽ xóa đi hầu hết những nghi ngờ của bạn về phương pháp này. Phần thú vị nhất là biến đổi wavelet của một mô hình so với dữ liệu gần như có thể so sánh trực tiếp, bởi vì bạn có thể so sánh trực tiếp khoảng thời gian mà mô hình của bạn dự đoán, loại bỏ tất cả các phạm vi dao động giả mà nó không có.

Tái bút: Tôi phải nói thêm rằng tôi muốn đăng bài này như một bình luận, bởi vì đó không thực sự là những gì OP yêu cầu, nhưng bình luận của tôi sẽ quá lớn và quyết định đăng nó như một câu trả lời có thể có ích như một cách tiếp cận khác với phương pháp của DFT.


1

Tôi đã bỏ phiếu và thứ hai việc sử dụng phân tích dựa trên wavelet và Spectrogram như là một thay thế cho dft. Nếu bạn có thể phân tách chuỗi của mình thành các thùng tần số thời gian cục bộ, nó sẽ giảm các vấn đề phạm lỗi về tính chu kỳ và không cố định, cũng như cung cấp một hồ sơ đẹp về dữ liệu rời rạc để so sánh.

Sau khi dữ liệu được ánh xạ tới một tập hợp năng lượng quang phổ ba chiều so với thời gian và tần số, khoảng cách euclide có thể được sử dụng để so sánh các cấu hình. Một kết hợp hoàn hảo sẽ tiếp cận khoảng cách giới hạn dưới bằng không. * Bạn có thể xem xét các khu vực khai thác dữ liệu và nhận dạng giọng nói theo chuỗi thời gian cho các phương pháp tương tự.

* lưu ý rằng quá trình tạo thùng sóng con sẽ lọc nội dung thông tin phần nào- Nếu không thể mất dữ liệu so sánh, có thể phù hợp hơn khi so sánh bằng cách sử dụng khoảng cách euclide trong miền thời gian

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.