Dữ liệu bao gồm quang phổ quang học (cường độ ánh sáng so với tần số) được ghi lại ở các thời điểm khác nhau. Các điểm được thu được trên một lưới thông thường theo x (thời gian), y (tần số). Để phân tích sự tiến hóa thời gian ở các tần số cụ thể (tăng nhanh, sau đó là sự phân rã theo cấp số nhân), tôi muốn loại bỏ một số nhiễu có trong dữ liệu. Nhiễu này, với tần số cố định, có thể được mô hình hóa là ngẫu nhiên với phân phối gaussian. Tuy nhiên, tại một thời điểm cố định, dữ liệu cho thấy một loại nhiễu khác nhau, với các xung đột lớn và dao động nhanh (+ nhiễu gaussian ngẫu nhiên). Theo như tôi có thể tưởng tượng tiếng ồn dọc theo hai trục nên không được khắc phục vì nó có nguồn gốc vật lý khác nhau.
Điều gì sẽ là một thủ tục hợp lý để làm mịn dữ liệu? Mục tiêu không phải là làm biến dạng dữ liệu, mà loại bỏ các vật phẩm gây ồn "rõ ràng". (và có thể điều chỉnh quá mức / làm mịn quá mức không?) Tôi không biết việc làm mịn theo một hướng độc lập với hướng khác có hợp lý hay không, nếu tốt hơn là làm mịn trong 2D.
Tôi đã đọc những điều về ước tính mật độ hạt nhân 2D, nội suy đa thức / spline 2D, v.v. nhưng tôi không quen thuộc với thuật ngữ hoặc lý thuyết thống kê cơ bản.
Tôi sử dụng R, trong đó tôi thấy nhiều gói có vẻ liên quan (MASS (kde2), các trường (smooth.2d), v.v.) nhưng tôi không thể tìm thấy nhiều lời khuyên về việc áp dụng kỹ thuật nào ở đây.
Tôi rất vui khi tìm hiểu thêm, nếu bạn có tài liệu tham khảo cụ thể để chỉ cho tôi (Tôi nghe MASS sẽ là một cuốn sách hay, nhưng có lẽ quá kỹ thuật cho một người không thống kê).
Chỉnh sửa: Đây là một đại diện phổ dữ liệu giả của dữ liệu, với các lát cắt dọc theo thời gian và kích thước bước sóng.
Mục tiêu thực tế ở đây là đánh giá tốc độ phân rã theo hàm mũ theo thời gian cho từng bước sóng (hoặc thùng, nếu quá ồn).