Nội suy dữ liệu đã đánh dấu sao cho trung bình bin được bảo toàn


8

Nói rằng tôi có dữ liệu binned này là đầu vào. Giá trị trung bìnhy¯i được trao cho mỗi lần kế tiếp Δxikhoảng thời gian. Để đơn giản, hãy giả sử mật độ lấy mẫu là đồng nhất trong mỗi thùng.

Bây giờ tôi muốn ước tính hàm bên dưới y(x) tức là tôi muốn có thể có được ước tính hợp lý về y cho các giá trị tùy ý, đúng giờ của x (ví dụ x= 2,3 hoặc 2,5 hoặc bất cứ điều gì). Yêu cầu là:

  1. Hàm phải bảo toàn mức trung bình trên mỗi thùng, y(x)¯i=y¯i, để không giới thiệu thiên vị
  2. Hàm phải liên tục (nghĩa là không gián đoạn)
  3. Hàm phải không âm. (Giá trị âm là phi vật lý.)

Đơn giản chỉ cần tra cứu giá trị bin cho trước x sẽ thỏa mãn số 1, nhưng vi phạm số 2 (có sự không liên tục ở tất cả các cạnh của thùng).

Mặt khác, việc gán toàn bộ trọng lượng thùng cho từng tâm bin, sau đó nội suy giữa các điểm đó, thỏa mãn # 2, nhưng vi phạm # 1 (bất kể nội suy spline tuyến tính hay bậc cao hơn). Trong hình minh họa dưới đây, 2 <x<3 thùng trung bình không được bảo quản; nó được giảm xuống, vì cả hai góc bị cắt xuống.

Làm thế nào điều này có thể được thực hiện theo cách đáp ứng cả hai yêu cầu?

Ngoài ra, hoạt động này được gọi là gì? Là nội suy này? (Không chắc chắn làm thế nào để gắn thẻ câu hỏi này.)

nhập mô tả hình ảnh ở đây

Câu trả lời:


2

Đây là một bài viết mô tả một phương pháp lặp thực hiện những gì bạn đang hỏi:

Thuật toán bảo toàn trung bình để nội suy dữ liệu trung bình trơn tru

MD Rymes, DR Myers, Thuật toán bảo quản trung bình để nội suy trơn tru dữ liệu trung bình, Năng lượng mặt trời, Tập 71, Số 4, 2001, Trang 225-231, ISSN 0038-092X, https://doi.org/10.1016/S0038-092X ( 01) 00052-4 . ( http://www.scTHERirect.com/science/article/pii/S0038092X01000524 )

Tóm tắt: Giá trị trung bình hàng giờ hoặc trung bình hàng tháng của bức xạ mặt trời đo được là phương tiện điển hình cho dữ liệu khí tượng và khí tượng tổng hợp. Thông thường, các nhà thiết kế, nhà nghiên cứu và kỹ sư năng lượng tái tạo dựa trên năng lượng mặt trời thích làm việc với dữ liệu được phân giải thời gian cao hơn, chẳng hạn như hồ sơ nhật ký chi tiết hoặc giá trị trung bình hàng ngày. Mục tiêu của bài viết này là trình bày một phương pháp đơn giản để nội suy trơn tru dữ liệu trung bình (được giải quyết thô) thành dữ liệu với độ phân giải tốt hơn, trong khi vẫn giữ được giá trị trung bình xác định của dữ liệu. Kỹ thuật này duy trì mối quan hệ thành phần thích hợp giữa bức xạ mặt trời trực tiếp, khuếch tán và toàn cầu (khi có giá trị cho ít nhất hai trong số các thành phần), cũng như giá trị trung bình xác định của dữ liệu được giải quyết thô.


Điều này nghe có vẻ như một giải pháp. Quá tệ đó là đằng sau một bức tường.
Jean-François Corbett

1
Bạn sẽ tìm thấy một bản sao có thể tải xuống với công cụ tìm kiếm yêu thích của bạn; Tôi đã nhận nó ngày hôm qua.
adr

Có thực hiện thuật toán cho R không?
RogerioJB

0

Giải pháp tốt nhất mà tôi có được cho đến nay là thực hiện phép nội suy tuyến tính giữa các điểm tại tâm bin như trong biểu đồ trong câu hỏi, sau khi đã thực hiện tối ưu hóa tất cả các số yi, lặp đi lặp lại cho đến khi điều kiện số 1 được đáp ứng (và với một hình phạt khắc nghiệt cho việc vi phạm # 3). Thật không may, tối ưu hóa số là một chút của một quá trình nặng nề hơn tôi mong đợi.

Thay vì thực hiện tối ưu hóa số, tôi đã thử chỉ thiết lập và giải một tập các phương trình tuyến tính. Điều đó thực sự đơn giản và nhanh chóng, nhưng nó không mạnh mẽ so với yêu cầu số 3: một sốyicó thể kết thúc tiêu cực, đó là vô nghĩa. Thật không may, # 3 là một thứ phi tuyến tính và không thể được kết hợp trong tập hợp các phương trình tuyến tính, theo như tôi có thể nói.


-2

Binning rất nản lòng vì không hiệu quả, không liên tục và độc đoán. Nhưng bạn đã đưa ra giả định ngầm định rằng các thùng phải không chồng chéo. Làm cho các thùng chồng lên nhau và có nhiều hơn trong số chúng sẽ làm giảm bớt một số vấn đề mặc dù các spline hồi quy là tốt hơn.

Không sử dụng trung tâm bin để đại diện cho phân phối xtrong thùng Sử dụng trung bìnhx trong mỗi thùng.


3
Tôi không ủng hộ hoặc chống lại việc sử dụng thùng, cũng không cho / chống lại việc chồng chúng lên nhau. Tôi đang nói, đây là dữ liệu tôi phải làm việc. Đây là đầu vào của tôi. Thật không may, tôi không có nguồn thông tin cấp cao hơn. Ngoài ra, với giả định đơn giản hóa đã nêu rằng các mẫu được phân phối đồng đều trong các thùng, có nghĩa là x sẽ giống như trung tâm bin.
Jean-François Corbett
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.