Hồi quy trên đĩa đơn vị bắt đầu từ các mẫu khác nhau cách đều nhau


9

Tôi cần giải quyết một vấn đề hồi quy phức tạp trên đĩa đơn vị. Câu hỏi ban đầu thu hút một số ý kiến ​​thú vị, nhưng không có câu trả lời không may. Trong khi đó, tôi đã học được nhiều điều hơn về vấn đề này, do đó tôi sẽ cố gắng chia vấn đề ban đầu thành các bài toán con, và xem liệu lần này tôi có gặp may mắn hơn không.

Tôi có 40 cảm biến nhiệt độ thường xuyên đặt trong một vòng hẹp bên trong đĩa đơn vị: nhập mô tả hình ảnh ở đây

Những cảm biến thu được nhiệt độ trong thời gian. Tuy nhiên, vì biến thể thời gian nhỏ hơn nhiều so với biến đổi không gian, hãy đơn giản hóa vấn đề bằng cách bỏ qua biến thiên thời gian và giả sử rằng mỗi cảm biến chỉ mang lại cho tôi trung bình thời gian. Điều này có nghĩa là tôi có 40 mẫu (một mẫu cho mỗi cảm biến) và tôi không có mẫu lặp lại.

T=f(ρ,θ)+ϵ

  1. Tmean=g1(ρ)+ϵθ
  2. T95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

θ

Khi mô hình được chọn, tôi cần chọn một thủ tục ước tính. Vì đây là vấn đề hồi quy không gian, nên các lỗi tại các vị trí khác nhau sẽ được tương quan. Bình phương tối thiểu thông thường giả định các lỗi không tương quan, do đó tôi đoán Bình phương tối thiểu hóa sẽ phù hợp hơn. GLS dường như là một kỹ thuật thống kê tương đối phổ biến, cho rằng có một glschức năng trong phân phối R tiêu chuẩn. Tuy nhiên, tôi chưa bao giờ sử dụng GLS và tôi nghi ngờ. Ví dụ, làm thế nào để tôi ước tính ma trận hiệp phương sai? Một ví dụ hoạt động, thậm chí chỉ với một vài cảm biến, sẽ rất tuyệt.

PS Tôi đã chọn sử dụng đa thức Zernike và GLS bởi vì nó dường như là điều hợp lý để làm ở đây. Tuy nhiên tôi không phải là chuyên gia và nếu bạn cảm thấy mình đang đi sai hướng, hãy thoải mái sử dụng một cách tiếp cận hoàn toàn khác.


θ

Câu trả lời:


2

Tôi nghĩ rằng bạn đang đi đúng hướng khi nghĩ về một cái gì đó như đa thức Zernike. Như đã lưu ý trong câu trả lời của jwimberly, đây là một ví dụ về một hệ thống các hàm cơ sở trực giao trên đĩa. Tôi không quen thuộc với đa thức Zernike, nhưng nhiều họ khác của các hàm trực giao (bao gồm cả hàm Bessel) phát sinh tự nhiên trong vật lý toán học cổ điển khi các hàm riêng cho các phương trình vi phân từng phần nhất định (tại thời điểm viết bài này, hoạt hình ở đầu liên kết đó cho thấy một ví dụ về một đầu trống rung).

θ

rT95

Đối với câu hỏi thứ hai này, tính biến thiên dữ liệu thực sự có thể giúp giải quyết mọi vấn đề răng cưa, về cơ bản cho phép mọi căn chỉnh sai trung bình vượt qua các phép đo khác nhau. (Giả sử không có sai lệch hệ thống ... nhưng đó sẽ là một vấn đề đối với bất kỳ phương pháp nào, mà không có mô hình vật lý để cung cấp thêm thông tin).

Vì vậy, một khả năng sẽ là xác định các chức năng trực giao không gian của bạn hoàn toàn tại các vị trí cảm biến. Các "Hàm trực giao thực nghiệm" này có thể được tính toán thông qua PCA trên ma trận dữ liệu không gian vũ trụ của bạn. (Có thể bạn có thể sử dụng một số trọng số để tính toán cho các khu vực hỗ trợ cảm biến thay đổi, nhưng với lưới cực và mục tiêu trung bình xuyên tâm, điều này có thể không bắt buộc.)

Lưu ý rằng nếu có bất kỳ dữ liệu mô hình vật lý có sẵn cho các biến thể "dự kiến" trong nhiệt độ, có sẵn trên một mạng lưới điện toán spatiotemporal dày đặc, sau đó các thủ tục PCA tương tự có thể được áp dụng cho rằng dữ liệu chức năng trực giao lấy được. (Điều này thường được gọi là " Phân rã trực giao thích hợp " trong kỹ thuật, trong đó nó được sử dụng để giảm mô hình, ví dụ như một mô hình động lực học chất lỏng tính toán đắt tiền có thể được chưng cất để sử dụng trong các hoạt động thiết kế tiếp theo.)

Một nhận xét cuối cùng, nếu bạn định trọng lượng dữ liệu cảm biến theo vùng hỗ trợ (tức là kích thước ô cực), đây sẽ là một loại hiệp phương sai chéo, trong khuôn khổ của GLS . (Điều đó sẽ áp dụng cho vấn đề dự đoán của bạn nhiều hơn, mặc dù PCA có trọng số sẽ liên quan chặt chẽ với nhau.)

Tôi hi vọng cái này giúp được!

Cập nhật: Sơ đồ phân phối cảm biến mới của bạn thay đổi mọi thứ đáng kể trong quan điểm của tôi. Nếu bạn muốn ước tính nhiệt độ trên phần bên trong đĩa, bạn sẽ cần nhiều thông tin hơn trước khi chỉ đơn giản là "tập hợp các hàm trực giao trên đĩa đơn vị". Có quá ít thông tin trong dữ liệu cảm biến.

Nếu bạn thực sự muốn ước tính sự thay đổi nhiệt độ không gian trên đĩa, cách hợp lý duy nhất tôi có thể thấy là xử lý vấn đề như một sự đồng hóa dữ liệu . Ở đây, bạn sẽ cần ít nhất phải hạn chế hình thức tham số của phân bố không gian dựa trên một số cân nhắc dựa trên vật lý (chúng có thể là từ mô phỏng hoặc có thể từ dữ liệu liên quan trong các hệ thống có động lực tương tự).

Tôi không biết ứng dụng cụ thể của bạn, nhưng nếu nó là một cái gì đó như thế này , thì tôi sẽ tưởng tượng có một tài liệu kỹ thuật rộng lớn mà bạn có thể rút ra để chọn các ràng buộc phù hợp trước đó. (Đối với loại kiến ​​thức tên miền chi tiết, đây có lẽ không phải là trang web StackExchange tốt nhất để hỏi về.)


Câu trả lời ấn tượng! Cần một chút thời gian để tiêu hóa nó. Bạn hỏi hai câu hỏi: Tôi không chắc là tôi hiểu câu hỏi đầu tiên ("bạn cần bao nhiêu ràng buộc đối với mô hình không gian?") Tôi nghĩ rằng sử dụng dữ liệu từ tất cả 40 cảm biến sẽ tốt hơn là chỉ lấy trung bình theo hướng chu vi và sau đó phù hợp ... bạn đang nói điều này không nhất thiết phải đúng? Đối với loại thứ hai ("loại biến đổi nào xảy ra trong dữ liệu không gian tạm thời"), trong một hoặc hai ngày tới tôi sẽ phân tích công cụ đầu tiên (tôi thực sự có 5 trong số đó! Nhưng đây sẽ là chủ đề của một câu hỏi trong tương lai ...) ctd ...
DeltaIV

... Ctd, tôi sẽ bình thường hóa dữ liệu và tôi sẽ thấy những gì tôi có thể xuất bản trên một trang web công cộng. Một số mô hình không gian và một số chuỗi thời gian ... Tôi nghĩ rằng chúng nên cung cấp cho bạn một ý tưởng liên quan đến những gì bạn đang hỏi.
DeltaIV

1
T95

1
BTW nếu đây là một vấn đề thiết kế và có các mô phỏng kiểu CFD liên quan, thì đó là thông tin nhiều hơn đáng kể so với câu hỏi hiện tại. (Ví dụ: tiếp cận vấn đề vì đồng hóa dữ liệu có thể sử dụng các cách tiếp cận khác nhau.)
GeoMatt22

Câu trả lời của bạn khiến tôi nghĩ: thay vì hồi quy, có một số 2d tương đương với một biến đổi Fourier rời rạc có thể được thực hiện không? Ví dụ: lấy tích phân của các điểm dữ liệu nhân với hàm B-n thứ n (được sửa đổi một cách thích hợp), và sau đó nhận được một phép phân tách trực giao? Mối quan tâm ở đây sẽ là 1) tìm ra hàm bị tách rời thích hợp, có thể dọc theo cùng dòng với câu trả lời của bạn và 2) liệu điều này có quá nhạy cảm với số lượng điểm lấy mẫu nhỏ hay không và phân tách sẽ dựa vào các điều khoản bậc cao phức tạp hơn .
jwimberley

2

rθ


(+1) Kết nối phương trình nhiệt tọa độ cực là tốt. Một điều khác có lẽ đáng nói là đối với các quy trình Gaussian tôi thường biết trên các lưới hình chữ nhật, ma trận hiệp phương sai là tuần hoàn và thực tế các FFT được sử dụng. Vì vậy, các hàm Bessel sẽ là một ứng cử viên có khả năng cho một cách tiếp cận tương tự trên lưới cực.
GeoMatt22

Một gợi ý thú vị! Tuy nhiên, tôi đang đo nhiệt độ trong chất lỏng vận hành, không phải ở phần rắn của động cơ. Do đó, tôi quan tâm đến vấn đề đối lưu, trái ngược với vấn đề dẫn truyền. Các hàm của tàu chắc chắn là các giải pháp của phương trình dẫn nhiệt (Fourier), nhưng tôi không nghĩ chúng cũng là giải pháp của phương trình đối lưu nhiệt, vì sự đối lưu phụ thuộc vào trường dòng chất lỏng. Dù sao, tôi ít nhất có thể kiểm tra chúng so với Zernike. Còn GLS thì sao? Bạn có thể thêm một cái gì đó vào phần đó của câu hỏi không?
DeltaIV

@DeltaIV Tôi không quá quen thuộc với GLS, nhưng một câu hỏi - tại sao bạn mong đợi các lỗi có thể tương quan ở các điểm không gian khác nhau? Tôi đồng ý rằng các dao động thực sự sẽ có mối tương quan giữa các điểm, nhưng tôi sẽ nghĩ rằng các lỗi (nghĩa là không chắc chắn trong bài đọc cảm biến) sẽ không được sửa chữa. Có lẽ đối với biến động hồi quy được tính là lỗi? Tôi đang xem xét thêm một cái gì đó về các điều khoản phạt, tuy nhiên. Dù bạn sử dụng cơ sở nào, bạn chỉ có một số điểm lấy mẫu hữu hạn và có thể tìm thấy một số hàm Bessel phù hợp với thứ tự rất cao, vì vậy các thuật ngữ bậc thấp nhất nên được ưu tiên.
jwimberley

@DeltaIV Liên quan đến biến động một lần nữa, điều này sẽ giới thiệu mối tương quan giữa các điểm không gian: đối tượng của bạn là để có được một bản đồ nhiệt độ, phải không? Bạn không muốn thấy bất kỳ biến động nào đang xảy ra? Và một mô hình thống kê thậm chí có thể giải thích cho chúng, vì các dao động sẽ được điều khiển bởi động lực học chất lỏng và phức tạp trong không gian và thời gian? (Điều này có liên quan đến phần phụ thuộc vào thời gian trong phân tích của bạn mà bạn đã bỏ qua để đơn giản không?)
jwimberley

thư viện trò chuyện được tạo .
DeltaIV
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.