Các quy trình Gaussian với diện tích lấy mẫu hữu hạn


8

Tôi xin lỗi trước nếu câu hỏi này được đặt ra kém: Tôi là một nhà thiên văn học, không phải là một nhà thống kê. Câu hỏi của tôi đặc biệt nhằm mục đích giúp tôi tìm hiểu xem các quy trình Gaussian có phải là một kỹ thuật phù hợp cho vấn đề của tôi không.

Sử dụng kính viễn vọng và máy quang phổ ăn sợi, dự án của tôi đã thu được quang phổ của một thiên hà tại nhiều địa điểm. Mẫu lấy mẫu cho một điểm duy nhất nằm trong hình ảnh đầu tiên và được lặp lại tổng cộng ba lần, với các độ lệch không gian khác nhau, để lấp đầy các khoảng trống (hình ảnh thứ hai). Lý tưởng nhất, tôi muốn xây dựng các ước tính về số lượng nhất định trên một lưới bao phủ thiên hà.

Mẫu lấy mẫu cho một kính thiên văn duy nhất Mẫu bù đa điểm

Phương pháp ngây thơ của tôi sẽ là phân tích riêng từng phổ của sợi, để tôi có ước tính điểm về số lượng quan tâm, sau đó xây dựng quy trình Gaussian để ước tính các đại lượng đó ở mọi nơi. Tương tự, tôi có thể tự xây dựng một quy trình Gaussian cho quang phổ, sau đó phân tích GP trên lưới lựa chọn của tôi để tìm đại lượng mà tôi quan tâm. Tuy nhiên, tôi không chắc đây là một cách tiếp cận hợp lệ, vì các quan sát của tôi là không rời rạc, mà là trùng hợp3Nfibers

Ví dụ, không giống như các nhà khoa học về đất, những người có thể lấy mẫu bụi bẩn từ một vị trí rất riêng biệt, sau đó di chuyển ra xa 50 mét và lặp lại, các quan sát của tôi chồng chéo lên nhau, vì vậy tôi đang tích hợp trên tất cả ánh sáng mà một thiên hà phát ra. Tôi không rõ ràng rằng tôi sẽ được phép bỏ qua bất kỳ biến thể không gian nào có thể tồn tại trong một phép đo nhất định. Nói cách khác, một quy trình Gaussian thậm chí có giá trị khi các vị trí lấy mẫu riêng lẻ không nhỏ? Tôi có thể xây dựng một thuật ngữ không gian bổ sung để giải thích cho sự "trộn" ánh sáng trong một sợi không?


Phụ lục: Theo truyền thống, quang phổ chỉ được nội suy, ghép lại trên lưới và sau đó phân tích, điều này cũng khiến tôi vô cùng sai lầm - nhưng nếu tôi sẽ làm mưa trên các cuộc diễu hành của đồng nghiệp, tôi ít nhất muốn trình bày một phương pháp thay thế.

Câu trả lời:


5

Tôi nghĩ rằng hai câu hỏi của bạn đóng đinh vấn đề xuống. Có vẻ như bạn có thể sử dụng GP cho một số vấn đề nhưng bạn có thể cần phải làm nhiều hơn nữa. Để giải thích các vấn đề tôi thấy, trước tiên tôi sẽ dịch sự hiểu biết của tôi về vấn đề của bạn sang ngôn ngữ toán học hơn:

  1. Vấn đề

Bạn quan tâm đến một số lượng vật lý ("quang phổ"?) Trong đó là một điểm trong một số miền của mặt phẳng (ảnh của bạn). là vô hướng tức là một số duy nhất cho mỗi điểm của mặt phẳng. Bạn không thể quan sát trực tiếp , bạn chỉ có thể quan sát một số trung bình không gian của nó tại một số điểm của lưới. Tức là bạn quan sátCác là đĩa chồng chéo khác nhau trong ảnh của bạn. Bạn đã không đề cập đến nó nhưng có thể cũng có một số nhiễu đo lường trong các quan sát của bạn, sau đó bạn sẽ cần thêm một thuật ngữ tiếng ồn trên RHS.f(x)xffFsk

F(sk)=Dkf(x)dx.
Dkϵ
  1. Còn bác sĩ gia đình thì sao?

Đó là hoàn toàn OK để phù hợp với một GP để quan sát của bạn và bạn sẽ nhận được một xấp xỉ GP hợp lệ hoặc nội suy của . GP thực sự không quan tâm rằng của bạn được tạo từ các đĩa chồng lấp, nó sẽ lưu ý và phản ánh đúng mức tương quan cho các giá trị đủ gần nhau. Vấn đề tất nhiên là điều này sẽ tạo ra GP cho chứ không phải một cho . Và sẽ không phải là một xấp xỉ (tốt / hợp lý) của trừ khi không đổi ít nhiều trên .FFFfFffDk

  1. Làm thế nào để phục hồi ?f

Có nhiều cách khác nhau để phục hồi từ . Điều gì có thể thực hiện được hoặc thậm chí là "tốt nhất" phụ thuộc vào yêu cầu cụ thể của bạn và chi tiết của vấn đề. Vì bạn biết rõ hàm trung bình của bạn có thể thử một số dạng giải mã số.fFmFF

Một hơn GP cách tinh thần là làm cho giả định rằng là một GP với trung bình chức năng và hàm hiệp phương sai . Lý thuyết toán học cho bạn biết rằng cũng là một GP với hàm trung bình và hiệp phương sai .fmKF

mF(s)=Dsm(x)dx
KF(s1,s2)=Ds1Ds2K(x1,x2)dx1dx2

Định lý representer cho giá trị trung bình của GP cho bạn biết rằng và bạn có thể kết luận bằng cách so sánh các hệ số màm ( s ) = k α k D k K ( x , s ) d x .mF(s)=kαkKF(sk,s)

m(s)=kαkDkK(x,s)dx.

Bạn cũng có thể lấy được phân phối dự đoán tại một điểm bằng cách ghi nhận rằng và các quan sát của có phân phối chuẩn chung và bạn có thể đặt điều kiện trên những quan sát của . Các công thức trở nên phức tạp nhưng chúng rất đơn giản (xem bài viết này Phương trình (8) và (9)) f ( s ) F Fsf(s)FF

Vấn đề với vấn đề này nằm ở khía cạnh thực tế: Bạn cần tìm hạt nhân từ sự lựa chọn của , điều này có thể khó khăn hoặc bạn bắt đầu với một sao cho (i) bạn có thể tính toán VÀ (ii) hoạt động tốt cho các quan sát của bạn VÀ (iii) có ý nghĩa như một mô hình cho dữ liệu thiên văn của bạn.K F K K F K F KKKFKKFKFK


Thảo luận tuyệt vời. Thay vào đó, chúng ta có thể tưởng tượng một thủ tục như: 1) Mở rộng F trên các hàm cơ bản đã chọn, 2) Ước tính vectơ của tham số và xây dựng , 3) Lấy đạo hàm của để phục hồi ? F fF^F^f^
dv_bn

Có nhưng bước 3 chỉ hoạt động ở một chiều chứ không phải hai chiều như trường hợp ở đây.
gg

Ngay cả khi bạn có một dẫn xuất định hướng?
dv_bn

Cảm ơn cho cuộc thảo luận cực kỳ kỹ lưỡng này. Nó đã cho tôi rất nhiều suy nghĩ về!
DathosPachy

1

Có một chủ đề trong địa lý học gọi là Chính xác Downscaling. Mục tiêu chính ở đây là ước tính một tài sản ở quy mô nhỏ hơn so với các quan sát. Ngoài ra những quan sát này có thể hoặc không thể chồng chéo (không thực sự quan trọng). Vui lòng xem bài viết này: http://www.ccgalberta.com/ccgresource/report07/2005-101-exact_Vproduction.pdf

Trong bài báo này, họ chỉ ra một phương pháp để hạ thấp các quan sát bằng các kỹ thuật địa lý. Chúng chỉ ra rằng bằng cách tính toán chính xác các hiệp phương sai giữa các thang dữ liệu khác nhau (điểm so với khối), ước tính phá hoại vẫn còn hiệu lực; sao cho trung bình của các giá trị ước tính ở quy mô nhỏ hơn bằng với dữ liệu đầu vào lớn hơn. Về cơ bản, để tính toán các giá trị ước tính theo bất kỳ thang đo nào, bạn chỉ cần tính hàm hiệp phương sai giữa dữ liệu đầu vào, thang đo đích và tương quan chéo một cách chính xác. Tại Quy trình Gaussian, giả định là việc ước tính đang được thực hiện ở cùng tỷ lệ với các quan sát đầu vào.

Vì vậy, đây là các bước: 1- Tính toán variogram thử nghiệm từ dữ liệu của bạn.

2- Lắp mô hình variogram vào variogam kinh nghiệm của bạn. Bạn có thể cần phải tính đến bất đẳng hướng định hướng ở đây. Đây là hàm hiệp phương sai trong GP được tính theo phương pháp khả năng tối đa.

3- Tính toán tất cả các hiệp phương sai và hiệp phương sai giữa dữ liệu đầu vào và thang đo mục tiêu. Có biên lai số cho bước này. Ý tưởng là bằng cách phân tách các khối thành các điểm hữu hạn, bạn có thể tính được hiệp phương sai trung bình. Các dữ liệu chồng chéo nên được đưa vào tài khoản ở đây.

4- thực hiện Kriging và tính toán các giá trị ước tính.

GP là chủ đề rất liên quan đến địa lý học. Tuy nhiên, địa lý không giới hạn trong các quy trình Gaussian. Có nhiều phương pháp khác để ước tính hoặc mô phỏng một quá trình ngẫu nhiên.


1
Chào mừng đến với trang web. Chúng tôi đang cố gắng xây dựng một kho lưu trữ thông tin thống kê chất lượng cao vĩnh viễn dưới dạng câu hỏi và câu trả lời. Vì vậy, chúng tôi cảnh giác với các câu trả lời chỉ liên kết, do linkrot. Bạn có thể đăng một trích dẫn đầy đủ và một bản tóm tắt các thông tin tại liên kết, trong trường hợp nó bị chết?
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.