Ưu điểm chính của mô hình quá trình Gaussian


11

Quá trình Gaussian đã được sử dụng rộng rãi, đặc biệt là trong thi đua. Được biết, nhu cầu tính toán rất cao ( ).0(n3)

  1. Điều gì làm cho chúng phổ biến?
  2. Lợi thế chính và ẩn của họ là gì?
  3. Tại sao chúng được sử dụng thay cho các mô hình tham số (theo mô hình tham số Tôi có nghĩa là hồi quy tuyến tính điển hình trong đó các dạng tham số khác nhau có thể được sử dụng để mô tả xu hướng đầu vào so với đầu ra; ví dụ: qaudratic)?

Tôi thực sự sẽ đánh giá cao một câu trả lời kỹ thuật giải thích các thuộc tính vốn có làm cho quá trình Gaussian trở nên độc đáo và thuận lợi


Bạn có thể làm rõ những gì bạn có ý nghĩa của các mô hình tham số?
Alexey Zaytsev

@Alexey Tôi đã làm rõ ý của tôi về mô hình paramtric ở trên. Cảm ơn bạn
Wis

Từ những gì tôi giả định về các mô hình tham số, bạn cần chỉ định mô hình bằng tay cho từng vấn đề. Điều này không phải lúc nào cũng có thể, vì bản chất thực sự không phải lúc nào cũng được biết đến. Hơn nữa, có thể có những khó khăn với việc phù hợp với các mô hình này, trong khi đối với việc ước tính các tham số quy trình Gaussian hoạt động tốt hầu như mọi lúc.
Alexey Zaytsev

4
Splines và hồi quy tuyến tính tương đương với hồi quy quy trình Gaussian với hàm hiệp phương sai phù hợp được chọn. Nhưng các quy trình Gaussian cung cấp một khung xác suất thuận tiện rất phù hợp cho nhiều nhiệm vụ.
Alexey Zaytsev

1
Khi nào bạn không sử dụng quy trình Gaussian?
Alby

Câu trả lời:


6

Những lợi thế chính là từ quan điểm kỹ thuật (như @Alexey đã đề cập). Trong quy trình Kriging được sử dụng rộng rãi, bạn có thể diễn giải "không gian" của riêng mình bằng cách cung cấp mô hình "tương quan" (hoặc hiệp phương sai) (thường được gọi là ellipsoid variogram ) cho các mối quan hệ tùy theo khoảng cách và định hướng.

Không có gì ngăn cản các phương pháp khác có các tính năng tương tự, điều đó đã xảy ra rằng cách thức giết người được khái niệm hóa đầu tiên có một cách tiếp cận thân thiện với những người không phải là thống kê.

Ngày nay với sự phát triển của các phương pháp ngẫu nhiên dựa trên địa lý học, như Mô phỏng Gaussian tuần tự trong số các phương pháp khác , các quy trình này đang được sử dụng trong các lĩnh vực trong đó điều quan trọng là xác định không gian không chắc chắn (có thể mất hàng nghìn đến hàng triệu kích thước). Một lần nữa, từ quan điểm kỹ thuật, các thuật toán dựa trên địa lý rất dễ đưa vào lập trình di truyền . Vì vậy, khi bạn gặp vấn đề nghịch đảo, bạn cần có thể kiểm tra nhiều kịch bản và kiểm tra khả năng thích ứng của chúng với chức năng tối ưu hóa của bạn.

Chúng ta hãy để lại lập luận thuần túy trong giây lát một trạng thái cho các ví dụ thực tế hiện đại về việc sử dụng này. Bạn có thể lấy mẫu trực tiếp các mẫu ngầm (dữ liệu cứng) hoặc tạo bản đồ địa chấn của phần dưới bề mặt (dữ liệu mềm).

Trong dữ liệu cứng, bạn có thể đo trực tiếp một thuộc tính (giả sử trở kháng âm thanh) mà không có lỗi (ish). Vấn đề là điều này là khan hiếm (và đắt tiền). Mặt khác, bạn có ánh xạ địa chấn theo nghĩa đen là âm lượng, pixel-khôn ngoan, bản đồ của lớp dưới bề mặt nhưng không cho bạn trở kháng âm thanh. Để đơn giản, giả sử nó cung cấp cho bạn tỷ lệ giữa hai giá trị trở kháng âm (trên và dưới). Vì vậy, tỷ lệ 0,5 có thể là một phân chia 1000/2000 hoặc 10 000/20 000. Đó là một không gian giải pháp và một số kết hợp sẽ làm nhưng chỉ có một kết hợp chính xác đại diện cho thực tế. Làm thế nào để bạn giải quyết điều này?

Cách thức đảo ngược địa chấn hoạt động (quy trình ngẫu nhiên) là bằng cách tạo ra các kịch bản hợp lý (và đây là một câu chuyện khác cùng nhau) về trở kháng âm (hoặc các tính chất khác), biến các kịch bản đó thành địa chấn tổng hợp (như tỷ lệ trong ví dụ trước) và so sánh địa chấn tổng hợp với địa chấn thực (tương quan). Các kịch bản tốt nhất sẽ được sử dụng để tạo ra nhiều kịch bản hơn, hội tụ thành một giải pháp (điều này không dễ dàng như nó có vẻ).

Cân nhắc điều này và nói theo quan điểm về khả năng sử dụng, tôi sẽ trả lời các câu hỏi của bạn theo cách sau:

1) Điều khiến chúng trở nên phổ biến là tính khả dụng, tính linh hoạt khi triển khai, một số lượng lớn các trung tâm nghiên cứu và tổ chức tiếp tục thực hiện các quy trình dựa trên gaussian mới hơn và dễ thích nghi hơn cho một số lĩnh vực khác nhau (đặc biệt là trong khoa học địa chất, bao gồm cả GIS).

2) Những ưu điểm chính là , như đã đề cập trước đây, tính khả dụng và tính linh hoạt theo quan điểm của tôi. Nếu nó dễ thao tác và dễ sử dụng, bạn chỉ cần làm điều đó. Không có tính năng đặc biệt nào trong các quy trình gaussian không thể lặp lại trong các phương pháp khác (thống kê hoặc cách khác).

3) Chúng được sử dụng khi bạn cần đưa nhiều thông tin vào mô hình của mình hơn là dữ liệu (thông tin có quan hệ khôn ngoan về không gian, phân phối thống kê, v.v.). Tôi có thể đảm bảo rằng nếu bạn có nhiều dữ liệu với hành vi đẳng hướng bằng cách sử dụng phương pháp giết người là một sự lãng phí thời gian. Bạn có thể nhận được kết quả tương tự bằng cách sử dụng bất kỳ phương pháp nào khác bằng cách yêu cầu ít thông tin hơn, tốc độ chạy nhanh hơn.


Và khi nào một mô hình khác là sự lựa chọn tốt hơn?
Ben

1
@Ben Nó sẽ luôn phụ thuộc vào nghiên cứu trường hợp. Phương pháp dựa trên Kriging, hoặc Kriging, có chi phí tính toán cao (vì vậy, không nhanh). Ví dụ: TV 4k (hoặc nhiều hơn) hiện đại sử dụng các phương pháp nội suy để thử và cải thiện nội dung được thực hiện cho độ phân giải nhỏ hơn. Điều này ngụ ý rằng nó cần thực hiện thao tác này nhanh và không cần sự can thiệp của người dùng (mà một mô hình hiệp phương sai sẽ yêu cầu). Nếu tôi giải quyết được vấn đề đặc biệt này, tôi sẽ tránh hoàn toàn Kriging. Ngoài ra, một số hiện tượng dựa trên mô hình hoặc có một biến rời rạc hoặc có thể được giảm thành công thức (ví dụ FEM), v.v ...
armatita

Và khi tốc độ không quan trọng?
Ben

@Ben Tốc độ ít quan trọng hơn nếu kết quả của bạn không cần phải ngay lập tức. Mô hình hóa bề mặt, dự đoán thời tiết và một loạt các hoạt động trong khoa học GIS chỉ là một vài ví dụ. Một cái khác là cái được trình bày trong câu trả lời (đảo ngược địa chấn).
armatita

Xin lỗi, đã không có được điều đó. Cả vấn đề tốc độ tính toán và kết quả, các nhược điểm của GP là gì? Hay nói cách khác: Không nên sử dụng nó thường xuyên hơn?
Ben

7

Đối với các kỹ sư, điều quan trọng là:

  • để có khoảng tin cậy cho dự đoán
  • nội suy dữ liệu đào tạo
  • để có các mô hình mịn và phi tuyến
  • sử dụng các mô hình hồi quy thu được để thiết kế thích nghi các thí nghiệm và tối ưu hóa

Các quy trình Gaussian đáp ứng tất cả các yêu cầu này.

Hơn nữa, thường các bộ dữ liệu kỹ thuật và địa lý không lớn hoặc có cấu trúc lưới cụ thể cho phép suy luận nhanh.


1
Cảm ơn bình luận của bạn . Dường như do các mô hình quá trình gaussian giải thích bayes của họ có thể có định lượng không chắc chắn tốt, tuy nhiên điều này cũng có thể trong hồi quy tham số. Tôi đang tìm kiếm một phương pháp kỹ thuật có thể giải thích tập hợp các lợi thế thống kê
Wis

3

Ưu điểm của mô hình Gaussian.

Gaussian PDF chỉ phụ thuộc vào khoảnh khắc thứ nhất và thứ hai. Một quá trình Gaussian tĩnh có ý nghĩa rộng cũng là một quá trình đứng yên có ý nghĩa nghiêm ngặt và ngược lại.

Gaussian PDF có thể mô hình hóa việc phân phối nhiều quy trình bao gồm một số lớp tín hiệu và nhiễu quan trọng. Tổng của nhiều quá trình ngẫu nhiên độc lập có phân phối Gaussian (định lý giới hạn trung tâm).

Các quá trình không phải là Gaussian có thể được xấp xỉ bằng một tổ hợp có trọng số (nghĩa là hỗn hợp) của một số pdf Gaussian có phương tiện và phương sai thích hợp.

Các phương pháp ước lượng tối ưu dựa trên các mô hình Gaussian thường dẫn đến các giải pháp tuyến tính và toán học.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.