Đây là một câu trả lời ngoài lề trái, chỉ chạm vào phần "thực hành tốt nhất xung quanh việc kết hợp nhiều mô hình" trong câu hỏi của bạn. Về cơ bản, đây chính xác là luận điểm danh dự của tôi, ngoại trừ việc tôi đang xử lý các mô hình phức tạp, phi tuyến tính cao thể hiện sự hỗn loạn và tiếng ồn - mô hình khí hậu. Điều này không có khả năng áp dụng rộng rãi cho nhiều lĩnh vực, nhưng có thể hữu ích trong sinh thái học hoặc kinh tế lượng.
Cho đến gần đây trong cộng đồng người mẫu khí hậu, các mô hình phần lớn chỉ bị đập vỡ với nhau ở mức trung bình không có trọng số (thường là sau khi hiệu chỉnh sai lệch liên quan đến việc loại bỏ mô hình có nghĩa là một phần hoặc toàn bộ giai đoạn mẫu). Về cơ bản, đây là những gì IPCC đã làm cho báo cáo đánh giá thứ 4 (4AR) và các báo cáo trước đó.
Đây ít nhiều là một ví dụ về trường hợp " sự thật cộng với lỗi " của sự kết hợp đồng bộ, trong đó nó được ngầm định hoặc rõ ràng giả định rằng chuỗi quan sát (ví dụ: nhiệt độ toàn cầu, lượng mưa cục bộ, v.v.) là đúng và nếu bạn lấy đủ mẫu (ví dụ: mô hình chạy), tiếng ồn trong mô hình chạy sẽ hủy (xem (1)).
Gần đây, các phương pháp kết hợp các mô hình dựa trên trọng số hiệu suất đã được sử dụng. Bởi vì các mô hình khí hậu rất ồn ào và có rất nhiều biến số và tham số, nên cách duy nhất để đánh giá hiệu suất (mà tôi biết) là bằng cách lấy hiệp phương sai, hoặc lấy MSE giữa đầu ra mô hình và chuỗi thời gian quan sát được. Các mô hình sau đó có thể được kết hợp bằng cách cân trọng số trung bình dựa trên thước đo đó. Có một cái nhìn tổng quan về điều này trong (2).
Một giả định đằng sau phương pháp kết hợp mô phỏng này là giả định rằng các mô hình hoàn toàn độc lập - nếu một số phụ thuộc cao, chúng sẽ sai lệch trung bình. Giả định này khá hợp lý cho bộ dữ liệu được sử dụng cho 4AR ( CMIP3 , vì bộ dữ liệu này được tạo thành từ một vài mô hình chạy từ nhiều nhóm mô hình (mặt khác, mã được chia sẻ trong cộng đồng người mẫu, do đó vẫn có thể có một số phụ thuộc lẫn nhau Để có cái nhìn thú vị về điều này, hãy xem (3)). Bộ dữ liệu cho báo cáo đánh giá tiếp theo, CMIP5, không có thuộc tính hơi tình cờ này - một số nhóm mô hình sẽ gửi một vài lần chạy, trong khi một số sẽ gửi hàng trăm. Các tập hợp đến từ các đội khác nhau có thể được tạo ra bởi sự thay đổi điều kiện ban đầu, hoặc bằng cách thay đổi vật lý mô hình và tham số hóa. Ngoài ra, siêu tập hợp này không được lấy mẫu theo bất kỳ cách có hệ thống nào - chỉ là ai đã từng mang dữ liệu được chấp nhận (theo lý do). Điều này được biết đến trong lĩnh vực này như là một " tập hợp cơ hội ". Có một cơ hội công bằng rằng việc sử dụng một giá trị trung bình không có trọng số trên một bản hòa tấu như vậy sẽ mang đến cho bạn một số thành kiến lớn đối với các mô hình có nhiều lần chạy hơn (vì mặc dù có hàng trăm lần chạy, có khả năng số lần chạy thực sự độc lập nhỏ hơn rất nhiều).
Giám sát viên của tôi có một bài báo đánh giá tại thời điểm này mô tả một quá trình kết hợp mô hình liên quan đến hiệu suất VÀ trọng số độc lập . Có một bản tóm tắt về hội thảo (4), tôi sẽ đăng liên kết đến bài báo khi nó được xuất bản (quá trình chậm, đừng nín thở). Về cơ bản, bài viết này mô tả một quá trình liên quan đến việc lấy hiệp phương sai của mô hình (mô hình quan sát) và giảm các mô hình có hiệp phương sai cao với tất cả các mô hình khác, (ví dụ: các mô hình có lỗi phụ thuộc cao). Phương sai lỗi mô hình cũng được tính toán và được sử dụng làm thành phần trọng số hiệu năng.
Cũng đáng lưu ý rằng mô hình khí hậu rõ ràng bị ảnh hưởng nặng nề bởi sự mơ hồ của mô hình số nói chung. Có một thứ gọi là "thử nghiệm cười" - nếu bạn kết thúc với một cuộc chạy mô hình ngụ ý rằng nhiệt độ trung bình toàn cầu sẽ là + 20 ° C vào năm 2050, bạn chỉ cần ném nó ra, bởi vì nó rõ ràng không liên quan đến thể chất. Rõ ràng loại thử nghiệm này là khá chủ quan. Tôi chưa yêu cầu nó, nhưng tôi hy vọng trong tương lai gần.
Đó là sự hiểu biết của tôi về sự kết hợp mô hình nhà nước trong lĩnh vực của tôi tại thời điểm này. Rõ ràng là tôi vẫn đang học, vì vậy nếu tôi nhấn vào bất cứ điều gì đặc biệt, tôi sẽ quay lại và cập nhật câu trả lời này.
(1) Tebaldi, C. & Knutti, R., 2007 Việc sử dụng quần thể đa mô hình trong các dự báo khí hậu xác suất. Các giao dịch triết học của Hiệp hội Hoàng gia A: Khoa học toán học, vật lý và kỹ thuật, 365 (1857), tr.2053 Phản2075.
(2) Knutti, R. và cộng sự, 2010. Hội nghị chuyên gia IPCC về đánh giá và kết hợp các dự báo khí hậu đa mô hình.
(3) Masson, D. & Knutti, R., 2011. Gia phả mô hình khí hậu. Công viên địa chất. Độ phân giải Lett, 38 (8), tr.
(4) Abramowitz, G. & Giám mục, C., 2010. Xác định và tính trọng số cho sự phụ thuộc mô hình trong dự đoán tổng thể. Trong bản tóm tắt cuộc họp mùa thu của AGU. tr. 07.