Nguyên tắc đằng sau sự hội tụ của các phương pháp không gian con Krylov để giải các hệ phương trình tuyến tính là gì?


24

Theo tôi hiểu, có hai loại phương pháp lặp chính để giải các hệ phương trình tuyến tính:

  1. Phương pháp văn phòng phẩm (Jacobi, Gauss-Seidel, SOR, Multigrid)
  2. Các phương thức không gian con Krylov (Conjugate Gradient, GMRES, v.v.)

Tôi hiểu rằng hầu hết các phương pháp đứng yên hoạt động bằng cách lặp đi lặp lại (làm mịn) các chế độ Fourier của lỗi. Theo tôi hiểu, phương pháp Gradient Conjugate (phương pháp không gian con Krylov) hoạt động bằng cách "bước" thông qua một tập hợp các hướng tìm kiếm tối ưu từ các quyền hạn của ma trận áp dụng cho phần dư thứ n . Là nguyên tắc này phổ biến cho tất cả các phương pháp không gian con Krylov? Nếu không, làm thế nào để chúng ta mô tả nguyên tắc đằng sau sự hội tụ của các phương pháp không gian con Krylov, nói chung?


2
Phân tích của bạn về các phương pháp đứng yên bị sai lệch bởi các vấn đề mô hình đơn giản, bởi vì chúng có thể được phân tích theo các chế độ Fourier. Nó cũng bỏ qua định hướng xen kẽ (ADI) và nhiều phương pháp khác. Điểm của hầu hết các "Phương pháp tĩnh" là kết hợp nhiều bộ giải "một phần gần đúng" đơn giản vào một bộ giải lặp. Điểm của các phương pháp Krylov là tăng tốc (hoặc thậm chí thực thi) sự hội tụ của một phép lặp tuyến tính cố định nhất định.
Thomas Klimpel

4
Một bài báo mà tôi nghĩ đã được viết để trả lời câu hỏi của bạn là Ipsen và Meyer, Ý tưởng đằng sau phương pháp Krylov, Amer. Môn Toán. Hàng tháng 105 (1998) trang 889-899. Đó là một bài viết tuyệt vời bằng văn bản và làm rõ, có sẵn ở đây .
Andrew T. Barker

@ AndrewT.Barker: Tuyệt vời! Cảm ơn Andrew! :)
Paul

Câu trả lời:


21

Nói chung, tất cả các phương pháp Krylov về cơ bản đều tìm kiếm một đa thức nhỏ khi được đánh giá trên phổ của ma trận. Cụ thể, phần dư thứ của phương pháp Krylov (với số lần đoán ban đầu bằng 0) có thể được viết dưới dạngn

rn=Pn(A)b

Trong đó là một đa thức monic bậc nPnn .

Nếu là những đường chéo, với A = V Λ V - 1 , chúng tôi cóAA=VΛV1

rnVPn(Λ)V1b=κ(V)Pn(Λ)b.

Trong trường hợp bình thường (ví dụ: đối xứng hoặc đơn nhất), chúng ta biết rằng GMRES xây dựng một đa thức như vậy thông qua phép lặp Arnoldi, trong khi CG xây dựng đa thức bằng cách sử dụng một sản phẩm bên trong khác (xem câu trả lời nàyκ ( V ) = 1.Aκ(V)=1. để biết chi tiết ). Tương tự, BiCG xây dựng đa thức của nó thông qua quá trình Lanczos không đối xứng, trong khi phép lặp Chasershev sử dụng thông tin trước về phổ (thường ước tính các giá trị riêng lớn nhất và nhỏ nhất cho ma trận xác định đối xứng).

Như một ví dụ thú vị (được thúc đẩy bởi Trefethen + Bau), hãy xem xét một ma trận có phổ là:

Phổ của ma trận

Trong MATLAB, tôi đã xây dựng điều này với:

A = rand(200,200);
[Q R] = qr(A);
A = (1/2)*Q + eye(200,200);

Nếu chúng ta xem xét GMRES, xây dựng các đa thức thực sự giảm thiểu phần dư trên tất cả các đa thức monic bậc , chúng ta có thể dễ dàng dự đoán lịch sử còn lại bằng cách nhìn vào đa thức ứng cử viênn

Pn(z)=(1z)n

mà trong trường hợp của chúng tôi cho

|Pn(z)|=12n

cho trong quang phổ của .AzA

Bây giờ, nếu chúng ta chạy GMRES trên RHS ngẫu nhiên và so sánh lịch sử còn lại với đa thức này, chúng phải khá giống nhau (các giá trị đa thức ứng cử viên nhỏ hơn GMRES dư vì ):b2>1

Lịch sử còn lại


Bạn có thể làm rõ những gì bạn có nghĩa là "nhỏ trên phổ của ma trận"?
Paul

2
Thực hiện như là một đa thức phức tạp, đa thức có mô đun nhỏ trong một khu vực của mặt phẳng phức bao gồm quang phổ của . Hãy tưởng tượng một âm mưu đường viền được đặt chồng lên một âm mưu phân tán của các giá trị riêng. Nhỏ như thế nào là nhỏ? Nó phụ thuộc vào vấn đề, liệu có bình thường không, và bên tay phảiMặc dù vậy, ý tưởng cơ bản là chuỗi các đa thức tìm cách tăng dần và nhỏ hơn trên phổ để ước lượng dư trong câu trả lời của tôi có xu hướng về . A A b . ( P n ) 0PnAAb.(Pn)0
Reid.Atcheson

@ Reid.Atcheson: Rất tốt. Tôi có thể khuyên bạn nên viếtnhư và đề cập rằng nó là một cho ma trận bình thường? κ ( V )VV1κ(V)
Jack Poulson

Điều kiện tiên quyết Laplacian bởi SOR tối ưu có phổ rất giống với ma trận ví dụ này. Chi tiết tại đây: scicomp.stackexchange.com/a/852/119
Jed Brown

Nói đúng ra, CGNE độc lập với phổ vì nó chỉ phụ thuộc vào các giá trị số ít.
Jed Brown

17

Về định mức

nthPn2

rn=Axnb=(Pn(A)1)bb=Pn(A)b.

AAA1

rnMột-1= =rnTMột-1rn= =(Mộten)TMột-1Mộten= =enTMộten= =enMột

nơi chúng tôi đã sử dụng lỗi

en= =xn-x*= =xn-Một-1b= =Một-1rn

MộtMột-1Một2MộtTMộtMột

Độ sắc nét của giới hạn hội tụ

Cuối cùng, có tài liệu thú vị liên quan đến các phương pháp Krylov khác nhau và sự tinh tế của sự hội tụ GMRES, đặc biệt là đối với các nhà khai thác không bình thường.


Bạn rời khỏi cuốn sách tuyệt vời bởi Olavi Nevanlinna: books.google.com/...
Matt Knepley

11

Phương pháp lặp trong một tóm tắt:

  1. Mộtx= =bC

    x= =x+Cb-CMộtx
    tôi-CMột<1CC= =D-1DMột
  2. Bạn,VCnx~Bạnb-Mộtx~VBạnMộtVV= =BạnV= =MộtBạn

    Vx~BạnBạn

    BạnMộtx~

    Điều này được giải thích độc đáo trong cuốn sách của Youcef Saad về các phương pháp lặp .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.