Các tiêu chí dừng cho các bộ giải tuyến tính lặp được áp dụng cho các hệ thống gần như số ít

Xét với gần như số ít có nghĩa là có một giá trị riêng của rất nhỏ. Tiêu chí dừng thông thường của phương pháp lặp dựa trên và liên quan đến các lần lặp có thể dừng khi với số lần lặp. Nhưng trong trường hợp chúng tôi đang xem xét, có thể có lỗi lớn sống trong không gian eigens không liên quan đến eigenvalue nhỏ mang lại số dư nhỏ . Giả sử còn lại ban đầu lớn, thì có thể chúng ta dừng lại ở $Ax=b$ $A$ $\lambda_0$ $A$ $r_n:=b-Ax_n$ $\|r_n\|/\|r_0\|<tol$ $n$ $v$ $\lambda_0$ $Av=\lambda_0v$ $r_0$ $\|r_n\|/\|r_0\|<tol$ nhưng lỗi $x_n-x$ vẫn còn lớn. Một chỉ báo lỗi tốt hơn trong trường hợp này là gì? Là $\|x_{n}-x_{n-1}\|$ một ứng cử viên tốt?

linear-algebra

— Hui Zhang
nguồn

Bạn có thể muốn nghĩ về định nghĩa của bạn về "gần như số ít". Ma trận (với và ma trận danh tính) có một giá trị riêng rất nhỏ, nhưng khác xa so với bất kỳ ma trận nào.

I \cdot ϵ

$I \cdot \epsilon$

ϵ ≪ 1

$\epsilon\ll 1$

I

$I$

— David Ketcheson

Ngoài ra,có vẻ như ký hiệu sai.

là điển hình hơn, không?

| | r_{n} / r_{0} | |

$||r_n/r_0||$

| | r_{n} | | / | | r_{0} | |

$||r_n||/||r_0||$

— Bill Barth

Vâng, bạn nói đúng, Bill! Tôi sẽ sửa lỗi này.

— Hui Zhang

Thế còn? và thuật toán của bạn, chính xác là gì?

‖ b - A x ‖ / ‖ b ‖

$\| b - Ax \| / \| b \|$

— shuhalo

Phụ lục: Tôi nghĩ rằng bài báo sau đây khá nhiều về các hệ thống điều hòa mà bạn lo lắng, ít nhất là nếu bạn đang sử dụng CG: Axelson, Kaporin: Ước tính định mức lỗi và dừng tiêu chí trong các lần lặp độ dốc liên hợp tiền điều kiện. DOI: 10.1002 / nla.244

— shuhalo

Câu trả lời:

Vui lòng không bao giờ sử dụng sự khác biệt giữa các lần lặp liên tiếp để xác định tiêu chí dừng. Điều này chẩn đoán sai sự trì trệ cho sự hội tụ. Hầu hết các lần lặp ma trận không đối xứng không phải là đơn điệu, và thậm chí GMRES trong số học chính xác không có khởi động lại có thể bị đình trệ cho một số lần lặp tùy ý (lên đến kích thước của ma trận) trước khi hội tụ đột ngột. Xem các ví dụ trong Nachtigal, Reddy và Trefethen (1993) .

Một cách tốt hơn để xác định sự hội tụ

Chúng tôi thường quan tâm đến độ chính xác của giải pháp của chúng tôi nhiều hơn kích thước của phần dư. Cụ thể, chúng tôi có thể muốn đảm bảo rằng sự khác biệt giữa một giải pháp gần đúng và giải pháp chính xác thỏa mãn cho một số người dùng chỉ định . Nó chỉ ra rằng có thể đạt được điều này bằng cách tìm một sao cho nơi là giá trị đơn lẻ nhỏ nhất của , do $x_n$ $x$

| x_{n} - x | < c

$|x_n - x| < c$

c

$c$

x_{n}

$x_n$

| A x_{n} - b | < c ϵ

$|A x_n - b| < c\epsilon$

ϵ

$\epsilon$

A

$A$

\begin{aligned} | x_{n} - x | & = | A^{- 1} A (x_{n} - x) | \\ \leq \frac{1}{ϵ} | A x_{n} - A x | \\ = \frac{1}{ϵ} | A x_{n} - b | \\ < \frac{1}{ϵ} \cdot c ϵ = c \end{aligned}

$\begin{align} |x_n - x| &= |A^{-1} A (x_n - x)| \\ & \le \frac 1 \epsilon |A x_n - A x| \\ & = \frac 1 \epsilon |A x_n - b| \\ & < \frac 1 \epsilon \cdot c \epsilon = c \end{align}$

trong đó chúng ta đã sử dụng là giá trị số đơn lớn nhất của (dòng thứ hai) và chính xác giải (dòng thứ ba). $1/\epsilon$ $A^{-1}$ $x$ $A x = b$

Ước tính giá trị đơn lẻ nhỏ nhất $\epsilon$

Một ước tính chính xác của giá trị số ít nhất thường không có sẵn trực tiếp từ vấn đề, nhưng nó có thể được ước tính như một sản phẩm phụ của độ dốc liên hợp hoặc phép lặp GMRES. Lưu ý rằng mặc dù ước tính về giá trị riêng lớn nhất và giá trị đơn lẻ thường là khá tốt chỉ sau một vài lần lặp lại, một ước tính chính xác của nhỏ eigen / giá trị đơn lẻ thường chỉ thu được một lần hội tụ là đạt. Trước khi hội tụ, ước tính nhìn chung sẽ lớn hơn đáng kể so với giá trị thực. Điều này cho thấy rằng bạn thực sự phải giải quyết các phương trình trước khi bạn có thể xác định chính xác sự khoan dung . Dung sai hội tụ tự động có độ chính xác do người dùng cung cấp $\epsilon$ $c\epsilon$ $c$ cho các giải pháp và dự toán giá trị đơn lẻ nhỏ nhất với tình trạng hiện thời của phương pháp Krylov có thể hội tụ quá sớm vì ước lượng là lớn hơn nhiều so với giá trị thực. $\epsilon$ $\epsilon$

Ghi chú

Các cuộc thảo luận ở trên cũng hoạt động với thay thế bằng toán tử tiền điều kiện bên trái và phần dư tiền điều kiện hoặc với toán tử tiền điều kiện bên phải và lỗi . Nếu $A$ $P^{-1}A$ $P^{-1} (A x^n - b)$ $A P^{-1}$ $P (x_n - x)$ $P^{-1}$ là một điều kiện tiên quyết tốt, toán tử tiền điều kiện sẽ được điều hòa tốt. Đối với điều kiện tiên quyết trái, điều này có nghĩa là phần dư tiền điều kiện có thể được làm nhỏ, nhưng phần dư thực sự có thể không. Đối với điều kiện tiên quyết đúng, dễ dàng thực hiện nhỏ, nhưng lỗi thực sự có thể không. Điều này giải thích tại sao điều kiện tiên quyết bên trái là tốt hơn để tạo ra lỗi nhỏ trong khi điều kiện tiên quyết bên phải là tốt hơn để làm cho phần dư nhỏ (và để gỡ lỗi các điều kiện tiên quyết không ổn định). $|P(x_n - x)|$ $|x_n-x|$
Xem câu trả lời này để biết thêm thảo luận về các tiêu chuẩn được tối thiểu hóa bởi GMRES và CG.
Các ước tính của các giá trị số ít cực có thể được theo dõi bằng -ksp_monitor_singular_valuebất kỳ chương trình PETSc nào. Xem KSPComputeExtremeSingularValues () để tính các giá trị số ít từ mã.
Khi sử dụng GMRES để ước tính các giá trị số ít, điều quan trọng là không khởi động lại (ví dụ như -ksp_gmres_restart 1000trong PETSc).

— Jed Brown
nguồn

'' cũng hoạt động với A được thay thế bởi toán tử tiền điều kiện '' - Tuy nhiên, sau đó nó chỉ áp dụng cho phần dư

còn lại trước khi sử dụng

, resp. đến lỗi tiền điều kiện

nếu

được sử dụng.

P^{- 1} r

$P^{-1}r$

P^{- 1} A

$P^{-1}A$

P^{- 1} δ x

$P^{-1}\delta x$

A P^{- 1}

$AP^{-1}$

— Arnold Neumaier

Điểm tốt, tôi chỉnh sửa câu trả lời của tôi. Lưu ý rằng trường hợp tiền điều kiện bên phải cung cấp cho bạn quyền kiểm soát

, giải phóng bộ điều kiện tiên quyết (áp dụng

) thường khuếch đại các chế độ năng lượng thấp trong lỗi.

P δ x

$P\delta x$

P^{- 1}

$P^{-1}$

— Jed Brown

Một cách khác để xem xét vấn đề này là xem xét các công cụ từ các vấn đề nghịch đảo rời rạc, đó là các vấn đề liên quan đến việc giải hoặc nơi là rất ốm lạnh (tức là tỷ lệ giữa giá trị đặc biệt đầu tiên và cuối cùng là lớn). $Ax=b$ $\min ||Ax-b||_2$ $A$ $\sigma_1/\sigma_n$

Ở đây, chúng tôi có một số phương pháp để chọn tiêu chí dừng và đối với phương pháp lặp, tôi sẽ đề xuất tiêu chí đường cong L vì nó chỉ liên quan đến số lượng đã có sẵn (DISCLAIMER: Cố vấn của tôi đã tiên phong cho phương pháp này, vì vậy tôi chắc chắn thiên về phương pháp này nó). Tôi đã sử dụng điều này với thành công trong một phương pháp lặp.

Ý tưởng là theo dõi định mức dư và định mức giải pháp , trong đó là lần lặp thứ . Khi bạn lặp lại, điều này bắt đầu vẽ hình dạng của L trong một biểu đồ loglog (rho, eta), và điểm ở góc của L là lựa chọn tối ưu. $\rho_k=||Ax_k-b||_2$ $\eta_k=||x_k||_2$ $x_k$ $k$

Điều này cho phép bạn thực hiện một tiêu chí mà bạn để mắt đến khi bạn đã vượt qua góc (tức là nhìn vào độ dốc của ), sau đó chọn lặp đi lặp lại ở góc. $(\rho_k,\eta_k)$

Con đường tôi đã làm nó liên quan đến lưu trữ 20 lặp cuối cùng, và nếu gradient là lớn hơn so với một số ngưỡng 20 lần lặp liên tiếp, tôi biết rằng tôi là trên một phần thẳng đứng của đường cong và rằng tôi đã vượt qua góc. Sau đó, tôi lấy lần lặp đầu tiên trong mảng của mình (tức là lần lặp 20 lần trước) làm giải pháp của tôi. $abs(\frac{\log(\eta_k)-\log(\eta_{k-1})}{\log(\rho_k)-\log(\rho_{k-1})})$

Ngoài ra còn có các phương pháp chi tiết hơn để tìm góc, và chúng hoạt động tốt hơn nhưng yêu cầu lưu trữ một số lượng đáng kể các lần lặp. Chơi xung quanh với nó một chút. Nếu bạn đang ở trong MATLAB, bạn có thể sử dụng Công cụ chính quy hóa hộp công cụ, thực hiện một số điều này (cụ thể là chức năng "góc" được áp dụng).

Lưu ý rằng phương pháp này đặc biệt phù hợp với các vấn đề quy mô lớn, vì thời gian tính toán thêm có liên quan là rất nhỏ.

— OscarB
nguồn

Cảm ơn rất nhiều! Vì vậy, trong cốt truyện loglog (rho, eta), chúng ta bắt đầu từ bên phải của đường cong L và kết thúc ở đầu L, phải không? Tôi chỉ không biết nguyên tắc đằng sau tiêu chí này. Bạn có thể giải thích tại sao nó luôn luôn hoạt động như một đường cong L và tại sao chúng ta chọn góc không?

— Hui Zhang

| | A x - b | |_{2} = | | e | |_{2}

$||Ax-b||_2=||e||_2$

e

$e$

b_{e x a c t} = b + e

$b_{exact}=b+e$ . Để biết thêm phân tích, xem Hansen, PC, & O'Leary, DP (1993). Việc sử dụng đường cong L trong việc chính quy hóa các vấn đề đặt ra rời rạc. Tạp chí SIAM về tính toán khoa học, 14. Lưu ý rằng tôi chỉ thực hiện một bản cập nhật nhỏ cho bài đăng.

— OscarB

@HuiZhang: không phải lúc nào cũng là chữ L. Nếu chính quy hóa không rõ ràng, nó có thể là chữ L kép, dẫn đến hai ứng cử viên cho giải pháp, một người có khả năng giải quyết tốt hơn, người còn lại với một số chi tiết nhất định được giải quyết tốt hơn. (Và tất nhiên, hình dạng ecomplex mor có thể xuất hiện.)

— Arnold Neumaier

Liệu đường cong L có áp dụng cho các vấn đề không có điều kiện trong đó cần có một giải pháp duy nhất không? Đó là, tôi quan tâm đến các vấn đề Ax = b trong đó b được biết là "chính xác" và A gần như là số ít nhưng vẫn không thể đảo ngược về mặt kỹ thuật. Dường như với tôi rằng nếu bạn sử dụng một cái gì đó như GMRES, định mức của dự đoán x hiện tại của bạn sẽ không thay đổi quá nhiều theo thời gian, đặc biệt là sau lần lặp đầu tiên tuy nhiên nhiều lần lặp lại. Dường như với tôi rằng phần dọc của đường cong L xảy ra do không có giải pháp duy nhất / hợp lệ trong một vấn đề không chính đáng; tính năng dọc này sẽ có mặt trong tất cả các vấn đề điều hòa?

— nukeguy

Tại một thời điểm, bạn sẽ đạt được một đường thẳng đứng như vậy, thường là do các lỗi số trong phương pháp giải pháp của bạn dẫn đến | | Ax-b | | không giảm. Tuy nhiên, bạn đã đúng rằng trong các vấn đề không có tiếng ồn như vậy, đường cong không phải lúc nào cũng trông giống chữ L, nghĩa là bạn thường có một vài góc để chọn và chọn một góc khác có thể khó khăn. Tôi tin rằng bài báo mà tôi tham chiếu trong bình luận của tôi ở trên thảo luận ngắn gọn về các tình huống không có tiếng ồn.

— OscarB

Các tiêu chí dừng cho các bộ giải tuyến tính lặp được áp dụng cho các hệ thống gần như số ít

Một cách tốt hơn để xác định sự hội tụ

Ước tính giá trị đơn lẻ nhỏ nhất ϵϵ\epsilon

Ghi chú

Ước tính giá trị đơn lẻ nhỏ nhất $\epsilon$