Sự phức tạp tồi tệ nhất của Conjugate Gradient là gì?


9

Đặt , xác định đối xứng và dương. Giả sử phải mất đơn vị của công việc để nhân một vector bởi . Người ta biết rằng thực hiện thuật toán CG trên với số điều kiện yêu cầu , đơn vị công việc. m Một Một κ O ( m ARn×nmAAκO(mκ)

Bây giờ, tất nhiên, là một câu lệnh đây là một giới hạn trên. Và thuật toán CG luôn có thể kết thúc ở các bước 0 với dự đoán ban đầu may mắn.O

Chúng ta có biết nếu tồn tại RHS và dự đoán ban đầu (không may mắn) sẽ yêu cầu các bước không? Nói cách khác, sự phức tạp trong công việc trong trường hợp xấu nhất của CG có thực sự không?Θ(mΘ(κ)Θ(mκ)

Câu hỏi này xuất hiện khi tôi cố gắng xác định xem lợi ích của điều kiện tiên quyết (thấp hơn ) có cao hơn chi phí của nó ( cao hơn ) hay không. Ngay bây giờ, tôi đang làm việc với các vấn đề về đồ chơi và muốn có một ý tưởng tốt hơn trước khi tôi thực hiện bất cứ điều gì trong một ngôn ngữ được biên dịch.mκm


5
Có lẽ bạn có thể xây dựng một dự đoán ban đầu bi quan bằng cách chạy thuật toán CG "ngược" và đưa năng lượng phù hợp vào từng hướng tìm kiếm -orthogonal mà thuật toán yêu cầu tất cả các bước. A
origimbo 17/03/2016

Câu trả lời:


9

Câu trả lời là có Tốc độ hội tụ giới hạn của là sắc nét hơn các thiết lập của ma trận xác định dương đối xứng với số trạngκ. Nói cách khác, không biết gì thêm vềMộthơn số điều kiện của nó, CG thực sự có thể mất~(κ1)/(κ+1)κA lặp để hội tụ. Nói một cách lỏng lẻo, phía trên-bound đạt được nếu các giá trị riêng củaAđược phân bố đều (tức là "tiêu năng") trong vòng một khoảng thời gian của số điều kiệnκ.κAκ

Đây là một tuyên bố nghiêm ngặt hơn. Các phiên bản xác định có liên quan nhiều hơn nhưng làm việc sử dụng các nguyên tắc tương tự.

Định lý (Lựa chọn trường hợp xấu nhất của ). Chọn bất kỳ ma trận trực giao ngẫu nhiên U , chúng ta hãy λ 1 , ... , λ nn số thực thống nhất lấy mẫu từ khoảng thật [ 1 , κ ] , và để cho b = [ b 1 ; Sầu ; b n ]n số thực được lấy mẫu iid từ Gaussian tiêu chuẩn. Xác định A = U d i một g ( λ 1 ,AUλ1,,λnn[1,κ]b=[b1;;bn]nSau đó, trong giới hạn n , gradient liên hợp sẽ hội tụ với một xác suất để một ε giải pháp chính xác của A x = b trong không ít hơn Ω (

A=Udiag(λ1,,λn)UT.
nϵAx=blặp đi lặp lại.Ω(κlogϵ1)

Bằng chứng. Bằng chứng tiêu chuẩn dựa trên các xấp xỉ đa thức tối ưu của Ch Quashev, sử dụng các kỹ thuật được tìm thấy ở một số nơi, chẳng hạn như sách của Greenbaum hoặc sách của Saad .


1
Các ràng buộc là không sắc nét, như câu trả lời giải thích sau, Nếu các giá trị riêng không được phân phối đồng đều, cg hội tụ nhanh hơn, vì nó không phải là một phép lặp ổn định. Vì vậy, chúng ta cần biết thêm về ma trận.
Guido Kanschat 20/03/2016

@GuidoKanschat: điểm tốt, và tôi đã khắc phục các tuyên bố làm rõ rằng độ sắc nét được đạt khắp với điều kiện κ . Aκ
Richard Zhang

Các giấy tờ chứng minh nắm để giảm thiểu trong không gian của mỗi phiên k đa thức thỏa mãn . Tương đương, đây là. Trong giới hạn đã nêu, và giải pháp cho vấn đề minimax sau đó là đa thức Ch Quashev, có lỗi hội tụ làp(A)kphút p max bước sóng bước sóng ( A ) | p ( λ ) | Λ ( Một ) [ 1 , κ ] ~ p(0)=1minpmaxλΛ(A)|p(λ)|Λ(A)[1,κ]κ
Richard Zhang

0

Lấy điều này làm câu hỏi ban đầu của tôi: Chúng ta có biết nếu tồn tại RHS và dự đoán ban đầu (không may mắn) sẽ yêu cầu các bước không?Θ(κ)

Câu trả lời cho câu hỏi là "không". Ý tưởng của câu trả lời này xuất phát từ nhận xét từ Guido Kanschat.

Yêu cầu: Đối với bất kỳ số điều kiện đã cho , tồn tại ma trận , với số điều kiện đó thuật toán CG sẽ chấm dứt tối đa hai bước (đối với bất kỳ RHS đã cho và dự đoán ban đầu).AkA

Hãy xem xét trong đó . Khi đó số điều kiện của là . Đặt là RHS và biểu thị giá trị riêng của là trong đó Một = d i một g ( 1 , κ , κ , ... , κ ) Một κ b R n Một λ i λ i = { 1 i = 1ARn×nA=diag(1,κ,κ,,κ)AκbRnAλi

λi={1i=1κi1.

Trước tiên chúng tôi xem xét trường hợp , dự đoán ban đầu, bằng không. Suy ra là ước tính thứ hai của từ thuật toán CG. Chúng tôi cho thấy bằng cách hiển thị . Thật vậy, chúng ta cóx ( 2 )R n Một - 1 b x ( 2 ) = A - 1 b x ( 2 ) - Một - 1 b , Một ( x ( 2 ) - Một - 1 b ) = 0x(0)Rnx(2)RnA1bx(2)=A1bx(2)A1b,A(x(2)A1b)=0

x(2)A1b,A(x(2)A1b)=x(2)A1bA2=minppoly1(p(A)A1)bA2=minppoly1i=1n(p(λi)λi1)2λibi2i=1n(p^(λi)λi1)2λibi2=0

Trong đó chúng tôi sử dụng đa thức bậc nhất được định nghĩa là . Vì vậy, chúng tôi đã chứng minh trường hợp cho .p^p^(x)=(1+κx)/κx(0)=0

Nếu , thì trong đó là ước tính thứ hai của thuật toán CG với thay thế bằng . Vì vậy, chúng tôi đã giảm trường hợp này đến trường hợp trước. x(0)0x(2)=x(2)¯+x(0)x(2)¯bb¯=bAx(0)


Bao nhiêu trong số này là mạnh mẽ để số học chính xác hữu hạn?
origimbo

@origimbo Nếu câu hỏi của bạn được gửi cho tôi, câu trả lời là "Tôi không biết."
fred
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.