Tại sao phản xạ Householder không thể chéo hóa một ma trận?


16

Khi tính toán hệ số QR trong thực tế, người ta sử dụng các phản xạ của Householder để loại bỏ phần dưới của ma trận. Tôi biết rằng để tính toán giá trị bản địa của ma trận đối xứng, điều tốt nhất bạn có thể làm với phản xạ của Householder là đưa nó về dạng tam giác. Có một cách rõ ràng để xem tại sao nó không thể được chéo hoàn toàn theo cách này? Tôi đang cố gắng giải thích điều này một cách đơn giản nhưng tôi không thể đưa ra một bài thuyết trình rõ ràng.

Câu trả lời:


12

Khi tính toán các giá trị riêng của ma trận đối xứng MRn×n điều tốt nhất bạn có thể làm với bộ phản xạ Householder là đưa M đến dạng ba cực. Như đã đề cập trong một câu trả lời trước vì M là đối xứng có một chuyển đổi tương tự trực giao mà kết quả trong một ma trận đường chéo, tức là D=STMS . Sẽ thuận tiện nếu chúng ta có thể tìm thấy hành động của ma trận trực giao chưa biết S sử dụng nghiêm ngặt các phản xạ Householder bằng cách tính một chuỗi các phản xạ và áp dụng HT từ trái sang MHtừ quyền . Tuy nhiên, điều này là không thể vì cách phản xạ của Householder được thiết kế để tạo ra các cột. Nếu chúng ta tính toán phản xạ Householder bằng không tất cả các số bên dưới M 11, chúng ta sẽ thấy M = (MM11 Nhưng bây giờ các mục M 12 - M 1 n đã bị thay đổi bởi gương phản xạ H T 1 được áp dụng ở bên trái. Do đó, khi chúng ta áp dụng H 1 ở bên phải, nó sẽ không còn xuất hiện hàng đầu tiên củaMchỉ còn lại M 11 . Thay vào đó, chúng tôi sẽ thu được H T 1 M= (

M=()H1TM=(0000).
M12M1nH1TH1MM11 Trường hợp không chỉ chúng tôi không ra khỏi hàng mà chúng tôi có thể phá hủy cấu trúc 0 mà chúng tôi vừa giới thiệu với gương phản xạ H T 1 .
H1TM=(0000)H1TMH1=().
H1T

Tuy nhiên, khi bạn chọn lái đến cấu trúc ba góc, bạn sẽ để hàng đầu tiên không bị ảnh hưởng bởi hành động của H T 1 , vì vậy M = (MH1T Do đó, khi chúng ta áp dụng cùng một phản xạ từ bên phải, chúng ta thu được H T 1 M= (

M=()H1TM=(000).
H1TM=(000)H1TMH1=(000000).

MTMSTS


11

Như các Nhận xét cho các Câu trả lời khác làm rõ, vấn đề thực sự ở đây không phải là sự thiếu sót của các ma trận Householder mà là một câu hỏi về lý do tại sao các phương pháp lặp chứ không phải trực tiếp ("dạng đóng") được sử dụng để ma trận đối xứng (thực) tương đồng).

Thật vậy, bất kỳ ma trận trực giao nào cũng có thể được biểu diễn như một sản phẩm của ma trận Householder , vì vậy nếu chúng ta biết dạng đường chéo của ma trận đối xứng (giá trị riêng của nó), chúng ta có thể giải quyết một tập hợp hoàn chỉnh của ma trận cơ sở chính quy và biểu diễn sự thay đổi tương ứng của ma trận cơ sở như một sản phẩm biến đổi Householder trong thời gian đa thức.

Vì vậy, hãy chuyển sang nhận xét mang tính phụ huynh của Victor "ngoài định lý của Abel" bởi vì chúng tôi đang hỏi một cách hiệu quả tại sao nên sử dụng phương pháp lặp để tìm gốc của đa thức chứ không phải là phương pháp trực tiếp . Tất nhiên các giá trị riêng của một ma trận đối xứng thực sự là gốc rễ của đa thức đặc trưng của nó, và nó cũng có thể đi theo hướng khác. Với một đa thức thực chỉ có gốc thực, có thể xây dựng một ma trận đồng hành đối xứng ba cực từ một chuỗi Sturm cho đa thức . Cũng xem poster đó Bài tập 92 của Denis Serre trong bộ này. Điều này khá hay khi thể hiện sự tương đương của những vấn đề đó vì chúng ta đã thấy (@AndrewWinters), ứng dụng trực tiếp của ma trận Householder sẽ tạo ra một ma trận đối xứng thực.

O(nlog3n)O(n2)

Các Abel-Ruffini Galois-Định lý nói rằng không có công thức chung cho gốc rễ của đa thức trên bằng bốn có thể được đưa ra trong các điều khoản của các gốc tự (và số học bình thường). Tuy nhiên, có các hình thức đóng cho rễ về các hoạt động kỳ lạ hơn . Về nguyên tắc, người ta có thể dựa trên các phương pháp eigenvalue / chéo trên các phương pháp như vậy , nhưng người ta gặp một số khó khăn thực tế:

  1. t5+ta=0t(a)

  2. Điều này phá vỡ với đa thức bậc sáu trở lên, mặc dù nhiều cách khác nhau có thể được tìm thấy để giải quyết chúng bằng cách sử dụng các hàm chỉ có hai biến. Vấn đề thứ 13 của Hilbert là phỏng đoán rằng đa thức bậc bảy không thể giải được bằng cách chỉ sử dụng các hàm của tối đa hai biến, nhưng vào năm 1957 VI Arnold đã cho thấy họ có thể. Trong số các họ hàm đa biến có thể được sử dụng để có được các giải pháp cho đa thức bậc tùy ý là tích phân Mellin, hàm siêu bội và hàm Siegel theta.

  3. nCf:Y2=f(x)f(x)O(n3)

Do đó, các phương pháp gián tiếp / lặp để cô lập các gốc thực (tương đương giá trị riêng của ma trận đối xứng), thậm chí với độ chính xác cao, hiện có những lợi thế thực tế so với các phương pháp trực tiếp / chính xác đã biết cho các vấn đề này.


Một số lưu ý: 1. một phương pháp thực tế để xây dựng ma trận đồng hành ba cực từ các chuỗi Sturm đã được FiedlerSchmeisser phác thảo trong các bài báo ; Tôi đã đưa ra một triển khai Mathicala ở đây và không quá khó để thực hiện bằng ngôn ngữ truyền thống hơn.
JM

2. Liên quan đến cách tiếp cận "hàm theta" đối với các gốc đa thức (mà tôi đồng ý là hơi khó sử dụng thực tế), Umemura phác thảo một cách tiếp cận sử dụng các hàm theta Riemann .
JM

2

Vì lý do gì bạn cho rằng điều này là không thể?

Bất kỳ ma trận thực đối xứng S có thể được chéo trực giao, tức là S= =GDGt, Ở đâu G là trực giao và D là đường chéo.

Bất kỳ ma trận trực giao có kích thước n × n đều có thể được xây dựng như một sản phẩm của tối đa n phản xạ như vậy. Wikipedia . Do đó bạn có sự phân hủy này.

Tôi không chắc chắn về tuyên bố cuối cùng, tôi chỉ trích dẫn nó (và tôi nghĩ rằng nó là chính xác). Theo như tôi hiểu câu hỏi của bạn, vấn đề là liệu có bất kỳ ma trận trực giao nào có thể được phân tách thành một chuỗi các phép biến đổi Householder hay không.


2
Tôi cần phải có được cụ thể hơn. Bước đầu tiên để chéo hóa một ma trận đối xứng là áp dụng Householder cho đến khi nó là đường chéo. Tiếp theo, lặp lại QR được thực hiện. Quá trình này không thể được hoàn thành bằng cách sử dụng các biến đổi Householder dạng đóng. Tại sao? (khác với định lý của Abel)
Victor Liu

1
Bạn có thể làm điều đó với phép quay Jacobi. Golub và Van Loan viết rằng Jacobi giống như Givens. Householder chỉ là một cách khác để làm Givens. Trong thực tế, cách "chính xác" có thể là với QR nếu nhanh hơn.
sức mạnh

1

Nếu các giá trị riêng đã được biết (từ tính toán sơ bộ dựa trên cách tiếp cận thông thường), người ta có thể sử dụng chúng để tam giác hóa một ma trận không đối xứng (hoặc chéo một ma trận đối xứng) bằng một sản phẩm trên n-1Phản ánh của chủ nhà. bên trongkbước thứ kcột thứ được đưa đến dạng tam giác. (Điều này cũng cung cấp một bằng chứng quy nạp đơn giản về sự tồn tại của yếu tố Schur.)

Nó thực sự hữu ích cho các phương thức mà người ta liên tục cần ma trận trực giao ở dạng nhân tử ổn định về số.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.