Tại sao các nhà thống kê định nghĩa ma trận ngẫu nhiên?


18

Tôi đã học toán một thập kỷ trước, vì vậy tôi có một nền tảng toán học và thống kê, nhưng câu hỏi này đang giết chết tôi.

Câu hỏi này vẫn còn một chút triết lý đối với tôi. Tại sao các nhà thống kê phát triển tất cả các loại kỹ thuật để làm việc với ma trận ngẫu nhiên? Ý tôi là, không phải một vector ngẫu nhiên giải quyết vấn đề? Nếu không, ý nghĩa của các cột khác nhau của một ma trận ngẫu nhiên là gì? Anderson (2003, Wiley) coi một vectơ ngẫu nhiên là trường hợp đặc biệt của ma trận ngẫu nhiên chỉ có một cột.

Tôi không thấy điểm có ma trận ngẫu nhiên (và tôi chắc chắn đó là vì tôi không biết gì). Nhưng, chịu đựng với tôi. Hãy tưởng tượng tôi có một mô hình với 20 biến ngẫu nhiên. Nếu tôi muốn tính hàm xác suất chung, tại sao tôi phải hình dung chúng dưới dạng ma trận thay vì vectơ?

Tôi đang thiếu gì?

ps: Tôi xin lỗi vì câu hỏi được gắn thẻ kém, nhưng không có thẻ nào cho ma trận ngẫu nhiên và tôi chưa thể tạo một câu hỏi nào!

chỉnh sửa: thay đổi ma trận thành ma trận trong tiêu đề


1
Tôi nghĩ rằng về mặt khái niệm bạn vẫn ổn khi nghĩ về nó như một vectơ ngẫu nhiên đã được sắp xếp lại để nó trở thành ma trận.
Matthew Gunn


9
Bạn cũng có thể hỏi tại sao ma trận được quan tâm. Hoàn toàn tự nhiên khi xem ngẫu nhiên bất kỳ ma trận nào được sử dụng để thể hiện một hiện tượng được quan sát hoặc đo lường trong thế giới thực. Điều này dẫn đến rất nhiều loại và mô hình có thể có cho ma trận ngẫu nhiên, từ ma trận kề của đồ thị ngẫu nhiên đến ma trận hiệp phương sai mẫu và hơn thế nữa.
whuber

2
@Aksakal Tôi nghĩ rằng quan điểm của OP là khi nào hữu ích để phân tích một cái gì đó như ma trận ngẫu nhiên. ví dụ: trong phân loại hình ảnh, bạn thường biến ma trận hình ảnh của mình thành vectơ..không có ma trận 'phân tích'. vì vậy, nhận xét của người đánh giá là câu trả lời tốt nhất cho đến nay: ví dụ: ma trận hiệp phương sai phải là bán xác định dương - nếu bạn muốn mô phỏng ma trận hiệp phương sai ngẫu nhiên, dễ dàng làm việc với một đặc tả ma trận hơn một vectơ.
seanv507

2
Ma trận ngẫu nhiên chỉ là một trường hợp đặc biệt của tenxơ ngẫu nhiên.
Anony-Mousse -Reinstate Monica

Câu trả lời:


23

Nó phụ thuộc vào lĩnh vực nào bạn tham gia, nhưng, một trong những cú hích lớn ban đầu cho nghiên cứu ma trận ngẫu nhiên ra khỏi vật lý nguyên tử và được Wigner tiên phong. Bạn có thể tìm thấy một cái nhìn tổng quan ngắn gọn ở đây . Cụ thể, chính các giá trị riêng (là các mức năng lượng trong vật lý nguyên tử) của các ma trận ngẫu nhiên đã tạo ra hàng tấn sự quan tâm bởi vì các mối tương quan giữa các giá trị riêng đã đưa ra cái nhìn sâu sắc về phổ phát xạ của các quá trình phân rã hạt nhân.

Gần đây, đã có sự hồi sinh lớn trong lĩnh vực này, với sự ra đời của phân phối Tracy-Widom cho các giá trị bản địa lớn nhất của ma trận ngẫu nhiên, cùng với các kết nối tuyệt đẹp với các lĩnh vực dường như không liên quan, như lý thuyết ốp lát , vật lý thống kê, có thể tích hợp hệ thống , hiện tượng KPZ , tổ hợp ngẫu nhiên và thậm chí là Giả thuyết Riemann . Bạn có thể tìm thấy một số ví dụ ở đây .

Đối với các ví dụ thực tế hơn, một câu hỏi tự nhiên để hỏi về ma trận các vectơ hàng là các thành phần PCA của nó có thể trông như thế nào. Bạn có thể có được ước tính heuristic cho điều này bằng cách giả sử dữ liệu đến từ một số phân phối, và sau đó xem xét các giá trị ma trận hiệp phương sai, sẽ được dự đoán từ phổ ma trận ngẫu nhiên : bất kể (trong lý do) phân phối vectơ của bạn, phân phối giới hạn của giá trị bản địa sẽ luôn tiếp cận một tập hợp các lớp đã biết. Bạn có thể nghĩ về điều này như một loại CLT cho ma trận ngẫu nhiên. Xem bài viết này cho ví dụ.


Cảm ơn câu trả lời của bạn. Tôi nghi ngờ nó có thể được liên kết với một số kỹ thuật toán học. Bây giờ tất cả đều có ý nghĩa, vật lý luôn xoay quanh toán học và ngược lại cũng vậy.
Eduardo

Giấy của Wigner là vào giữa những năm 1950, giấy của Wishart là vào cuối những năm 1920. Vì vậy, thật khó để khẳng định rằng Wigner đã tạo ra cú hích lớn đầu tiên, theo ý kiến ​​của tôi.
Aksakal

13

Bạn có vẻ thoải mái với các ứng dụng của vectơ ngẫu nhiên. Chẳng hạn, tôi đối phó với loại vectơ ngẫu nhiên này mỗi ngày: lãi suất của các kỳ hạn khác nhau. Ngân hàng Dự trữ Liên bang có loạt H15 , xem xét tín phiếu Kho bạc 4 tuần, 3 tháng, 6 tháng và 1 năm. Bạn có thể nghĩ về 4 tỷ lệ này như một vector với 4 yếu tố. Nó cũng rất ngẫu nhiên, hãy nhìn vào các giá trị lịch sử trên cốt truyện bên dưới.

nhập mô tả hình ảnh ở đây

Như với bất kỳ số ngẫu nhiên nào, chúng ta có thể tự hỏi: hiệp phương sai giữa chúng là gì? Bây giờ bạn có được ma trận hiệp phương sai 4 x 4. Nếu bạn ước tính nó trên dữ liệu một tháng hàng ngày, bạn sẽ nhận được 12 ma trận hiệp phương sai khác nhau mỗi năm, nếu bạn muốn chúng không chồng chéo. Ma trận hiệp phương sai mẫu của chuỗi ngẫu nhiên tự nó là một đối tượng ngẫu nhiên, xem bài viết của Wishart "PHÂN PHỐI SẢN PHẨM TỔNG HỢP SẢN PHẨM TRONG MẪU TỪ MỘT DÂN SỐ ĐA NĂNG BÌNH THƯỜNG." đây . Có một bản phân phối được gọi sau anh ta.

Đây là một cách để có được ma trận ngẫu nhiên. Không có gì lạ khi lý thuyết ma trận ngẫu nhiên (RMT) được sử dụng trong tài chính, như bạn có thể thấy bây giờ.


1
Bạn đề cập đến việc ước tính nó trên "dữ liệu một tháng", ý bạn là "dữ liệu hàng ngày có giá trị một tháng"?
Giăng

1
@ John, trong ví dụ cụ thể này, vâng, hàng ngày. Tuy nhiên, một số loạt được đo trong ngày, chẳng hạn như giá cổ phiếu. Nếu bạn có một danh mục cổ phiếu, bạn có thể nhận được ma trận hiệp phương sai trong ngày với tần suất rất cao.
Aksakal

3
+1. Diễn giải ở đây, nhưng tôi nghĩ một cách để thúc đẩy ma trận ngẫu nhiên là trong những trường hợp này, chúng ta thường quan tâm đến mối quan hệ giữa (không chỉ bên trong) các vectơ ngẫu nhiên. Điều này tự nhiên thúc đẩy suy nghĩ về ma trận thay vì vectơ.
Vách đá AB

@Aksakal Dữ liệu bạn đề cập đến với tần suất hàng tháng cũng như hàng ngày. Tôi thấy khó hiểu trước khi bạn sửa đổi bài đăng vì sẽ không có ý nghĩa khi ước tính ma trận hiệp phương sai sử dụng một tháng dữ liệu hàng tháng.
John

@ John, bạn có thể ước tính ma trận hiệp phương sai trên dữ liệu hàng tháng hoặc hàng tuần, chồng chéo hoặc không chồng lấp, v.v. Không có cách nào đúng để làm điều này.
Aksakal

8

Trong vật lý lý thuyết, ma trận ngẫu nhiên đóng một vai trò quan trọng để hiểu các đặc tính phổ quát của phổ năng lượng của các hệ có đối xứng cụ thể.

Nền tảng của tôi về vật lý lý thuyết có thể khiến tôi đưa ra một quan điểm hơi thiên vị ở đây, nhưng tôi thậm chí sẽ đi xa hơn để đề xuất rằng sự phổ biến của lý thuyết ma trận ngẫu nhiên (RMT) bắt nguồn từ ứng dụng thành công của nó trong vật lý.

Không cần đi sâu vào chi tiết, ví dụ, phổ năng lượng trong cơ học lượng tử có thể thu được bằng cách tính giá trị riêng của các hệ thống Hamilton - có thể được biểu thị như một ma trận ẩn sĩ. Thông thường các nhà vật lý không quan tâm đến các hệ thống cụ thể nhưng muốn biết các tính chất chung của các hệ lượng tử có tính chất hỗn loạn là gì, dẫn đến các giá trị của ma trận Hamilton ẩn để lấp đầy không gian ma trận theo sự biến đổi của năng lượng hoặc các tham số khác ( ví dụ điều kiện biên). Điều này thúc đẩy việc coi một lớp các hệ thống vật lý là ma trận ngẫu nhiên và xem xét các thuộc tính trung bình của các hệ thống này. Tôi đề nghị tài liệu về phỏng đoán Bohigas-Gianonni-Schmidt nếu bạn muốn đi sâu vào vấn đề này.

Nói tóm lại, người ta có thể chỉ ra rằng các mức năng lượng của các hệ thống có đối xứng đảo ngược thời gian hoạt động khác với các mức năng lượng của các hệ thống không có đối xứng đảo ngược thời gian (ví dụ xảy ra nếu bạn thêm từ trường). Một phép tính thực tế khá ngắn sử dụng ma trận ngẫu nhiên Gaussian có thể chỉ ra rằng các mức năng lượng có xu hướng gần nhau khác nhau trong cả hai hệ thống.

Những kết quả này có thể được mở rộng và giúp hiểu thêm các đối xứng khác, có tác động lớn đến các lĩnh vực khác nhau, như vật lý hạt hoặc lý thuyết về vận chuyển siêu âm và sau này ngay cả trong thị trường tài chính.


1
đây là lý do tại sao tôi bỏ vật lý :) quá nhiều "tổn thương não"
Aksakal

Các nhà thống kê như Wishart nơi trước các nhà vật lý nguyên tử.
kjetil b halvorsen

5

Bản đồ tuyến tính là bản đồ giữa các không gian vectơ. Giả sử bạn có một bản đồ tuyến tính và đã chọn các cơ sở cho các không gian miền và phạm vi của nó. Sau đó, bạn có thể viết một ma trận mã hóa bản đồ tuyến tính. Nếu bạn muốn xem xét các bản đồ tuyến tính ngẫu nhiên giữa hai không gian đó, bạn nên đưa ra một lý thuyết về ma trận ngẫu nhiên. Chiếu ngẫu nhiên là một ví dụ đơn giản của một điều như vậy.

Ngoài ra, có các đối tượng có giá trị ma trận / tenor trong vật lý. Máy căng thẳng nhớt nhớt là một trong số đó (trong số một sở thú thực sự). Trong một vật liệu nhớt gần như đồng nhất, có thể hữu ích để mô hình hóa các chủng (đàn hồi, nhớt, và cộng sự) và do đó ứng suất theo chiều như một tenxơ ngẫu nhiên có phương sai nhỏ. Mặc dù có ý nghĩa "bản đồ tuyến tính" đối với ứng suất / biến dạng này, nhưng thành thật hơn khi mô tả ứng dụng ma trận ngẫu nhiên này là ngẫu nhiên một cái gì đó đã là ma trận.


4

Cảm biến nén như một ứng dụng trong xử lý ảnh phụ thuộc vào ma trận ngẫu nhiên như các phép đo kết hợp của tín hiệu 2D. Tính chất cụ thể của các ma trận này, cụ thể là sự gắn kết , được xác định cho các ma trận này và đóng một vai trò trong lý thuyết.

Rất đơn giản, hóa ra việc giảm thiểu định mức L1 của một sản phẩm nhất định của ma trận Gaussian và tín hiệu đầu vào thưa thớt cho phép bạn khôi phục nhiều thông tin hơn bạn mong đợi.

Nghiên cứu ban đầu đáng chú ý nhất trong lĩnh vực này mà tôi biết là công trình của Đại học Rice: http://dsp.rice.edu/research/compressive-sensing/random-matrices

Lý thuyết về các sản phẩm ma trận là "các phép đo tín hiệu" ít nhất là từ WW2. Như một cựu giáo sư của tôi đã kể lại cho tôi, thử nghiệm cá nhân mọi người nhập ngũ cho quân đội, nói, bệnh giang mai, là chi phí cấm. Trộn các mẫu này với nhau một cách có hệ thống (bằng cách trộn các phần của từng mẫu máu với nhau và kiểm tra chúng) sẽ làm giảm số lần xét nghiệm cần thực hiện. Điều này có thể được mô hình hóa như một vectơ nhị phân ngẫu nhiên nhân với một ma trận thưa thớt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.