Làm thế nào để giải thích PCA về dữ liệu chuỗi thời gian?


19

Tôi đang cố gắng tìm hiểu việc sử dụng PCA trong một bài báo gần đây có tiêu đề "Lập bản đồ hoạt động của não theo tỷ lệ với điện toán cụm" Freeman et al., 2014 (pdf miễn phí có sẵn trên trang web của phòng thí nghiệm ). Họ sử dụng PCA trên dữ liệu chuỗi thời gian và sử dụng trọng số PCA để tạo bản đồ của bộ não.

Dữ liệu là dữ liệu hình ảnh trung bình thử nghiệm, được lưu trữ dưới dạng ma trận (được gọi là trong bài báo) với voxels (hoặc vị trí hình ảnh trong não) điểm thời gian (độ dài của một lần duy nhất kích thích lên não). n× tY^n×t^

Họ sử dụng SVD dẫn đến ( biểu thị chuyển vị của ma trận ).VV

Y^= =BạnSV
VV

Các tác giả nói rằng

Các thành phần chính (các cột của ) là các vectơ có độ dài và điểm số (các cột của ) là các vectơ có độ dài (số lượng voxels), mô tả hình chiếu của mỗi voxel theo hướng được đưa ra bởi thành phần tương ứng, hình thành các hình chiếu trên âm lượng, tức là bản đồ toàn bộ não.t U nVt^Bạnn

Vì vậy, PC là các vectơ có chiều dài . Làm thế nào tôi có thể giải thích rằng "thành phần chính đầu tiên giải thích phương sai nhất" như thường được thể hiện trong hướng dẫn của PCA? Chúng tôi đã bắt đầu với một ma trận gồm nhiều chuỗi thời gian có tương quan cao - làm thế nào một chuỗi thời gian trên PC giải thích phương sai trong ma trận gốc? Tôi hiểu toàn bộ "sự quay của đám mây điểm Gaussian đối với trục đa dạng nhất", nhưng không chắc điều này liên quan đến chuỗi thời gian như thế nào. Các tác giả có ý nghĩa gì theo hướng khi họ nêu: "điểm số (các cột của ) là các vectơ có độ dàit^ nBạnn (số lượng voxels), mô tả hình chiếu của mỗi voxel theo hướng được cho bởi thành phần tương ứng "? Làm thế nào một khóa học thời gian thành phần chính có thể có hướng?

Để xem ví dụ về chuỗi thời gian kết quả từ các kết hợp tuyến tính của các thành phần nguyên tắc 1 và 2 và bản đồ não liên quan, hãy đi đến liên kết sau và di chuột qua các dấu chấm trong biểu đồ XY.

Freman và cộng sự.

Câu hỏi thứ hai của tôi liên quan đến các quỹ đạo (không gian nhà nước) mà họ tạo ra bằng cách sử dụng điểm thành phần chính.

Chúng được tạo bằng cách lấy 2 điểm số đầu tiên (trong trường hợp ví dụ "optomotor" mà tôi đã nêu ở trên) và chiếu các thử nghiệm riêng lẻ (được sử dụng để tạo ma trận trung bình thử nghiệm được mô tả ở trên) vào không gian con chính theo phương trình:

J= =BạnY.

Như bạn có thể thấy qua các bộ phim được liên kết, mỗi dấu vết trong không gian trạng thái thể hiện toàn bộ hoạt động của bộ não.

Ai đó có thể cung cấp trực giác cho từng "khung hình" của phim không gian trạng thái nghĩa là gì, so với con số liên quan đến âm mưu XY về điểm số của 2 PC đầu tiên. Điều đó có nghĩa gì ở một "khung" nhất định cho 1 thử nghiệm của thử nghiệm ở vị trí 1 trong không gian trạng thái XY và một thử nghiệm khác ở vị trí khác? Làm thế nào để các vị trí cốt truyện XY trong phim liên quan đến dấu vết thành phần nguyên tắc trong hình được liên kết được đề cập trong phần đầu tiên của câu hỏi của tôi?

Freeman và cộng sự.


1
+1 Tôi đã chỉnh sửa câu hỏi của bạn, hãy xem cách người ta có thể định dạng phương trình tex ở đây. Ngoài ra, tôi biết khá rõ, nên sẽ trả lời sau.
amip nói rằng Phục hồi lại

1
Đây không phải là chính xác những gì OP muốn, nhưng có thể trở nên tiện dụng trong việc diễn giải các thành phần chính khi được lấy từ dữ liệu chuỗi thời gian, vì tôi luôn làm điều này. Tôi thường thích diễn giải PCA như một bản mở rộng Karhunen-Loève: diễn tả một chuỗi thời gian nhất định, (chuỗi thời gian khác nhau mà bạn áp dụng PCA), như một sự kết hợp tuyến tính của chuỗi thời gian không tương thích (nghĩa là các thành phần chính). Các trọng số của từng chuỗi thời gian trong trường hợp này được đưa ra bởi các hàm riêng có được từ ma trận hiệp phương sai. Xt
Néstor

1
(Xem phần này để được giải thích sâu hơn về quan điểm của tôi: astro.puc.cl/~nespino/files/Ch2_PCA_nespinoza.pdf )
Néstor

1
Tôi đã thêm vào câu hỏi của bạn một số ảnh chụp màn hình mà bạn đang đề cập đến.
amip nói rằng Phục hồi lại

Làm thế nào bạn thêm hình ảnh?
statHacker

Câu trả lời:


16

Câu 1: Kết nối giữa chuỗi thời gian của PC và "phương sai tối đa" là gì?

Các dữ liệu mà họ đang phân tích là điểm dữ liệu cho mỗi tế bào thần kinh, do đó người ta có thể nghĩ về điều đó như điểm dữ liệu trong không gian ba chiều . Đó là "một đám mây điểm", do đó, việc thực hiện PCA sẽ giúp tìm ra phương sai tối đa, như bạn biết rõ. Tôi thích gọi các hướng này (là các hàm riêng của ma trận hiệp phương sai) là "các trục chính" và các phép chiếu của dữ liệu lên các hướng này là "các thành phần chính". n t nRnt^nt^nRn

Khi phân tích chuỗi thời gian, sự bổ sung duy nhất cho bức tranh này là các điểm được sắp xếp một cách có ý nghĩa hoặc được đánh số (từ đến ), trái ngược với việc chỉ đơn giản là một tập hợp các điểm không được sắp xếp . Điều đó có nghĩa là nếu chúng ta lấy tốc độ bắn của một nơron đơn (là một tọa độ trong R n ), thì các giá trị của nó có thể được vẽ như là một hàm của thời gian. Tương tự như vậy, nếu chúng ta lấy một máy tính (mà là một dự báo từ R n trên một số dòng), sau đó nó cũng có t giá trị và có thể được vẽ như là một hàm của thời gian. Vì vậy, nếu các tính năng ban đầu là chuỗi thời gian, thì PC cũng là chuỗi thời gian.t1t^RnRnt^

Tôi đồng ý với cách giải thích của @ Nestor ở trên: mỗi tính năng ban đầu có thể được xem như là một tổ hợp tuyến tính của PC và khi các PC không tương thích với nhau, người ta có thể coi chúng là các chức năng cơ bản mà các tính năng gốc bị phân tách thành. Nó hơi giống phân tích Fourier, nhưng thay vì sử dụng cơ sở cố định của sin và cosin, chúng tôi đang tìm cơ sở "phù hợp nhất" cho tập dữ liệu cụ thể này, theo nghĩa là PC đầu tiên chiếm phần lớn phương sai, v.v.

"Kế toán cho hầu hết các phương sai" ở đây có nghĩa là nếu bạn chỉ thực hiện một chức năng cơ bản (chuỗi thời gian) và cố gắng xấp xỉ tất cả các tính năng của mình với nó, thì PC đầu tiên sẽ thực hiện công việc tốt nhất. Vì vậy, trực giác cơ bản ở đây là PC đầu tiên là chuỗi thời gian chức năng cơ bản phù hợp với tất cả các chuỗi thời gian có sẵn là tốt nhất, v.v.


Tại sao đoạn văn này trong Freeman et al. khó hiểu quá

Freeman và cộng sự. phân tích ma trận dữ liệu Y với các biến (tức là tế bào thần kinh) trong hàng (!), không phải trong cột. Lưu ý rằng chúng trừ đi nghĩa của hàng, điều này có nghĩa là các biến thường được tập trung trước PCA. Sau đó, họ thực hiện SVD: Y = U S V . Sử dụng các thuật ngữ tôi ủng hộ trên, cột của U là trục chính (hướng dẫn trong R n ) và cột của S V được thành phần chính (chuỗi thời gian dài t ).Y^

Y^= =BạnSV.
BạnRnSVt^

Câu mà bạn trích dẫn từ Freeman et al. thực sự khá khó hiểu:

Các thành phần chính (các cột của ) là vectơ có độ dài t , và điểm số (các cột của U ) là vectơ có độ dài n (số voxels), mô tả chiếu của mỗi voxel ý kiến chỉ đạo được đưa ra bởi thành phần tương ứng , hình thành các hình chiếu trên âm lượng, tức là bản đồ toàn bộ não.Vt^Bạnn

Đầu tiên, các cột của không phải là PC, mà là PC được chia tỷ lệ theo đơn vị định mức. Thứ hai, các cột của U KHÔNG phải là điểm số, vì "điểm số" thường có nghĩa là PC. Thứ ba, "hướng được đưa ra bởi thành phần tương ứng" là một khái niệm khó hiểu. Tôi nghĩ rằng họ lật hình ảnh ở đây và đề nghị để suy nghĩ về n điểm trong t không gian ba chiều, vì vậy mà bây giờ mỗi tế bào thần kinh là một điểm dữ liệu (và không phải là một biến). Về mặt khái niệm nghe có vẻ như là một thay đổi lớn, nhưng về mặt toán học, nó gần như không có sự khác biệt, với sự thay đổi duy nhất là các trục chính và các thành phần chính [đơn vị chuẩn] thay đổi vị trí. Trong trường hợp này, máy tính của tôi từ trên cao ( t -long chuỗi thời gian) sẽ trở thành trục chính, tức làVBạnnt^t^các hướng có thể được coi là các phép chiếu chuẩn hóa trên các hướng này (điểm số chuẩn hóa?).Bạn

Tôi thấy điều này rất khó hiểu và vì vậy tôi đề nghị bỏ qua lựa chọn từ ngữ của họ, nhưng chỉ nhìn vào các công thức. Từ thời điểm này tôi sẽ tiếp tục sử dụng các thuật ngữ như tôi thích chúng, chứ không phải Freeman et al. sử dụng chúng.


Câu 2: Quỹ đạo không gian nhà nước là gì?

Họ lấy dữ liệu thử nghiệm đơn lẻ và chiếu nó lên hai trục chính đầu tiên, tức là hai cột đầu tiên của ). Nếu bạn đã làm điều đó với dữ liệu gốc Y , bạn sẽ nhận được hai thành phần chủ yếu đầu tiên trở lại. Một lần nữa, chiếu trên một trục chính là một trong những thành phần chính, tức là một t -long chuỗi thời gian.BạnY^t^

Yt^

Y


Tôi đã hỏi câu hỏi này như một bình luận bên dưới, nhưng có lẽ @amoeba có thể giúp gì? Là thành phần chính trọng lượng đầu tiên vector chỉ là chuỗi thời gian trung bình sụp đổ trên tất cả các voxels? Nếu nó là trung bình, nó sẽ dẫn đến điểm số nhỏ nhất để phù hợp với dấu vết dữ liệu cá nhân. -
statHacker

1
Câu trả lời ngắn gọn là không , nó thường không phải là chuỗi thời gian trung bình, mặc dù trong nhiều trường hợp nó có thể khá gần. Ví dụ, hãy nghĩ về một tập hợp chuỗi thời gian là tất cả các đường thẳng có độ dốc khác nhau (dương và âm) đều đi qua không. Sau đó, chuỗi thời gian trung bình là khoảng không đổi. Nhưng PC đầu tiên sẽ là dòng tuyến tính mạnh. BTW, tôi nghĩ rằng đây là một câu hỏi xuất sắc và nếu bạn muốn biết thêm chi tiết và / hoặc số liệu, xin vui lòng hỏi nó (một lần nữa) như một câu hỏi riêng biệt. Chỉ cần chắc chắn không trùng lặp bất kỳ phần nào của câu hỏi này về Freeman và cộng sự; làm cho chúng riêng biệt
amip nói rằng Phục hồi Monica

(hoặc bất kỳ ai khác quan tâm đến phản hồi) - liên quan đến Q2, ý của bạn là "dự án [mỗi thử nghiệm] trên hai [PC] đầu tiên". Về mặt toán học, rất rõ ràng rằng U là một vectơ có độ dài n voxels và khi ma trận nhân với độ dài n ma trận Y, chúng ta đạt được sự giảm kích thước cho 2 PC đầu tiên. Bạn có thể cung cấp trực giác liên quan đến U là ma trận điểm số (tức là khoảng cách của mỗi voxel từ 2 PC đầu tiên). Tôi có thể nghĩ mỗi mốc thời gian của J là trung bình 2 ngày của hình chiếu của từng vị trí voxels trong đồ thị 2 chiều của hình ảnh thứ 1 ở trên không?
statHacker

BạnBạn

SV

1

pVt^

Y^n×t^Bạnn×nVt^×t^

Đối với câu hỏi thứ hai. Phương trình đã cho là

J= =BạnTY

J×t

tt^J

t^

Tôi đã không xử lý phương pháp tô màu trước đây và sẽ mất một thời gian trước khi tôi tự tin nhận xét về khía cạnh đó. Tôi thấy nhận xét về sự giống nhau của Hình 4c khó hiểu khi màu được thu được ở đó bằng hồi quy per-voxel. Trong khi đó trong Hình 6, mỗi dấu vết là một vật phẩm toàn ảnh. Trừ khi tôi nói thẳng, tôi nghĩ đó là hướng của kích thích trong đoạn thời gian đó theo nhận xét trong Hình.


Hình đầu tiên ở trên đề cập đến một thí nghiệm có cùng kích thích thị giác được trình bày mỗi lần. Có một con số và bộ phim khác nhau cho những dữ liệu đó. Hình thứ hai ở trên đề cập đến một thí nghiệm khác trong đó các kích thích là kích thích thị giác với các hướng khác nhau, các dấu vết trong hình thứ 2 ở trên được tô màu để đơn giản tương ứng với các hướng kích thích thị giác khác nhau.
statHacker

YT^ \ n

VS
J= =BạnY.
Bạn

Tôi đã sắp xếp lại mọi thứ. Lời xin lỗi, là một phần còn lại từ trước khi tôi sắp xếp một cái gì đó khác.
phỏng đoán

Cảm ơn tất cả sự giúp đỡ của bạn. Là thành phần chính trọng lượng đầu tiên vector chỉ là chuỗi thời gian trung bình sụp đổ trên tất cả các voxels? Nếu nó là trung bình, nó sẽ dẫn đến điểm số nhỏ nhất để phù hợp với dấu vết dữ liệu cá nhân.
statHacker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.