SVD của ma trận tương quan nên là phụ gia nhưng dường như không phải là


29

Tôi chỉ đang cố gắng sao chép một yêu cầu được đưa ra trong bài báo sau, Tìm kiếm các chuỗi khối tương quan từ dữ liệu biểu hiện gen , đó là:

Dự 4. Nếu . sau đó chúng tôi có:XIJ=RICJT

tôi. Nếu là một chiếc xe đạp hoàn hảo với mô hình phụ gia, thì X I J là một chiếc xe đạp hoàn hảo với sự tương quan trên các cột; ii. Nếu C J là một chiếc xe đạp hoàn hảo với mô hình phụ gia, thì X I J là một chiếc xe đạp hoàn hảo với sự tương quan trên các hàng; iii. Nếu cả R IC J đều là những chiếc xe đạp hoàn hảo với mô hình phụ gia, thì X I J là một chiếc xe đạp tương quan hoàn hảo.RIXIJ
CJXIJ
RICJXIJ

Những đề xuất này có thể dễ dàng được chứng minh ...

... nhưng tất nhiên, họ không chứng minh điều đó.

Tôi đang sử dụng một số ví dụ đơn giản trong bài báo cộng với mã cơ sở + mã R tùy chỉnh để xem liệu tôi có thể chứng minh Đề xuất này không.

corbic <- matrix(c(0,4,-4,2,2,-2,6,0,4,-8,16,-2,-2,10,-14,4), ncol=4)

(từ Bảng 1F)

một số mã tùy chỉnh để chuyển đổi dạng svd X = sang X = R C T như được mô tả trong bài báo:UdVTX=RCT

svdToRC <- function(x, ignoreRank = FALSE, r = length(x$d), zerothresh=1e-9) {
#convert standard SVD decomposed matrices UEV' to RC' form
#x -> output of svd(M)
#r -> rank of matrix (defaults to length of singular values vector)
            # but really is the number of non-zero singular values
#ignoreRank -> return the full decomposition (ignore zero singular values)
#zerothresh -> how small is zero?

    R <- with(x, t(t(u) * sqrt(d)))
    C <- with(x, t(t(v) * sqrt(d)))

    if (!ignoreRank) {
        ind <- which(x$d >= zerothresh)
    } else {
        ind <- 1:r
    }

    return(list(R=as.matrix(R[,ind]), C=as.matrix(C[,ind])))
}

áp dụng chức năng này cho tập dữ liệu:

 > svdToRC(svd(corbic))
$R
           [,1]       [,2]
[1,]  0.8727254 -0.9497284
[2,] -2.5789775 -1.1784221
[3,]  4.3244283 -0.7210346
[4,] -0.8531261 -1.0640752

$C
          [,1]       [,2]
[1,] -1.092343 -1.0037767
[2,]  1.223860 -0.9812343
[3,]  3.540063 -0.9586919
[4,] -3.408546 -1.0263191

Trừ khi tôi bị ảo giác, ma trận này không phải là phụ gia, mặc dù corbic thể hiện mối tương quan hoàn hảo giữa các hàng và cột. Có vẻ lạ khi ví dụ họ cung cấp không thể hiện tài sản mà họ nói nên ... trừ khi tôi thiếu một loại bước chuyển đổi trước hoặc sau svd?


3
Xin chào, zzk: Có thể giúp đưa ra định nghĩa ngắn gọn về chiếc xe đạp hoàn hảo ở đây vì (a) không phải ai cũng có thể truy cập vào bài báo và (b) nó có thể có nghĩa là một vài điều khác nhau tùy thuộc vào tính tổng quát mà người ta đang giả định.
Đức hồng y

1
về cơ bản, giá trị tuyệt đối của điểm tương quan theo cặp giữa tất cả các hàng so với hàng và cột so với cột của ma trận là 1.
zzk

3
Tôi bối rối. Không 4iiinói vậy P(R), P(C), additivity => P(X)sao? (Tôi viết tắt là " Ylà một chiếc xe đạp hoàn hảo" như P(Y)). Có vẻ như bạn đang đi theo một hướng khác, hy vọng rằng sự gây nghiện từ các điều kiện khác. Xin giải thích thêm.
Stumpy Joe Pete

Stumpy - Tôi đang mong đợi sự gây nghiện trong R & C bởi vì tôi biết ma trận tôi cung cấp (corbic) thể hiện mối tương quan hoàn hảo - đó là chiếc xe đạp hoàn hảo như được nêu trong chính bài báo.
zzk

6
Tôi vẫn nghĩ bạn đang đi sai hướng. 4iii không nói rằng nếu Xlà một cách hoàn hảo tương quan bicluster sau đó RCsẽ phụ. Hàm ý đi theo hướng khác. Bây giờ, tôi đồng ý rằng thật kỳ lạ khi ví dụ họ đưa ra dường như không có ý nghĩa gì với các định lý bên cạnh. Có lẽ có một số thông tin khác bạn có thể cung cấp? Có một số định lý khác đi theo hướng khác?
Stumpy Joe Pete

Câu trả lời:


2

Lưu ý rằng 'bicluster' trong bài viết này đề cập đến một tập hợp con của ma trận, "một tập hợp con của các hàng thể hiện hành vi tương tự trên một tập hợp con của các cột hoặc ngược lại." Việc xác định các bộ đệm thường được thực hiện trong các thuật toán khai thác dữ liệu. Các tác giả đang phát triển một "mô hình đèn chùm tương quan" mới khác với các mô hình trước đây được sử dụng để xác định các tập hợp con này. Tôi không biết gì về di truyền, nhưng sự nhầm lẫn ở đây có vẻ khá rõ ràng và đến từ hai nguồn:

1. Sử dụng từ 'phụ gia'

Trong bài báo này không có gì ngụ ý rằng hai ma trận được đưa ra trong đầu ra của hàm phải là 'phụ gia', nếu theo 'phụ gia', thì nghịch đảo phụ gia là ý nghĩa của OP. Các tác giả không sử dụng từ phụ gia theo nghĩa này. Họ đang đề cập đến việc có được một chiếc xe đạp với một mô hình phụ gia, "trong đó mỗi hàng hoặc cột có thể thu được bằng cách thêm một hằng số vào một hàng hoặc cột khác."

2. Đọc sai đề xuất 4.3

RICJXIJXIJRICJRICJ phải là phụ gia nghịch đảo hoặc chúng có thể phù hợp với mô hình phụ gia.

* Ngoài ra, dữ liệu ví dụ đến từ một phần hoàn toàn khác của bài báo so với đề xuất được thảo luận trong câu hỏi.


Thật tuyệt khi thấy [cho đến nay] câu hỏi chưa được trả lời nhiều nhất trên trang web của chúng tôi cuối cùng đã được trả lời! +1 mặc dù tôi chưa đọc bài báo và không thể xác nhận rằng những gì bạn viết là chính xác; nhưng nó có vẻ hợp lý.
amip nói Phục hồi lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.