Tại sao phép biến đổi tỷ lệ log-isometric được ưa thích hơn phụ gia (alr) hoặc trung tâm (clr) với dữ liệu thành phần?


8

Tôi đang thực hiện hồi quy tuyến tính trên dữ liệu thành phần bằng cách sử dụng chuyển đổi tỷ lệ log với dữ liệu điều tra dân số. Các IV là thành phần (tổng số phần trăm đến 100). DV là không thành phần và liên tục.

Các kết quả alr và clr dễ dàng được giải thích hơn. Tất cả đều sản xuất cùng một biện pháp phù hợp. Tôi có xu hướng đi với alr (hoặc clr). Aitchison mô tả ilr là phương pháp "toán học thuần túy", nhưng khán giả của tôi không phải là nhà thống kê hay nhà toán học.

Nếu mục tiêu của tôi chỉ là truyền đạt cái nhìn sâu sắc từ phân tích, tại sao tôi phải đi theo cách tiếp cận ilr (với số dư) khó khăn hơn nhiều?

Tôi đã đọc rất nhiều nghiên cứu của Aitchison, Juan Jose EgozTHER và Vera Pawlosky-Glahn nhưng không muốn tranh luận.

Câu trả lời:


6

Tiếp tục câu trả lời của marianess, clr thực sự không phù hợp do vấn đề thuộc địa. Nói cách khác, nếu bạn cố gắng suy luận với dữ liệu được chuyển đổi clr, bạn có thể rơi vào cái bẫy cố gắng suy ra tăng / giảm các biến, điều mà bạn không bao giờ có thể làm với tỷ lệ ở vị trí đầu tiên.

Phép biến đổi ilr cố gắng giải quyết điều này bằng cách chỉ bám vào các tỷ lệ của các phân vùng, vì các tỷ lệ này là số lượng ổn định. Các phân vùng này có thể được biểu diễn dưới dạng cây, trong đó các nút bên trong cây đại diện cho tỷ lệ nhật ký của phương tiện hình học của cây con. Tỷ lệ log này của cây con được gọi là số dư.

Tôi cũng khuyên bạn nên kiểm tra các ấn phẩm này, vì tất cả chúng đều có những giải thích hay về cách diễn giải biến đổi ilr.

http://msystems.asm.org/content/2/1/e00162-16

https://peerj.com/articles/2969/

https://elifescatics.org/content/6/e21887

Dưới đây là một sổ ghi chép IPython đi vào chi tiết về cách tính số dư cho một cây

Tôi cũng đã đưa ra một mô tả làm thế nào với điều này với các mô-đun trong scikit-bio ở đây trong trường hợp bạn tò mò.


Tại sao kích thước của đầu ra m - 1?
O.rka

Bạn có thể liên kết trực tiếp một tính năng với giá trị của nó không?
O.rka

m-1 của nó vì nó là một đẳng cấu - bạn chỉ có thể có tối đa độ tương phản m-1 trước khi bạn bắt đầu gặp phải các vấn đề về cộng tuyến. Và vâng, bạn sẽ có thể liên kết một tính năng với một phân vùng cụ thể, xem câu trả lời này tại đây: stats.stackexchange.com/a/270203/79569
mortonjt

5

Có một vấn đề với chuyển đổi clr (). Nó bảo toàn các biến số lượng tương tự sau khi bạn chuyển đổi dữ liệu, nhưng trong trường hợp clr () bạn có được một dữ liệu số ít (thực ra bạn có một ma trận hiệp phương sai số ít) : y1 + ... yD = 0. Và như bạn có thể biết, một số phân tích thống kê không thể được thực hiện trên dữ liệu số ít. Phép biến đổi ilr () sẽ làm giảm số lượng biến của bạn, vì vậy giả sử bạn có không gian D chiều, nhưng sau ilr () bạn sẽ kết thúc với D-1. Kết quả là, dữ liệu chuyển đổi của bạn không có gì khác, nhưng tỷ lệ. Tôi khuyên bạn nên đọc bài viết này tại đây: http://is.muni.cz/do/rect/habilitace/1431/Hron/habilitace/15_Filzmoser_et_al__2010_.pdf


một sự phân biệt hữu ích cho clr. alr cũng giảm vectơ xuống D-1. tỷ lệ ilr là của các nhóm biến (một hoặc nhiều), trong khi tỷ lệ alr là của từng biến với biến cuối cùng trong vectơ là mẫu số chung. ilr có thể cung cấp cái nhìn sâu sắc mà alr không có, nhưng với dữ liệu của tôi, hầu hết các tỷ lệ ilr không có ý nghĩa trực quan nào, ngay cả với số dư. Suy nghĩ hiện tại của tôi là nó phụ thuộc vào dữ liệu của bạn (tức là đôi khi bạn muốn xem tỷ lệ của các nhóm biến, đôi khi không).
M Kearny

-1

Tôi sẽ đi với ALR vì nó có ý nghĩa hơn. Bạn sử dụng một thành phần làm đường cơ sở hoặc tham chiếu và sau đó xem những gì các thành phần khác làm liên quan đến thành phần đó.


1
Xin vui lòng đọc các tour du lịch. Đây không phải là một câu trả lời, mà là một nhận xét. Ngay khi bạn có đủ danh tiếng, bạn có thể bình luận về bất kỳ bài đăng nào.
Ferdi

3
Biến đổi ALR là một cơ sở xiên. Có thể rất khó để phân tích dữ liệu liên quan đến một cơ sở xiên. Ngoài ra, biến đổi ALR không bảo tồn các khái niệm số liệu như khoảng cách hoặc phương sai và rất nhạy cảm với phần nào được lấy làm mẫu số.
JDS

Chỉ để theo dõi bình luận cuối cùng của tôi: statsathome.com/2017/08/09/ Cách
jds
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.