. bằng mọi cách, hãy kiểm tra nguồn gốc).
Trong bất kỳ tình huống mà các mô hình đa biến các dữ liệu có thể được mô tả bởi một phân phối elip variate, suy luận thống kê sẽ, theo định nghĩa, giảm đến vấn đề phù hợp (và đặc trưng) một k vector vị trí variate (nói θ ) và k bằng k đối xứng ma trận xác định bán tích cực (nói ΣkkθkkΣ ) với dữ liệu. Vì lý do tôi giải thích dưới đây (nhưng mà bạn đã giả định là cơ sở) nó sẽ thường có ý nghĩa hơn để phân hủy thành một phần hình dạng (một ma trận SPSD có cùng kích thước như Σ ) chiếm hình dạng của các đường nét mật độ phân phối đa biến của bạn và vô hướng σ SΣΣσS thể hiện quy mô của các đường viền này.
Trong dữ liệu đơn biến ( ), Σ , ma trận hiệp phương sai của dữ liệu của bạn là một đại lượng vô hướng và, như sẽ làm theo từ các cuộc thảo luận dưới đây, các thành phần hình dáng của Σ là 1 để Σk=1ΣΣΣ bằng quy mô thành phần của nó luôn và không mơ hồ là có thể.Σ=σS
Trong dữ liệu đa biến, nhiều lựa chọn chức năng chia tỷ lệ là có thể. Một người đặc biệt (σS ) nổi bật trong việc có một quyền sở hữu mong muốn quan trọng. Điều này sẽ làm cho nó trở thành lựa chọn ưa thích của yếu tố tỷ lệ trong bối cảnh của các gia đình hình elip.σS=|ΣΣ|1/k
Nhiều vấn đề trong thống kê MV liên quan đến lập dự toán của một ma trận tán xạ, được xác định là một hàm (al)
đối xứng bán tích cực nhất định trong R k × k và thỏa mãn:ΣRk×k
(cho người không ít ma trận A và vectơ b ). Ví dụ, ước tính cổ điển của hiệp phương sai thỏa mãn (0) nhưng không có nghĩa là duy nhất.
(0)Σ(AX+b)=AΣ(X)A⊤
Ab
Trong sự hiện diện của dữ liệu phân elip, nơi mà tất cả những đường nét mật độ là elip xác định bởi ma trận hình dạng giống nhau, cho đến nhân bởi một đại lượng vô hướng, đó là tự nhiên để xem xét các phiên bản bình thường của có dạng:Σ
VS=Σ/S(Σ)
Trong đó là hàm 1-honogenous thỏa mãn:S
(1)S(λΣ)=λS(Σ)
cho tất cả . Sau đó, V S được gọi là thành phần hình dạng của ma trận tán xạ (trong ma trận hình dạng ngắn) và σ S = S 1 / 2 ( Σ ) được gọi là thành phần quy mô của ma trận tán xạ. Ví dụ về các vấn đề ước lượng đa biến trong đó hàm mất chỉ phụ thuộc vào Σ thông qua thành phần hình dạng V S của nó bao gồm các thử nghiệm về tính hình cầu, PCA và CCA trong số các loại khác.λ>0VSσS=S1/2(Σ)ΣVS
Tất nhiên, có nhiều hàm chia tỷ lệ có thể, vì vậy điều này vẫn để ngỏ câu hỏi về cái gì (nếu có) của một số lựa chọn của hàm chuẩn hóa theo nghĩa nào đó là tối ưu. Ví dụ:S
- (ví dụ: đề xuất của @amoeba trong bình luận của anh ấy bên dưới câu hỏi của OP. Xem thêm [1], [2], [3])S=tr(Σ)/k
- ([4], [5], [6], [7], [8])S=|Σ|1/k
- (mục đầu tiên của ma trận hiệp phương sai)Σ11
- (eigenvalue đầu tiên của Σ )λ1(Σ)Σ
Tuy nhiên, là hàm chia tỷ lệ duy nhất mà ma trận Thông tin Fisher cho các ước tính tỷ lệ và hình dạng tương ứng, trong các họ bình thường không có triệu chứng cục bộ, là đường chéo khối (đó là các thành phần tỷ lệ và hình dạng của vấn đề ước lượng là trực giao không đối xứng) [0 ]. Điều này có nghĩa, trong số những thứ khác, thang đo chức năng S = | Σ | 1 / k là lựa chọn duy nhất của S mà thông số không đặc tả của σ S không gây ra bất kỳ mất hiệu quả nào khi thực hiện suy luận trênS=|Σ|1/kS=|Σ|1/kSσS .VS
Tôi không biết bất kỳ đặc tính tối ưu tương đối mạnh mẽ nào cho bất kỳ lựa chọn nào có thể có của thỏa mãn (1).S
- [0] Paindaveine, D., Một định nghĩa chính tắc về hình dạng, Số liệu thống kê và xác suất, Tập 78, Số 14, ngày 1 tháng 10 năm 2008, Trang 2240-2247. Liên kết không mong muốn
- [1] Dumbgen, L. (1998). Trên chức năng M của Tyler phân tán trong chiều cao, Ann. Inst. Thống kê. Môn Toán. 50, 471 bóng491.
- [2] Ollila, E., TP Hettmansperger và H. Oja (2004). Phương pháp dấu hiệu đa biến affine tương đương. Bản in, Đại học Jyvaskyla.
- [3] Tyler, DE (1983). Tính mạnh mẽ và hiệu quả của ma trận tán xạ, Biometrika 70, 411 xăng420.
- [4] Dumbgen, L. và DE Tyler (2005). Trên các thuộc tính phân tích của một số Chức năng M đa biến, Scand. J. Thống kê. 32, 247 Từ264.
- [5] Hallin, M. và D. Paindaveine (2008). Các xét nghiệm dựa trên xếp hạng tối ưu cho tính đồng nhất của tán xạ, Ann. Thống kê., Để xuất hiện.
- [6] Salibian-Barrera, M., S. Van Aelst và G. Willems (200 6). Phân tích thành phần chính dựa trên các công cụ ước tính MM đa biến với bootstrap nhanh và mạnh, J. Amer. Thống kê. PGS. 101, 1198 Vang1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila và H. O ja (2006). Các hàm ảnh hưởng và hiệu quả của mối tương quan chính tắc và ước tính vectơ dựa trên ma trận phân tán và hình dạng, J. Multivariate Anal. 97, 359 bóng384.
- [8] Tatsuoka, KS và DE Tyler (2000). Về tính độc đáo của S-Functional và M-function theo phân phối phi tuyến, Ann. Thống kê. 28, 1219 Từ1243.