Sự phù hợp của ANOVA sau phân tích cụm k-nghĩa

Thông báo sau bảng ANOVA sau phân tích K-mean chỉ ra rằng các mức ý nghĩa không nên được xem là thử nghiệm của các phương tiện bằng nhau, vì giải pháp cụm đã được rút ra dựa trên khoảng cách Euclide để tối đa hóa khoảng cách. Tôi nên sử dụng thử nghiệm nào để chỉ ra liệu phương tiện của các biến phân cụm có khác nhau giữa các cụm không? Tôi đã thấy cảnh báo này trong bảng ANOVA do k-mean cung cấp, nhưng trong một số tài liệu tham khảo tôi thấy rằng các bài kiểm tra ANOVA hậu hoc đang chạy. Tôi có nên bỏ qua các đầu ra ANOVA có nghĩa là k và chạy ANOVA một chiều với các bài kiểm tra hậu hoc và diễn giải chúng theo cách truyền thống không? Hoặc tôi chỉ có thể ngụ ý về độ lớn của giá trị F và biến nào đóng góp nhiều hơn cho sự khác biệt? Một nhầm lẫn khác là các biến phân cụm không được phân phối bình thường vi phạm giả định ANOVA, sau đó tôi có thể sử dụng thử nghiệm không tham số Kruskal-Wallis, nhưng nó có giả định về các phân phối tương tự. Các phân phối giữa các cụm cho các biến cụ thể có vẻ không giống nhau, một số bị lệch dương, một số bị phủ định ... Tôi có 1275 mẫu lớn, 5 cụm, 10 biến phân cụm được đo bằng điểm PCA.

anova k-means

— Inga
nguồn

Tại sao bạn cần kiểm tra sự bình đẳng của phương tiện? Bạn có thể kiểm tra mô hình của bạn hoạt động như thế nào không?

— James

Tôi muốn xác định các biến 'có nghĩa là khác nhau giữa các cụm, nghĩa là liệu trung bình của v1 trong cụm 1 có khác với trung bình của v1 trong cụm, 2, 3, 4, 5. Tất nhiên tôi có thể thấy điều đó bằng cách tạo một biểu đồ, nhưng nó có không nói về sự khác biệt thống kê. Thử nghiệm cho sự khác biệt thống kê làm tôi bối rối, vì đối với ANOVA, dữ liệu của tôi không đáp ứng giả định phân phối bình thường, nhưng đối với Kruskal Wallis thử nghiệm giả định phân phối hình dạng tương tự giữa các nhóm cụm.

— Inga

Như @James đã chỉ ra trong câu trả lời của anh ấy, bạn đang "rình mò". Điều gì có thể là một lý do để kiểm tra mức độ quan trọng giữa các nhóm mà bạn (nhóm của bạn) được chọn trước khác nhau nhiều nhất có thể? Ở đây không có bất kỳ dấu hiệu lấy mẫu ngẫu nhiên hoặc tỷ lệ nào từ các quần thể khác biệt dựa trên một số đặc điểm bên ngoài , backgroud.

— ttnphns

Cảm ơn vì câu trả lời của bạn! Sự nhầm lẫn của tôi xuất hiện như trong một số nguồn tôi thấy rằng so sánh trung bình thống kê không phù hợp trong tình huống này như bạn cũng đã chỉ ra, nhưng ví dụ như một trích dẫn từ chương 1 của cuốn sách chỉ ra ngược lại: "chúng tôi thường kiểm tra phương tiện cho từng cụm trên mỗi chiều bằng ANOVA để đánh giá mức độ khác biệt của các cụm của chúng tôi. Lý tưởng nhất là chúng tôi sẽ thu được các phương tiện khác nhau đáng kể đối với hầu hết các kích thước, nếu không phải là tất cả các kích thước, được sử dụng trong phân tích. Độ lớn của các giá trị F được thực hiện trên mỗi thứ nguyên là một dấu hiệu cho thấy kích thước tương ứng phân biệt giữa chúng như thế nào cụm "

— Inga

Bạn có quyền đánh giá sự khác biệt giữa các cụm theo các đặc điểm được sử dụng để phân cụm - để tìm ra các phân biệt đối xử nhất. Khi làm như vậy, bạn có thể tính toán sự khác biệt tương đối, F và thậm chí giá trị p. Là chỉ số của kích thước hiệu ứng. Không phải là chỉ số có ý nghĩa thống kê (trong đó đề cập đến dân số).

— ttnphns

Câu trả lời:

Không!

Bạn phải không sử dụng cùng một dữ liệu đến 1) thực hiện phân nhóm và 2) săn lùng khác biệt đáng kể giữa các điểm trong cụm. Ngay cả khi không có cấu trúc thực tế trong dữ liệu, việc phân cụm sẽ áp đặt một bằng cách nhóm các điểm lại gần nhau. Điều này thu nhỏ phương sai trong nhóm và phát triển phương sai giữa các nhóm, điều này làm bạn thiên về hướng tích cực giả.

$k$

Kết quả mô phỏng cho thấy phân phối giá trị thống nhất cho các phép gán ngẫu nhiên và phân phối giá trị p bị lệch rất cao (gần như tất cả 0,05 trở xuống) sau khi phân cụm

Không có gì đặc biệt về ANOVA ở đây - bạn sẽ thấy các hiệu ứng tương tự bằng cách sử dụng các xét nghiệm không tham số, hồi quy logistic, bất cứ điều gì. Nói chung, việc xác thực hiệu suất của thuật toán phân cụm là khó khăn, đặc biệt nếu dữ liệu không được dán nhãn. Tuy nhiên, có một vài cách tiếp cận để "xác nhận nội bộ" hoặc đo lường chất lượng của cụm mà không sử dụng các nguồn dữ liệu bên ngoài. Họ thường tập trung vào sự nhỏ gọn và tách biệt của các cụm. Đánh giá này của Lui et al. (2010) có thể là một nơi tốt để bắt đầu.

— Matt Krause
nguồn

Vấn đề thực sự của bạn là dữ liệu rình mò. Bạn không thể áp dụng ANOVA hoặc KW nếu các quan sát được chỉ định cho các nhóm (cụm) dựa trên chính bộ dữ liệu đầu vào. Những gì bạn có thể làm là sử dụng một cái gì đó như thống kê Gap để ước tính số lượng cụm.

Mặt khác, các giá trị p được rình mò bị lệch xuống, do đó, nếu kết quả kiểm tra ANOVA hoặc KW không đáng kể, thì giá trị p "thực" thậm chí còn lớn hơn và bạn có thể quyết định hợp nhất các cụm.

— James
nguồn

Tôi nghĩ rằng bạn có thể áp dụng một cách tiếp cận như vậy (nghĩa là sử dụng số liệu thống kê, chẳng hạn như thống kê F hoặc thống kê t hoặc bất cứ điều gì), nếu bạn bỏ qua các bản phân phối null thông thường .

Những gì bạn cần làm là mô phỏng từ tình huống null của bạn là đúng, áp dụng toàn bộ quy trình (phân cụm, v.v.), sau đó tính toán thống kê nào mỗi lần. Áp dụng trên nhiều mô phỏng, bạn sẽ nhận được phân phối cho thống kê dưới giá trị null mà giá trị mẫu của bạn có thể được so sánh. Bằng cách kết hợp dữ liệu - rình mò vào tính toán mà bạn tính đến cho hiệu quả của nó.

[Ngoài ra, người ta có thể phát triển một thử nghiệm dựa trên việc lấy mẫu lại (cho dù dựa trên hoán vị / ngẫu nhiên hoặc bootstrapping).]

— Glen_b -Reinstate Monica
nguồn

Phải, đó là ý tưởng đằng sau thống kê Gap.

— James