Nếu bạn muốn một giải pháp thay thế cho một biểu đồ phân tán, thì một biểu đồ tọa độ song song có thể hoạt động, đặc biệt nếu bạn đang cố gắng hiển thị mối quan hệ giữa nhiều biến. Bạn "có rất nhiều đồ thị" và một đồ thị tọa độ song song có thể giảm xuống còn một đồ thị! Dưới đây là một ví dụ về tập dữ liệu Iris nổi tiếng , được lấy từ Wikipedia ( tín dụng hình ảnh ):
Cốt truyện cho thấy sự khác biệt giữa các loài rất rõ ràng. Thay vào đó, bạn có thể chọn tô màu theo vùng địa lý hoặc mức độ phát triển. Chúng ta có thể thấy thật khó để phân biệt ba loài dựa trên chiều rộng của vùng kín, nhưng có sự phân tách nhiều hơn về chiều dài cánh hoa của chúng. Sau một chút điều chỉnh tinh thần (mắt chúng ta có thể được đào tạo quá mức để tìm kiếm "độ dốc hướng lên"), rõ ràng có mối tương quan dương giữa chiều rộng cánh hoa và chiều dài cánh hoa vì chiều rộng cánh hoa cao hơn có liên quan đến chiều dài cánh hoa cao hơn. Hoa ở đỉnh của thang đo cho một, có xu hướng ở đỉnh của thang kia - điều này được biểu hiện trong các đường gần như song song chạy giữa các trục. Mặt khác, có một mối tương quan nghịch giữa chiều rộng và chiều dài vùng kín,
Hình ảnh quản lý để nắm bắt nhiều thông tin có sẵn trong toàn bộ ma trận các biểu đồ phân tán ( tín dụng hình ảnh ):
Về mặt tích cực, biểu đồ trục song song cho chúng ta khả năng theo dõi một cá nhân qua tất cả các biến được đo: nếu chúng ta thấy hai điểm thú vị trên hai biểu đồ phân tán riêng biệt, đặc biệt là các ngoại lệ, có thể không rõ liệu chúng có đại diện cho cùng một cá nhân không, nhưng trên một đồ thị trục song song chúng ta chỉ có thể "theo luồng". Mặt khác, bỏ tất cả những âm mưu phân tán đó sẽ ném đi thông tin về các mối quan hệ đa biến. Rõ ràng nhất, chúng ta không thể thấy một số chi tiết của phân cụm rõ ràng như vậy (mặc dù lưu ý Nick Cox khuyến nghị các lô phối hợp song song cho mục đích điều tra cách phân cụm "sâu" đi qua các biến) và khả năng phân biệt tuyến tính bị che khuất hoàn toàn. Ngoài ra, có thể khó thấy được mối tương quan giữa các trục cách xa nhau trên biểu đồ tọa độ song song,
Nếu bạn có tùy chọn tương tác, thay vì trực quan tĩnh, sau đó các ô tọa độ song song cung cấp cho bạn một số tùy chọn để khắc phục điều này. Ví dụ, người dùng có thể chuyển đổi thứ tự của các trục, đặt các biến cạnh nhau để thấy mối quan hệ rõ ràng hơn. Do tương quan dương và âm hoạt động rất khác nhau trên biểu đồ tọa độ song song, nên có thể lật một trục (nếu bạn đảo ngược hướng của trục có tương quan âm với trục liền kề, thì các đường giữa chúng sẽ được "gỡ rối" ). Ngay cả trên một biểu đồ tĩnh, hiệu quả nhất là đảo ngược các trục để tạo ra càng nhiều tương quan dương càng tốt và sắp xếp các trục để tạo ra các mối tương quan liên tiếp mạnh nhất có thể, vì khó có thể đi theo một sợi dây qua một mớ (xem Nick Cox trên điểm này).
Có lẽ tính năng tương tác quan trọng nhất là đánh răng và liên kết : người dùng có thể chọn, ví dụ: phần tư trên của các cá nhân dựa trên một biến và các dòng của họ được tự động tô sáng trong suốt quá trình của âm mưu. Nếu trên một trục khác, các điểm chủ yếu quanh đỉnh được tô sáng, thì điều này cho thấy mối tương quan tích cực (nhưng chúng ta nên kiểm tra xem phần tư thấp hơn có được liên kết với các điểm xung quanh đáy của biến thứ hai không); nếu các điểm chủ yếu quanh đáy được tô sáng, nó gợi ý tương quan âm; nếu một lựa chọn các điểm nằm rải rác ngẫu nhiên trên toàn bộ trục lên được tô sáng, thì nó gợi ý rất ít sự tương quan.
Với số lượng quốc gia bạn bao gồm, có vẻ khó dán nhãn tất cả chúng trên bất kỳ lô đất nào trừ khi bạn có những hạn chế về không gian rộng rãi khác thường. Bạn có thể phải giải quyết để làm nổi bật chỉ các quốc gia cá nhân quan trọng nhất. Trên hình ảnh tương tác, nhãn di chuột có thể tránh sự lộn xộn (như @xan chỉ ra) và có lẽ bạn có thể cho phép người dùng đánh dấu tất cả các quốc gia trong một khu vực nhất định (hoặc một số nhóm khác) có thể tự động hiển thị nhãn của họ.
Nếu bạn chỉ sử dụng một số lượng hạn chế nhãn, một nơi bạn có thể xem xét đặt chúng nằm trên trục. Nếu bạn nhìn vào Hiển thị trực quan thông tin định lượng của Edward Tufte , Chương 7: Các yếu tố đồ họa đa chức năng, bạn sẽ thấy điều này gần giống với đề xuất của Tufte về cái mà ông gọi là "đồ họa bảng" cho biên lai thuế của chính phủ ( nó có thể quen thuộc hơn với bạn như một "máy chiếu"). Mỗi trục trở thành một loại bảng xếp hạng, đó là một tính năng hay. (Có một số khác biệt giữa các cách tiếp cận, đặc biệt là khi bảng đồ họa ví dụ của Tufte sử dụng cùng một đơn vị và tỷ lệ trên mỗi trục, thay vì chuẩn hóa dữ liệu để khớp và vì "trục" của anh ta biểu thị khoảng thời gian sớm hơn và muộn hơn, độ dốc có một cách hiểu bổ sung là tốc độ tăng trưởng. Những cách giải thích đó thường không giữ cho một biểu đồ tọa độ song song, nhưng ý tưởng về bảng xếp hạng trên mỗi trục thì có.)
Liên kết và tài liệu tham khảo