Trong lĩnh vực của tôi, cách thông thường để vẽ dữ liệu được ghép nối là một chuỗi các đoạn đường dốc mỏng, phủ nó với dải phân cách và CI của dải phân cách cho hai nhóm:
Tuy nhiên, loại cốt truyện này trở nên khó đọc hơn rất nhiều vì số lượng điểm dữ liệu rất lớn (trong trường hợp của tôi, tôi có thứ tự 10000 cặp):
Giảm alpha giúp một chút, nhưng nó vẫn không tuyệt vời. Trong khi tìm kiếm một giải pháp, tôi đã xem qua bài viết này và quyết định thử thực hiện một 'âm mưu đường song song'. Một lần nữa, nó hoạt động rất độc đáo đối với số lượng nhỏ các biểu dữ liệu:
Tôi cho rằng tôi có thể hiển thị riêng các bản phân phối cho hai nhóm, ví dụ như với boxplots hoặc violon và vẽ một dòng có lỗi trên đầu hiển thị hai trung vị / TCTD, nhưng tôi thực sự không thích ý tưởng đó, vì nó sẽ không truyền đạt tính chất ghép nối của dữ liệu.
Tôi cũng không quá quan tâm đến ý tưởng về một biểu đồ phân tán 2D: Tôi thích một biểu diễn nhỏ gọn hơn và lý tưởng nhất là trong đó các giá trị cho hai nhóm được vẽ dọc theo cùng một trục. Để hoàn thiện, đây là dữ liệu trông giống như một phân tán 2D:
Có ai biết một cách tốt hơn để biểu diễn dữ liệu được ghép nối với kích thước mẫu rất lớn không? Bạn có thể liên kết tôi với một số ví dụ?
Biên tập
Xin lỗi, tôi rõ ràng đã không làm một công việc đủ tốt để giải thích những gì tôi đang tìm kiếm. Đúng, biểu đồ phân tán 2D hoạt động và có nhiều cách để cải thiện mật độ điểm tốt hơn - Tôi có thể mã màu các chấm theo ước tính mật độ hạt nhân, tôi có thể tạo biểu đồ 2D , Tôi có thể vẽ các đường viền trên các dấu chấm, v.v.
Tuy nhiên, tôi nghĩ rằng điều này là quá mức cho thông điệp mà tôi đang cố gắng truyền tải. Tôi thực sự không quan tâm đến việc hiển thị mật độ 2D mỗi điểm - tất cả những gì tôi cần làm là chỉ ra rằng các giá trị cho 'thanh' thường lớn hơn so với 'điểm', theo cách đơn giản và rõ ràng nhất có thể và không làm mất tính chất kết hợp thiết yếu của dữ liệu. Lý tưởng nhất là tôi muốn vẽ các giá trị được ghép nối cho hai nhóm theo cùng một thay vì các trục trực giao, vì điều này giúp dễ dàng so sánh chúng một cách trực quan hơn.
Có thể không có lựa chọn nào tốt hơn cốt truyện phân tán, nhưng tôi muốn biết liệu có bất kỳ giải pháp thay thế nào có thể hoạt động không.
bar
trên ngang vàdot
trên trục dọc dưới dạng phân tán?