Trong khi chuẩn bị cho một cuộc nói chuyện tôi sẽ sớm đưa ra, gần đây tôi đã bắt đầu đào sâu vào hai công cụ chính (Miễn phí) để trực quan hóa dữ liệu tương tác: GGobi và mondrian - cả hai đều cung cấp một loạt các khả năng (ngay cả khi chúng có một chút lỗi).
Tôi muốn nhờ bạn giúp đỡ trong việc nói rõ (cả với bản thân tôi và cho khán giả tương lai của tôi) Khi nào thì hữu ích khi sử dụng các lô tương tác? Hoặc để khám phá dữ liệu (cho chính chúng ta) và trình bày dữ liệu (cho một "khách hàng")?
Để giải thích dữ liệu cho khách hàng, tôi có thể thấy giá trị của hình ảnh động cho:
- Sử dụng "xác định / liên kết / đánh răng" để xem điểm dữ liệu nào trong biểu đồ là gì.
- Trình bày phân tích độ nhạy của dữ liệu (ví dụ: "nếu chúng tôi loại bỏ điểm này, đây là những gì chúng tôi sẽ nhận được)
- Hiển thị ảnh hưởng của các nhóm khác nhau trong dữ liệu (ví dụ: "hãy xem biểu đồ của chúng tôi dành cho nam và bây giờ cho nữ")
- Hiển thị ảnh hưởng của thời gian (hoặc tuổi tác hoặc nói chung, cung cấp một khía cạnh khác cho bản trình bày)
Để tự khám phá dữ liệu, tôi có thể thấy giá trị của nhận dạng / liên kết / đánh răng khi khám phá một ngoại lệ trong bộ dữ liệu mà chúng tôi đang làm việc.
Nhưng khác hai ví dụ này, tôi không chắc những gì sử dụng thực tế khác mà các kỹ thuật này cung cấp. Đặc biệt là cho thăm dò dữ liệu của chúng ta!
Có thể lập luận rằng phần tương tác là tốt để khám phá (Ví dụ) một hành vi khác nhau của các nhóm / cụm khác nhau trong dữ liệu. Nhưng khi (trong thực tế) tôi đã tiếp cận tình huống như vậy, điều tôi có xu hướng làm là chạy các quy trình thống kê có liên quan (và các bài kiểm tra sau đại học) - và điều mà tôi thấy là có ý nghĩa, sau đó tôi sẽ vẽ các màu sắc phân chia rõ ràng dữ liệu cho các nhóm liên quan. Từ những gì tôi đã thấy, đây là một cách tiếp cận an toàn hơn sau đó "tự hỏi xung quanh" dữ liệu (có thể dễ dàng dẫn đến việc nạo vét dữ liệu (phạm vi so sánh nhiều cần thiết để hiệu chỉnh thậm chí không rõ ràng).
Tôi rất vui khi đọc kinh nghiệm / suy nghĩ của bạn về vấn đề này.
(câu hỏi này có thể là wiki - mặc dù nó không chủ quan và một câu trả lời được suy nghĩ kỹ sẽ sẵn sàng giành được "câu trả lời" của tôi :))