Tôi có một số dữ liệu tôi cần để hình dung và không chắc làm thế nào tốt nhất để làm như vậy. Tôi có một số bộ mục cơ bản với tần số tương ứng và kết quả . Bây giờ tôi cần vẽ biểu đồ phương pháp của tôi "tìm thấy" (nghĩa là 1 kết quả) các mục tần số thấp. Ban đầu tôi chỉ có trục x tần số và trục ay 0-1 với các ô điểm, nhưng nó trông thật kinh khủng (đặc biệt là khi so sánh dữ liệu từ hai phương pháp). Nghĩa là, mỗi mục có kết quả (0/1) và được sắp xếp theo tần số của nó.
Đây là một ví dụ với kết quả của một phương thức:
Ý tưởng tiếp theo của tôi là chia dữ liệu thành các khoảng và tính toán độ nhạy cục bộ theo các khoảng, nhưng vấn đề với ý tưởng đó là phân phối tần số không nhất thiết phải thống nhất. Vì vậy, làm thế nào tốt nhất tôi nên chọn khoảng?
Có ai biết một cách tốt hơn / hữu ích hơn để hình dung các loại dữ liệu này để mô tả hiệu quả của việc tìm kiếm các mục hiếm (tức là tần số rất thấp) không?
EDIT: Để cụ thể hơn, tôi đang trình diễn khả năng của một số phương pháp để tái cấu trúc các chuỗi sinh học của một dân số nhất định. Để xác thực bằng cách sử dụng dữ liệu mô phỏng, tôi cần thể hiện khả năng tái cấu trúc các biến thể bất kể mức độ phong phú (tần số) của nó. Vì vậy, trong trường hợp này tôi đang hình dung các mục bị bỏ lỡ và tìm thấy, được sắp xếp theo tần số của chúng. Âm mưu này sẽ không bao gồm các biến thể xây dựng lại không nằm trong .