Chúng tôi đã đo hai biến và biểu đồ phân tán dường như đề xuất nhiều mô hình "tuyến tính". Có cách nào để cố gắng chắt lọc những mô hình đó không? Xác định các biến độc lập khác đã trở nên khó khăn.
Cả hai biến bị lệch nhiều (về số lượng nhỏ), đây là một phân phối dự kiến trong miền của chúng tôi. Cường độ của dấu chấm biểu thị số lượng điểm dữ liệu (theo thang điểm 10 ) tại .
Ngoài ra, có cách nào để phân cụm các điểm?
Trong lĩnh vực của chúng tôi, người ta cho rằng hai biến này tương quan tuyến tính với nhau. Chúng tôi đang cố gắng để hiểu / giải thích tại sao nó không phải là trường hợp trong dữ liệu của chúng tôi.
(lưu ý, chúng tôi có 17 điểm dữ liệu)
cập nhật: cảm ơn bạn cho tất cả các câu trả lời, đây là một số yêu cầu làm rõ:
- Cả hai biến chỉ là số nguyên, điều này giải thích một số mẫu trong biểu đồ phân tán log.
- May mắn thay, theo định nghĩa, giá trị tối thiểu của cả hai biến là 1.
- 7 điểm là ("được giải thích" bởi độ lệch trái của dữ liệu)
Dưới đây là các lô được yêu cầu:
phân tán log-log:
(khoảng trống được gây ra bởi các giá trị nguyên)
log-log cực:
Biểu đồ tỷ lệ:
Tần số là trên thang điểm từ nhật ký, kể từ thanh là 7M điểm, và sẽ ẩn các thanh khác.