Tôi có một câu hỏi về các cụm mà tôi đang dự tính để điều trị bằng cách tiếp cận hỗn hợp không theo tỷ lệ (tôi nghĩ). Tôi đang làm việc trên lời giải thích về sự ép buộc của con người.
Mỗi hàng trong cơ sở dữ liệu của tôi chứa:
- ID của ai đó
- một số thông số của môi trường X (ví dụ: nhiệt độ, gió, v.v.)
- một biến nhị phân Y đại diện cho phản ứng của người đó đối với các tham số (ví dụ: bị bệnh hoặc không bị bệnh vì thời tiết).
Ý tưởng của tôi (dựa trên trực giác và không dựa trên dữ liệu) là chúng ta có thể tập hợp mọi người trong một số nhóm hữu hạn để trong một nhóm, mọi người có cùng phản ứng với nhiệt độ (một số dễ bị bệnh, những người khác không bao giờ bị bệnh ...) . Trong một nhóm nhất định, chính thức hơn, định luật Y có điều kiện đối với các tham số X là như nhau.
Tôi không có ý tưởng của pháp luật Y có điều kiện để X . Đối với các tham số X , tôi có thể thực hiện một số giả thuyết nếu cần thiết.
Tôi muốn tạo ra một số nhóm người "có ít nhiều" phản ứng tương tự với tham số. Ngoài ra, tôi muốn dự đoán phản ứng của một người nhất định với một giá trị nhất định của các tham số (ngay cả khi sự kiện này chưa bao giờ xảy ra trong cơ sở dữ liệu).
Dường như với tôi rằng chúng ta có thể xử lý vấn đề như một mô hình hỗn hợp không theo tỷ lệ. Vì tôi không có giả thuyết về luật điều kiện của Y , tôi nghĩ rằng tôi sẽ phải tạo ra nó bằng phương pháp hạt nhân chẳng hạn. Tôi đã tìm thấy bài báo này . Ngoài ra, đối với tôi, trong trường hợp này, mỗi hàng quan sát không phải là một nhận thức đơn giản về một số biến ngẫu nhiên, mà là
- Cách tiếp cận của tôi có đúng không?
- Bạn có thể tư vấn một quan điểm khác cho vấn đề này?
Tôi sẽ rất quan tâm đến bất kỳ tài liệu tham khảo về nó.
Đừng ngần ngại yêu cầu tôi cải cách báo cáo vấn đề.