Có một nhánh thống kê liên quan đến dữ liệu mà các giá trị chính xác không được biết , nhưng đối với mỗi cá nhân, chúng tôi biết mức tối đa hoặc tối thiểu ràng buộc với giá trị ?
I suspect that my problem stems largely from the fact that I am struggling to articulate it in statistical terms, but hopefully an example will help to clarify:
Giả sử có hai quần thể và B được kết nối sao cho, tại một số điểm, các thành viên của A có thể "chuyển đổi" thành B , nhưng điều ngược lại là không thể. Thời gian của quá trình chuyển đổi là thay đổi, nhưng không ngẫu nhiên. Ví dụ: A có thể là "cá thể không có con" và B "cá thể có ít nhất một con". Tôi quan tâm đến độ tuổi sự tiến triển này xảy ra nhưng tôi chỉ có dữ liệu cắt ngang. Đối với bất kỳ cho cá nhân, tôi có thể tìm hiểu xem họ thuộc về một hoặc B . Tôi cũng biết tuổi của những cá nhân này. Đối với mỗi cá nhân trong dân số A, Tôi biết rằng độ tuổi chuyển đổi sẽ TUYỆT VỜI hơn tuổi hiện tại của họ. Tương tự như vậy, đối với các thành viên của , tôi biết rằng độ tuổi chuyển đổi là ÍT HƠN tuổi hiện tại của họ. Nhưng tôi không biết các giá trị chính xác.
Nói rằng tôi có một số yếu tố khác mà tôi muốn so sánh với độ tuổi chuyển đổi. Ví dụ, tôi muốn biết liệu phân loài hoặc kích thước cơ thể của một cá nhân có ảnh hưởng đến tuổi của con cái đầu tiên hay không. Tôi chắc chắn có một số thông tin hữu ích cần thông báo cho những câu hỏi đó: trung bình, các cá nhân trong , các cá nhân lớn tuổi sẽ có sự chuyển đổi sau này. Nhưng thông tin là không hoàn hảo , đặc biệt là cho các cá nhân trẻ tuổi. Và ngược lại cho dân B .
Có phương pháp thành lập để đối phó với loại dữ liệu này ? Tôi không nhất thiết cần một phương pháp đầy đủ để thực hiện phân tích như vậy, chỉ cần một số thuật ngữ tìm kiếm hoặc tài nguyên hữu ích để bắt đầu tôi ở đúng nơi!
Hãy cẩn thận: Tôi đang thực hiện giả định đơn giản hóa rằng việc chuyển đổi từ sang B là tức thời. Tôi cũng chuẩn bị cho rằng hầu hết các cá nhân sẽ đến một lúc nào đó tiến tới B , cho rằng họ sống đủ lâu. Và tôi nhận ra rằng dữ liệu theo chiều dọc sẽ rất hữu ích, nhưng giả sử rằng nó không có sẵn trong trường hợp này.
Xin lỗi nếu đây là một bản sao, như tôi đã nói, một phần của vấn đề của tôi là tôi không biết mình nên tìm kiếm cái gì. Vì lý do tương tự, vui lòng thêm các thẻ khác nếu thích hợp.
Sample dataset: Ssp indicates one of two subspecies, or . Offspring indicates either no offspring () or at least one offspring ()
age ssp offsp
21 Y A
20 Y B
26 X B
33 X B
33 X A
24 X B
34 Y B
22 Y B
10 Y B
20 Y A
44 X B
18 Y A
11 Y B
27 X A
31 X B
14 Y B
41 X B
15 Y A
33 X B
24 X B
11 Y A
28 X A
22 X B
16 Y A
16 Y B
24 Y B
20 Y B
18 X B
21 Y B
16 Y B
24 Y A
39 X B
13 Y A
10 Y B
18 Y A
16 Y A
21 X A
26 X B
11 Y A
40 X B
8 Y A
41 X B
29 X B
53 X B
34 X B
34 X B
15 Y A
40 X B
30 X A
40 X B
Edit: example dataset changed as it wasn't very representative