Phân tích dòng thời gian


10

Tôi đang tiến hành nghiên cứu về mối quan hệ giữa thứ tự sinh của một người và sau này có nguy cơ béo phì bằng cách sử dụng dữ liệu từ một số đoàn hệ sinh 1 năm (ví dụ: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Một thách thức chính là thứ tự sinh được liên kết với các đặc điểm khác như tuổi mẹ, số anh chị em trẻ và / hoặc lớn tuổi và khoảng cách sinh, cũng có thể ảnh hưởng đến kết quả thông qua các cơ chế khác nhau. Hơn nữa, bất kỳ ảnh hưởng nào của những điều này đối với nguy cơ béo phì sau này có thể được sửa đổi bởi thành phần giới tính của anh chị em, bao gồm cả "đứa trẻ chỉ số" (người tham gia đoàn hệ sinh).

Đối với mỗi đứa trẻ chỉ số, người ta có thể vẽ một mốc thời gian cho thấy tất cả các lần sinh trong gia đình, với tuổi của mẹ ở biến thời gian.

nhập mô tả hình ảnh ở đây

Tôi đang cố gắng xác định các phương pháp để phân tích các loại dữ liệu này, trong đó thứ tự, thời gian và bản chất của các sự kiện đều có thể quan trọng. Tôi đang đặt câu hỏi này ở đây vì tính đa dạng của các ứng dụng mà các thành viên làm việc với - tôi hy vọng ai đó có một số gợi ý ngay lập tức sẽ khiến tôi mất nhiều thời gian hơn để nhận dạng một mình. Bất kỳ ảnh khỏa thân đúng hướng (s) sẽ được đánh giá rất cao.

Câu hỏi liên quan: Tôi nên phân tích dữ liệu về khoảng thời gian sinh của phụ nữ như thế nào?


1
+1. Câu hỏi thông thường: bạn đã có dữ liệu cho chỉ số BMI của cha mẹ chưa?
Deer Hunter

Vâng, có một số dữ liệu nhân trắc học theo chiều dọc cho các bà mẹ của những đứa trẻ chỉ số. Không phải trên anh chị em không may, loại trừ bất kỳ trong phân tích so với giữa các phân tích gia đình.
DL Dahly

Không có nhiều suy nghĩ hữu ích về vấn đề dòng thời gian tại thời điểm này. Bạn có thể muốn có tuổi mẹ khi sinh con đầu lòng như một biến độc lập khác; Tôi cho rằng bạn đã thực hiện phân tích và hình dung khám phá ...
Deer Hunter

Rõ ràng tuổi mẹ rất quan trọng để giải thích, đó là lý do tại sao các mốc thời gian trên sử dụng tuổi mẹ làm biến thời gian. Tôi đoán những gì tôi hy vọng tìm thấy là một phương pháp thay thế cung cấp nhiều hơn là chỉ ném mọi thứ vào mô hình tuyến tính.
DL Dahly

Không chắc chắn nếu điều này có vấn đề, nhưng tôi sẽ nghĩ rằng cân nặng khi sinh hoặc cân nặng khi sinh trung bình của trẻ em phụ nữ có thể là một đồng biến thú vị. Ngoài ra, bạn có thể cung cấp thêm thông tin về kết quả của bạn? Bạn có biện pháp lặp đi lặp lại?
Đáng tin cậy

Câu trả lời:


2

Bạn có thể cân nhắc sử dụng các mô hình đa cấp (hồi quy hỗn hợp) để ước tính giữa và trong các hiệu ứng gia đình. Một chiến lược có thể là sử dụng phương pháp xây dựng mô hình phân cấp có kế hoạch. Ví dụ: kiểm tra từng yếu tố dự đoán tiềm năng trong một mô hình đơn biến. Nếu các hiệu ứng giữa các gia đình loại bỏ hiệu ứng thứ tự sinh, thì nó sẽ gợi ý mạnh mẽ thứ tự sinh không quan trọng nhưng những ảnh hưởng khác là. Một ví dụ về trích dẫn này cho hiệu ứng thứ tự sinh trên IQ:

Tôi hy vọng rằng điều này hữu ích.


+1 cho một ý tưởng hay tôi cũng đã gặp, nhưng tôi không có bất kỳ dữ liệu kết quả nào về anh chị em cho phân tích cụ thể này.
DL Dahly

0

Tôi đang tiếp cận điều này như một câu hỏi thống kê và không có kiến ​​thức đặc biệt về các vấn đề y tế.

Nhìn vào bài báo bạn đề cập đến tôi thấy rằng một đoàn hệ có 970 cá nhân. Nếu bạn có dữ liệu về một số nhóm có kích thước gần như vậy, thì kích thước tổng thể của tập dữ liệu của bạn cung cấp cơ hội để chọn các tập hợp con lớn hợp lý trong đó dòng thời gian của mỗi cá nhân đáp ứng các điều kiện cụ thể. Ví dụ, một tập hợp con có thể bao gồm, tất cả các cá nhân nam có tuổi mẹ từ 25-29. Hồi quy, đối với một tập hợp con như vậy, một biện pháp phù hợp về béo phì sau sinh đối với trật tự sinh sẽ loại bỏ mọi ảnh hưởng có thể có đối với sự béo phì về sự khác biệt về giới tính của trẻ chỉ số và loại bỏ phần lớn mọi ảnh hưởng có thể có của tuổi mẹ.

Không đơn giản để mở rộng cách tiếp cận này đối với giới tính của anh chị em vì nếu một điều kiện cho một tập hợp con là, thì đứa trẻ có chỉ số có anh chị em lớn tuổi hơn, ngụ ý rằng đứa trẻ chỉ số không phải là đứa trẻ lớn nhất, thu hẹp phạm vi của biến độc lập trong hồi quy. Tuy nhiên, cách này có thể là xác định các điều kiện bằng cách sử dụng "nếu có". Ví dụ, một tập hợp con có thể được xác định bao gồm tất cả các cá nhân nam có tuổi mẹ từ 25-29 và với anh chị lớn hơn, nếu có, tất cả là nữ. Một tập hợp con như vậy vẫn sẽ bao gồm các cá nhân với bất kỳ thứ tự sinh.

Nếu một tập hợp con được xác định bởi một tập hợp các điều kiện quá phức tạp, thì số lượng cá thể mà nó chứa có thể quá nhỏ đến mức các ước tính kết quả của các hệ số sẽ quá thiếu chính xác. Nếu phương pháp này được áp dụng, có lẽ sẽ cần phải đánh đổi bằng phán đoán, trong việc xác định các tập hợp con, giữa việc loại bỏ càng nhiều hiệu ứng càng tốt và bao gồm đủ các cá nhân để mang lại kết quả hữu ích.


Cảm ơn bạn đã trả lời Adam. Tuy nhiên, trong trường hợp này, tôi không nghĩ việc phân tầng mẫu sẽ cho bạn biết bất cứ điều gì ngoài một mô hình được điều chỉnh tương tự. Rất có thể một mô hình tuyến tính được chỉ định đúng là cách tốt nhất để làm điều này ... Tôi chỉ hy vọng xem liệu các nhà thống kê trong các lĩnh vực khác xử lý các vấn đề tương tự theo những cách khác nhau.
DL Dahly

Tôi đồng ý - nếu đây là những gì bạn đang nói - rằng cách tiếp cận của tôi tương đương với một hồi quy duy nhất trên toàn bộ tập dữ liệu bằng nhiều biến chỉ báo. Lấy tuổi mẹ làm ví dụ, một vấn đề tiềm ẩn với bất kỳ mô hình nào coi nó là biến liên tục là nó đòi hỏi một giả định về hình thức chức năng (mối quan hệ giữa tuổi mẹ và béo phì sau này có thể là đường cong). Ngược lại, một mô hình sử dụng một tập hợp các biến chỉ báo cho các nhóm tuổi mẹ không cần phải có giả định như vậy và về mặt đó thì tổng quát hơn.
Adam Bailey

0

Tôi sẽ đề nghị phân tích dữ liệu chức năng nhưng tôi nghi ngờ bạn có thể có rất nhiều gia đình có quá ít con để có được ước tính hợp lý. Đi trước và đọc vào nó mặc dù, vì nó giải quyết nhu cầu của bạn. Có lẽ ai đó đã sử dụng nó với dữ liệu tương tự rồi.

Nếu bạn không muốn làm một cái gì đó ồ ạt không tham số như vậy, bạn nên sử dụng chuyên môn lâm sàng của mình để giảm tính chiều của dữ liệu. Ví dụ: một biến trong mô hình của bạn có thể là số trẻ em, một biến khác có thể là số năm trung bình giữa các trẻ, v.v. Nếu có bất kỳ ảnh hưởng nào trong các biến này, nó có thể xuất hiện ngay cả khi bạn chưa chỉ định chính xác biểu mẫu chức năng ngay lập tức. Xây dựng mô hình theo định hướng tri thức có thể cho phép bạn xây dựng một mô hình có tính dự đoán cao - chỉ cần đảm bảo bạn giữ một bộ xác thực!


Tôi sử dụng FDA và không chắc nó áp dụng như thế nào. Tôi có thể đặt x trục = 0 cho mỗi chỉ số con và có các anh chị em khác được vẽ ở +/- thời gian trên trục đó; và có tuổi mẹ là trục y; và sau đó ước tính một đối tượng dữ liệu chức năng đơn điệu cho mỗi đứa trẻ chỉ số ... nhưng ngay sau khi tôi làm điều này, tôi đã mất tất cả thông tin về số lượng anh chị em thực sự và nơi chúng rơi dọc theo dòng (vì mọi thứ giờ đã được tóm tắt bởi chức năng). FDA bao gồm một số chế độ phân tích - bạn đã có ý tưởng cụ thể hơn chưa?
DL Dahly
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.