Tính xác suất xuất hiện bệnh


8

Tôi là một bác sĩ vì vậy hãy tử tế với tôi và hiểu biết cơ bản về thống kê.

Tôi có một bộ dữ liệu bao gồm các bệnh nhân và các lần thăm khám của họ và tôi đã dán nhãn sự hiện diện của một loại nốt ruồi cụ thể ở tay trái và / hoặc tay phải của họ với các giá trị {0,1} (0 = không có mặt và 1 = hiện tại). Bộ dữ liệu trông như thế này:

** Tôi đã xóa nó vì các câu trả lời được cung cấp; Tôi có thể gửi nó theo yêu cầu mới

Vì vậy, điều đó có nghĩa là bệnh nhân A1-001 đã có 6 lần thăm khám mà không có sự hiện diện của nốt ruồi ở bàn tay phải trong tất cả các lần khám và hiện diện của nốt ruồi ở tay trái trong tất cả các lần khám ngoại trừ lần đầu tiên.

Tôi quan tâm đến việc tìm xác suất bàn tay phát triển nốt ruồi trong số chỉ những bệnh nhân phát triển nốt ruồi ở một tay và tìm thấy xác suất phát triển nốt ruồi ở mặt khác (cho rằng bệnh nhân đã có nốt ruồi ở tay kia) .

Hơn nữa, tôi muốn biết xác suất phát triển nốt ruồi trong các lần thăm khám giữa các bệnh nhân đã phát triển nốt ruồi ở một số điểm ở cả hai tay là gì

Bạn có thể giúp tôi mô hình hóa những câu hỏi đơn giản?


"Hơn nữa, tôi muốn biết xác suất phát triển nốt ruồi trong cùng một lần khám giữa các bệnh nhân đã phát triển nốt ruồi ở một số điểm ở cả hai tay là gì". - Nhưng bạn đang mã hóa nốt ruồi trên mỗi bàn tay như hiện tại hay vắng mặt thay vì đếm số lượng nốt ruồi, vì vậy nếu một bệnh nhân đã có một nốt ruồi trên mỗi bàn tay, làm thế nào một nốt ruồi bổ sung sẽ hiển thị trong dữ liệu?
Chuyên gia Kodi

@Kodiologist Vâng, tôi chỉ quan tâm đến sự hiện diện và không phải là số lượng nốt ruồi. Nếu một bệnh nhân đã có một nốt ruồi trên mỗi bàn tay, thì không thể có thêm một nốt: chỉ có thể ở lại với nốt ruồi này hoặc nốt ruồi biến mất.
laza

2
Cung cấp bộ dữ liệu hoàn chỉnh có thể làm rõ câu hỏi và hỗ trợ nhận câu trả lời.
Todd D

@Todd Tôi không hiểu cách cung cấp toàn bộ dữ liệu sẽ thay đổi giải pháp cho vấn đề. Tôi không phải là nhà toán học nhưng tôi tin rằng vấn đề được xác định rõ ngay cả với cỡ mẫu này. Tôi đoán việc giải quyết vấn đề cho N = 3 (số bệnh nhân) sẽ giống như giải quyết vấn đề cho N = 100.
laza

1
@laza, toán học không khó đối với các nhà toán học. Nhưng bạn đặt ra một vấn đề không phải là về toán học và thay vào đó là cố gắng hiểu ý của bạn (đó là lý do tại sao một bộ dữ liệu lớn hơn được hỏi) ...... ý bạn là gì khi nói "Tôi muốn biết ý nghĩa của nó là gì xác suất phát triển nốt ruồi trong cùng một lần thăm khám giữa các bệnh nhân đã phát triển nốt ruồi ở một số điểm ở cả hai tay. " ? Bạn đã không trả lời câu hỏi đó từ Kodiologist,
Sextus Empiricus

Câu trả lời:


5

Cá nhân tôi cảm thấy điều này cho vay chính nó để phân tích sinh tồn.

Bạn có những người không có nốt ruồi trong một bàn tay nhất định vào đầu giai đoạn (dân số có nguy cơ của bạn); bạn có thể chọn những mục này và bạn có thời gian để theo dõi và liệu chúng có bị kiểm duyệt hay không (đã phát triển một nốt ruồi). Điều này mang đến cho bạn một mối nguy hiểm cho bất kỳ đoàn hệ nào bạn đã chọn.

Sau đó, bạn có thể tính tỷ lệ nguy hiểm (ví dụ: để phát triển nốt ruồi tay phải ở những người có nốt ruồi tay trái ở đường cơ sở, so với những người không có). Điều này có thể được thể hiện trên biểu đồ Kaplan-Meier và sẽ đi kèm với khoảng tin cậy.


Xin chào @James, tôi nghĩ rằng tôi sẽ đưa ra một cú đánh vào cuộc đời này.readthedocs.io/en/latest/ chủ Bạn nghĩ gì?
laza

Tôi chắc chắn rằng điều đó tốt. Trong khi tôi yêu trăn, tôi thường thích R cho các số liệu thống kê, nhưng điều này có vẻ được hỗ trợ khá tốt.
James

bạn có thể cho tôi một gợi ý hoặc hai wrt mang dữ liệu đến đúng định dạng không?
laza

Giống như nó nói rằng bạn cần biết thời gian mọi người được quan sát và khi họ 'chết' (tức là có một nốt ruồi) hoặc lần cuối họ được nhìn thấy nếu họ không có một nốt ruồi. Vì vậy, đối với mọi bệnh nhân, hãy theo dõi thời gian từ nơi bạn lần đầu tiên nhìn thấy họ mà không có nốt ruồi, đến thời điểm họ có nốt ruồi hoặc được nhìn thấy lần cuối. Đó là cột 'T' trong liên kết ví dụ. Cột 'E' là liệu họ có nốt ruồi hay không. Sau đó, bạn cần 1 hàng cho mỗi bệnh nhân.
James

Nhưng điều gì xảy ra nếu bệnh nhân có nốt ruồi ngay trong lần khám đầu tiên? Và trong một câu hỏi khác, tại sao bạn nghĩ chuỗi Markov không phù hợp với vấn đề này? Đó là một vấn đề chuyển tiếp và từ những gì tôi đọc được, chúng có vẻ rất phù hợp để giải quyết các loại vấn đề này.
laza

0

Không có mô hình nào được thực hiện ở đây, tất cả các câu hỏi của bạn là xác suất có điều kiện đơn giản.

Được rồi, vì mọi người không đánh giá cao câu trả lời đó, bạn cần làm rõ một vài điều.

Tôi quan tâm đến việc tìm xác suất bàn tay phát triển nốt ruồi trong số chỉ những bệnh nhân phát triển nốt ruồi ở một tay và tìm thấy xác suất phát triển nốt ruồi ở mặt khác (cho rằng bệnh nhân đã có nốt ruồi ở tay kia) .

Bạn có nghĩa là mỗi lần truy cập? Hoặc là họ không bao giờ phát triển một nốt ruồi bao giờ? Từ ví dụ của bạn:

Bệnh nhân 1 và 3 đã phát triển một nốt ruồi trên một tay. Mặt khác, bệnh nhân 1 không bao giờ phát triển nốt ruồi nhưng bệnh nhân 3 đã làm, vì vậy bạn có thể tranh luận câu trả lời cho câu hỏi của bạn là 50%. Bây giờ, bạn cũng có thể lập luận rằng bệnh nhân 1 có 4 lần kiểm tra với 1 nốt ruồi và không phải bệnh nhân khác và bệnh nhân 3 có 0 lần kiểm tra với 1 nốt ruồi chứ không phải bệnh nhân khác nên xác suất có thể là 1/5 = 20%. Nó phụ thuộc vào cách bạn xác định câu hỏi của bạn.


Cảm ơn bạn đã trả lời của bạn. Bạn có thể giúp tôi ngay cả với điều đó? Tôi thực sự sẽ đánh giá cao nó. Tuy nhiên, một số đồng nghiệp của tôi đã nói với tôi sử dụng mô hình dọc cho dữ liệu hoặc thống kê Bayes. Những điều này không áp dụng ở đây tôi đoán?
laza

3
Bài đăng này không trả lời câu hỏi, bởi vì bất kỳ tuyên bố nào về xác suất thực chất là một mô hình. Vấn đề quan trọng là "mô hình đó là gì (hoặc nên là)?"
whuber

0

Cá nhân, tôi nghĩ bạn có thể bắt đầu bằng cách nghiên cứu các mô hình tuyến tính tổng quát đa phương : https://cran.r-project.org/web/packages/mcglm/index.html

https://cran.r-project.org/web/packages/mcglm/vignettes/GLMExamples.html

http://cursos.leg.ufpr.br/mcglm4aed/slides/2-mcglm.html#(1)

Các mô hình đó được phân bổ khi bạn có nhiều hơn một biến trả lời và chúng không phải là gaussian và đây là trường hợp của bạn, vì bạn có hai biến nhị phân (nốt ruồi hoặc không có nốt ruồi trong mỗi tay). Ngoài ra, phương pháp cho phép bạn đối phó với các phụ thuộc bên trong cá nhân, được đưa ra bởi cấu trúc dọc. Ở đây, theo chiều dọc có nghĩa là các biện pháp lặp đi lặp lại cho cùng một cá nhân, cùng thời gian.

Tôi nghĩ rằng các liên kết ở trên sẽ giúp bạn có một ý tưởng tốt về các kỹ thuật này và chúng cũng cung cấp việc triển khai tính toán trong R.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.