Những ưu và nhược điểm của việc sử dụng logrank so với phương pháp Mantel-Haenszel để tính toán Tỷ lệ Nguy hiểm trong phân tích sinh tồn là gì?


17

Một cách để tóm tắt so sánh hai đường cong sinh tồn là tính tỷ lệ nguy hiểm (HR). Có (ít nhất) hai phương pháp để tính giá trị này.

  • Phương pháp logrank. Là một phần của tính toán Kaplan-Meier, tính toán số lượng các sự kiện được quan sát (tử vong, thường là) trong mỗi nhóm ( và ) và số lượng các sự kiện dự kiến ​​giả định không có sự khác biệt về sự sống sót ( và ) . Tỷ lệ nguy hiểm khi đó là: OaObEaEb
    HR=(Oa/Ea)(Ob/Eb)
  • Phương pháp Mantel-Haenszel. Đầu tiên tính V, là tổng của phương sai siêu bội tại mỗi thời điểm. Sau đó tính tỷ lệ nguy hiểm là: Tôi có cả hai phương trình này từ chương 3 của Machin, Cheung và Parmar, Phân tích sống sót . Cuốn sách đó nói rằng hai phương pháp thường đưa ra các phương thức rất giống nhau, và thực sự đó là trường hợp với ví dụ trong cuốn sách.
    HR=exp((OaEa)V)

Ai đó đã gửi cho tôi một ví dụ trong đó hai phương pháp khác nhau theo hệ số ba. Trong ví dụ cụ thể này, rõ ràng là ước tính logrank là hợp lý và ước tính của Mantel-Haenszel là rất xa. Câu hỏi của tôi là nếu có ai có lời khuyên chung nào khi tốt nhất nên chọn ước tính logrank về tỷ lệ nguy hiểm, và khi nào là tốt nhất để chọn ước tính Mantel-Haenszel? Nó có phải làm với kích thước mẫu? Số lượng quan hệ? Tỷ lệ cỡ mẫu?


Làm thế nào để những ước tính này liên quan đến một ước tính được đưa ra bởi hồi quy Cox? Đó phải là tiêu chuẩn vàng để ước tính nhân sự.
Aniko

Mô hình Cox kết hợp đồng biến. Các phương pháp Kaplan-Meier, Nelson-Aalen, Mantel-Haenszel mô hình hóa mối nguy hiểm chỉ là một chức năng của tuổi tác.
shabbychef

@shabbychef: với Cox PH, sử dụng một hiệp phương sai nhị phân duy nhất, tức là được mã hóa 0/1 cho các nhóm tham chiếu / so sánh, sau đó exp (beta) = HR.
ars

Xếp hạng log là một thử nghiệm mạnh hơn so với Cox PH khi giả định Nguy cơ theo tỷ lệ được thỏa mãn. Vì vậy, với một đồng biến 2 cấp duy nhất, nên kiểm tra thứ hạng log hoặc Mantel-Haenszel.
Thylacoleo

xem bên dưới để biết câu trả lời ...
Thylacoleo

Câu trả lời:


11

Tôi nghĩ rằng tôi đã tìm ra câu trả lời (cho câu hỏi của riêng tôi). Nếu giả định về các mối nguy theo tỷ lệ là đúng, hai phương pháp đưa ra các ước tính tương tự về tỷ lệ nguy hiểm. Sự khác biệt tôi tìm thấy trong một ví dụ cụ thể, bây giờ tôi nghĩ, là do thực tế rằng giả định đó là không rõ ràng.

Nếu giả định về các mối nguy theo tỷ lệ là đúng, thì biểu đồ log (thời gian) so với log (-log (St)) (trong đó St là tỷ lệ sống theo tỷ lệ tại thời điểm t) sẽ hiển thị hai đường thẳng song song. Dưới đây là biểu đồ được tạo từ tập dữ liệu vấn đề. Có vẻ xa tuyến tính. Nếu giả định về các mối nguy theo tỷ lệ là không hợp lệ, thì khái niệm về tỷ lệ nguy hiểm là vô nghĩa, và do đó, không có vấn đề gì được sử dụng phương pháp nào để tính tỷ lệ nguy hiểm.

văn bản thay thế

Tôi tự hỏi liệu sự khác biệt giữa các ước tính của logrank và Mantel-Haenszel về tỷ lệ nguy hiểm có thể được sử dụng như một phương pháp để kiểm tra giả định về các mối nguy theo tỷ lệ không?


7

Nếu tôi không nhầm, công cụ ước tính thứ hạng log mà bạn tham chiếu còn được gọi là công cụ ước tính Pike. Tôi tin rằng nó thường được khuyên dùng cho HR <3 vì nó thể hiện ít sai lệch trong phạm vi đó. Bài viết sau đây có thể được quan tâm (lưu ý rằng bài báo gọi nó là O / E):

[...] Phương pháp O / E bị sai lệch nhưng, trong phạm vi các giá trị của tỷ lệ tỷ lệ rủi ro quan tâm trong các thử nghiệm lâm sàng, nó hiệu quả hơn về lỗi bình phương trung bình so với CML hoặc Mantel-Haenszel phương pháp cho tất cả nhưng các thử nghiệm lớn nhất. Phương pháp Mantel-Haenszel bị sai lệch tối thiểu, đưa ra câu trả lời rất gần với phương pháp thu được bằng CML và có thể được sử dụng để cung cấp khoảng tin cậy gần đúng thỏa đáng.


Có một cái nhìn ngắn gọn về bài báo đó, tôi không chắc các ước tính mà họ cho là giống với các phương trình của người hỏi. Tôi đồng ý với các ý kiến ​​dưới câu hỏi - có thể trong năm 1981 các phương pháp gần đúng là hữu ích nhưng ngày nay không có lý do rõ ràng nào để không sử dụng hồi quy Cox.
vào

@onestop: hmm, nghĩ định nghĩa của O / E == LR với nhật ký bị quên ở trên? Tôi đồng ý với những gì bạn nói về Cox PH - đó không phải là câu hỏi tôi đang cố gắng trả lời, nhưng lời khuyên của bạn tốt hơn trong bối cảnh rộng lớn hơn.
ars

Bernstein và cộng sự al. chỉ ra một số lý do (n nhỏ, quan hệ) khiến hai phương thức không chính xác hoặc khác nhau. Nhưng tất cả những khác biệt họ thể hiện là nhỏ. Vì vậy, tôi không nghĩ bất cứ điều gì trong bài báo đó giải thích sự khác biệt ba lần mà tôi thấy đã thúc đẩy câu hỏi này. Xem dưới đây cho câu trả lời tôi đã đưa ra.
Harvey Motulsky

7

Thực tế, có một số phương pháp khác và sự lựa chọn thường phụ thuộc vào việc bạn quan tâm nhất đến việc tìm kiếm sự khác biệt sớm, sự khác biệt sau này hay - như đối với bài kiểm tra thứ hạng log & bài kiểm tra Mantel-Haenszel - cho trọng số tương đương với mọi thời điểm.

Để câu hỏi trong tầm tay. Thử nghiệm cấp bậc log trên thực tế là một hình thức của thử nghiệm Mantel-Haenszel được áp dụng cho dữ liệu sinh tồn. Thử nghiệm Mantel-Haenszel thường được sử dụng để kiểm tra tính độc lập trong các bảng dự phòng phân tầng.

Nếu chúng ta cố gắng áp dụng thử nghiệm MH cho dữ liệu sinh tồn, chúng ta có thể bắt đầu bằng cách giả sử rằng các sự kiện tại mỗi thời điểm thất bại là độc lập. Chúng tôi sau đó phân tầng theo thời gian thất bại. Chúng tôi sử dụng các phương thức MH cho bằng cách biến mỗi lần thất bại thành một tầng. Không ngạc nhiên khi họ thường cho kết quả tương tự.

Ngoại lệ xảy ra khi có nhiều hơn một sự kiện xảy ra đồng thời - nhiều trường hợp tử vong tại cùng một thời điểm. Tôi không thể nhớ cách điều trị sau đó khác nhau. Tôi nghĩ rằng bài kiểm tra thứ hạng trung bình tính theo thứ tự có thể có của các lần thất bại bị ràng buộc.

Vì vậy, kiểm tra thứ hạng log là thử nghiệm MH cho dữ liệu sinh tồn và có thể xử lý các mối quan hệ. Tôi chưa bao giờ sử dụng thử nghiệm MH cho dữ liệu sinh tồn.


3

Tôi nghĩ rằng tôi đã tình cờ tìm thấy một trang web và tài liệu tham khảo giải quyết chính xác câu hỏi này:

http://www.graphpad.com/faq/viewfaq.cfm?faq=1226 Bắt đầu từ "Hai phương pháp được so sánh".

Trang web tham khảo tài liệu Berstein ars được liên kết (ở trên):

http://www.jstor.org/ sóng / 2530564? seq = 1

Trang web tóm tắt kết quả của Berstein và cộng sự độc đáo, vì vậy tôi sẽ trích dẫn nó:

Cả hai thường cho kết quả giống hệt nhau (hoặc gần giống nhau). Nhưng kết quả có thể khác nhau khi một số đối tượng chết cùng một lúc hoặc khi tỷ lệ nguy hiểm khác xa 1.0.

Bernsetin và các đồng nghiệp đã phân tích dữ liệu mô phỏng bằng cả hai phương pháp (1). Trong tất cả các mô phỏng của họ, giả định về các mối nguy theo tỷ lệ là đúng. Hai phương pháp đã cho các giá trị rất giống nhau. Phương thức logrank (mà chúng gọi là phương pháp O / E) báo cáo các giá trị gần với 1.0 hơn Tỷ lệ rủi ro thực sự, đặc biệt là khi tỷ lệ nguy hiểm lớn hoặc kích thước mẫu lớn.

Khi có quan hệ, cả hai phương pháp đều kém chính xác. Các phương pháp logrank có xu hướng báo cáo các tỷ lệ nguy hiểm thậm chí gần với 1.0 (vì vậy tỷ lệ nguy hiểm được báo cáo là quá nhỏ khi tỷ lệ nguy hiểm lớn hơn 1.0 và quá lớn khi tỷ lệ nguy hiểm nhỏ hơn 1.0). Ngược lại, phương pháp Mantel-Haenszel báo cáo các tỷ lệ nguy hiểm cao hơn 1.0 (vì vậy tỷ lệ nguy hiểm được báo cáo là quá lớn khi tỷ lệ nguy hiểm lớn hơn 1.0 và quá nhỏ khi tỷ lệ nguy hiểm nhỏ hơn 1.0).

Họ đã không kiểm tra hai phương pháp với dữ liệu mô phỏng trong đó giả định về các mối nguy theo tỷ lệ là không đúng. Tôi đã thấy một bộ dữ liệu trong đó hai ước tính về HR rất khác nhau (theo hệ số ba) và giả định về các mối nguy theo tỷ lệ là không rõ ràng đối với các dữ liệu đó. Có vẻ như phương pháp Mantel-Haenszel mang lại nhiều trọng lượng hơn cho sự khác biệt về mối nguy hiểm vào thời điểm muộn, trong khi phương pháp logrank cho trọng lượng tương đương ở mọi nơi (nhưng tôi chưa khám phá chi tiết này). Nếu bạn thấy các giá trị nhân sự rất khác nhau với hai phương pháp, hãy suy nghĩ xem liệu giả định về các mối nguy theo tỷ lệ có hợp lý hay không. Nếu giả định đó không hợp lý, thì dĩ nhiên toàn bộ khái niệm về một tỷ lệ rủi ro duy nhất mô tả toàn bộ đường cong là không có ý nghĩa

Trang web cũng đề cập đến bộ dữ liệu trong đó "hai ước tính nhân sự rất khác nhau (theo hệ số ba)" và cho rằng giả định PH là một cân nhắc quan trọng.

Sau đó tôi nghĩ, "Ai là tác giả của trang web?" Sau một hồi tìm kiếm tôi thấy đó là Harvey Motulsky. Vì vậy, Harvey tôi đã quản lý để tham khảo bạn trong việc trả lời câu hỏi của riêng bạn. Bạn đã trở thành người có thẩm quyền!

Là "tập dữ liệu vấn đề" là một tập dữ liệu có sẵn công khai?


Tôi đã tìm ra câu trả lời hai ngày trước, và đăng nó ở đây như một câu trả lời mới. Sau đó tôi cũng mở rộng và cập nhật trang web tại graphpad.com mà bạn tìm thấy. Tôi vừa chỉnh sửa trang đó một lần nữa để bao gồm một liên kết đến tệp Excel với dữ liệu sự cố ( graphpad.com/faq/file/1226.xls ). Tôi không thể làm điều đó cho đến khi tôi được sự cho phép của anh chàng đã tạo ra dữ liệu (anh ta muốn ẩn danh và dữ liệu được dán nhãn mơ hồ).
Harvey Motulsky
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.