Tại sao glm () cung cấp ước tính và lỗi tiêu chuẩn trên thang liên kết?


7

Trong R, cả hai tham số ước tính glm()và lỗi tiêu chuẩn của chúng đều được cung cấp trên thang đo liên kết, như gần đây ai đó đã làm rõ với tôi ở đây . Thật hợp lý khi cung cấp cả các tham số và lỗi tiêu chuẩn của chúng trên cùng một tỷ lệ, nhưng tại sao không hiển thị cả hai trong thang đo ban đầu của dữ liệu? Tôi tưởng tượng rằng hầu hết mọi người quan tâm đến các ước tính trên quy mô ban đầu và biến đổi chúng hầu hết thời gian. Trong khi các ý kiến ​​cho câu hỏi này giải quyết câu hỏi về cách chuyển đổi ước tính tham số và các lỗi tiêu chuẩn của chúng, tôi vẫn tò mò về lý do tại sao các ước tính đó được cung cấp bởi chức năng summary()trên thang đo liên kết thay vì trên thang đo ban đầu.

Câu trả lời:


13

Khó biết chắc chắn, nhưng có một vài lý do quy mô liên kết là hữu ích.

  • Sử dụng các lỗi tiêu chuẩn như một bản tóm tắt về độ không đảm bảo thường đáng tin cậy hơn trên thang đo liên kết, trong đó miền của các tham số không bị ràng buộc và trong đó giả định rằng bề mặt khả năng xấp xỉ bậc hai (phân phối mẫu của các ước tính tham số là xấp xỉ Bình thường) có nhiều khả năng là hợp lý. Ví dụ: giả sử bạn có mô hình liên kết nhật ký với ước tính (trên thang đo liên kết) 1.0 và lỗi tiêu chuẩn 3.0. Trên thang đo liên kết, khoảng tin cậy là khoảng1±1,96×3. Nếu bạn chuyển đổi ngược lại, lũy thừa tham số và nhân lỗi tiêu chuẩn với tham số lũy thừa (như trong câu trả lời này ), sau đó thử xây dựng các TCTD đối xứng, bạn sẽ nhận được2.718±1,96×3×2.718, bao gồm các giá trị âm ... nếu bạn muốn chuyển đổi ngược lại, sẽ có ý nghĩa hơn khi chuyển đổi ngược lại các khoảng tin cậy , nghĩa làđiểm kinh nghiệm(1±1,96×3).
  • Có lẽ quan trọng hơn, đối với liên kết logit rất phổ biến, về cơ bản không thể chuyển đổi ngược lại các tham số theo tỷ lệ dữ liệu (nghĩa là từ tỷ lệ logit / tỷ lệ cược log-tỷ lệ thành xác suất). Thông thường là lũy thừa các tham số để chuyển từ tỷ lệ tỷ lệ cược log sang tỷ lệ tỷ lệ cược, nhưng bạn không thể quay lại từ tỷ lệ cược thành xác suất mà không chỉ định giá trị cơ bản. Nghĩa là, bạn có thể nói chung "tỷ lệ chênh lệch liên quan đến kiểm soát so với điều trị là XXX", nhưng sự thay đổi xác suất từ kiểm soát sang điều trị sẽ phụ thuộc vào các hiệp phương sai khác (ví dụ: tỷ lệ chênh lệch giữa nữ và nam có thể giống nhau trong khi sự thay đổi xác suất là khác nhau vì rủi ro cơ bản là khác nhau đối với nữ và nam).

Có lẽ lý do gần nhất là vì các vấn đề được liệt kê ở trên, hầu hết những người thực hiện nhiều mô hình thống kê đã quen với việc diễn giải các tham số trên thang đo liên kết; hầu hết các nhà dịch tễ học và nhà sinh học phải dành thời gian tìm hiểu về tỷ lệ cược và tỷ lệ cược log-log, và có rất nhiều bài báo viết về cách giải thích của họ. Dù tốt hay xấu, R được viết bởi những người thoải mái diễn giải các tham số trên thang đo liên kết. Nhiều gói xuôi dòng như chổi có các tùy chọn sẽ lũy thừa các tham số và CIs cho bạn (đưa chúng lên thang đo dữ liệu (đếm) cho liên kết nhật ký; thang tỷ lệ chênh lệch cho liên kết logit và thang tỷ lệ rủi ro cho liên kết guốc) .


Cảm ơn nhiều. Tôi sẽ cần một chút thời gian để hiểu điểm thứ hai của bạn (không phải vì sự thiếu rõ ràng từ phía bạn). Về điểm đầu tiên của bạn, nó rung chuông khi một đồng nghiệp cũ của tôi từng giải thích cho tôi về việc sử dụng mở rộng Taylor để nghiên cứu lan truyền lỗi. Tại sao Taylor mở rộng không cung cấp các lỗi tiêu chuẩn thực sự? Có phải vì đó là một phương pháp chung thiếu các giả định cụ thể theo tình huống (trong trường hợp này, SE nên tạo ra CI dương trong trường hợp dữ liệu đếm)?
Marco Plebani

2
Việc mở rộng Taylor không đưa ra các lỗi tiêu chuẩn hợp lý (mặc dù [tôi nghĩ] chúng sẽ không chính xác nếu phân phối lấy mẫu có thời điểm cao hơn không), nhưng vấn đề chính không nằm ở lỗi tiêu chuẩn, mà là do dịch từ lỗi tiêu chuẩn sang TCTD
Ben Bolker

Cảm ơn. Tôi vẫn chưa rõ tại sao việc mở rộng Taylor sẽ tạo ra các ước tính hợp lý về SE, nhưng chúng có thể chuyển thành các ước tính không hợp lý của CI. Ngoài ra, tôi đã thử nghiệm các phương pháp khác nhau để có được ước tính erorr tiêu chuẩn, và điều đó đã mở ra một lon giun hoàn toàn mới. Tôi đã tạo một câu hỏi ad hoc: stats.stackexchange.com/questions/355431/ Ấn - Chúc mừng
Marco Plebani

2
Hãy xem xét một phân phối cực kỳ sai lệch (giả sử, một phân phối theo cấp số nhân). Giá trị trung bình lý thuyết và độ lệch chuẩn là giống hệt nhau (ví dụ: xem Wikipedia . Vì vậy, giới hạn dưới của khoảng tin cậy Wald 95% (nghĩa là độ lệch dựa trên độ lệch chuẩn / giả định của Normality) luôn âm.
Ben Bolker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.