Sự khác biệt giữa sai lệch, sai lệch hệ thống và lỗi hệ thống?


9

Có sự khác biệt nào giữa các điều khoản sau đây hay chúng giống nhau không?

  1. Thiên kiến
  2. Sai lệch hệ thống
  3. Lỗi hệ thống

Nếu có tồn tại một số khác biệt sau đó, xin vui lòng giải thích chúng. Những lỗi này có thể được giảm khi tăng kích thước mẫu không?

CẬP NHẬT: Lĩnh vực quan tâm của tôi là suy luận thống kê. Tôi muốn nói rằng làm thế nào chúng ta phân biệt các thuật ngữ này như một thống kê.


1
Sẽ rất hữu ích khi chỉ ra lĩnh vực nghiên cứu mà bạn quan tâm. Rõ ràng từ các câu trả lời đã được cung cấp, chẳng hạn, "bias" có ý nghĩa chuyên biệt khác với phân tích thống kê (trong lý thuyết ước tính, thiên vị là sự khác biệt giữa kỳ vọng của một người ước tính và giá trị của ước tính của nó). Câu hỏi của bạn hiện được gắn thẻ "dịch tễ học" bởi vì các câu trả lời hiện đến từ lĩnh vực đó, nhưng đó có thể hoặc không phải là điều bạn thực sự quan tâm.
whuber

1
Theo tôi hiểu, trong thống kê thiên vị là sự khác biệt giữa ước lượng và ước lượng , trong đó trong dịch tễ học, thiên vị là sự khác biệt không ngẫu nhiên giữa ước lượng và ước lượng . Khi tôi thấy các thuật ngữ như 'sai lệch' và 'lỗi hệ thống' trong bối cảnh thống kê sinh học, tôi có xu hướng nghĩ về việc giải thích dịch tễ học. Nhưng sau đó, một lần nữa, là một sinh viên dịch tễ học, tôi thiên vị. Bộ slide này từ Sander Greenland chạm đến cả hai khái niệm, nhưng tập trung vào dịch tễ học.
jthetzel

Câu trả lời:


13

Thuật ngữ "thiên vị" xuất hiện theo hai cách trong tài liệu cơ bản về thống kê:

  1. "... sai lệch , đôi khi được gọi là lỗi hệ thống, ..." [EL Lehmann, Lý thuyết ước tính điểm, 1983. Điều này là một văn bản cổ điển.] Trong ký hiệu của Lehmann, là tiêu chuẩn, là kỳ vọng khi phân phối được đưa ra bởi tham số , là công cụ ước tính, là quan sát và là một thuộc tính của phân phối được ước tính (ước tính). Nói cách khác, quan sát (hoặc trình tự của nó) là một biến ngẫu nhiên, làm cho ước tính ngẫu nhiên và sai lệchEθ[δ(X)]-g(θ)EθθδXg(θ)là độ lệch dự kiến ​​giữa ước tính và ước tính. Nó phụ thuộc vào phân phối (không xác định nhưng đúng) , làm cho nó trở thành một chức năng của phân phối thực sự. Lehmann dành toàn bộ một chương cho những người ước tính không thiên vị: những người có độ lệch bằng 0 bất kể giá trị của .θθ

  2. Trong lý thuyết đo lường, "sai lệch" (hoặc "lỗi hệ thống" ) là sự khác biệt giữa kỳ vọng của phép đo và giá trị cơ bản thực sự. Xu hướng có thể là kết quả của lỗi hiệu chuẩn hoặc trôi dạt dụng cụ, ví dụ. Tương phản cách sử dụng này với trước đây: ở đây, sai lệch là một tính chất của phép đo, là một quá trình vật lý, trong khi trước đó nó là một thuộc tính của công cụ ước tính thống kê (là một quy trình được xác định theo toán học để đoán từ dữ liệu).

"Xu hướng hệ thống" dường như chỉ được sử dụng khi phân biệt sai lệch với "lỗi" ngẫu nhiên: thuật ngữ "lỗi" có xu hướng được sử dụng chủ yếu cho các thuật ngữ ngẫu nhiên với kỳ vọng bằng không.

Trong nhiều trường hợp, độ lệch theo nghĩa thứ nhất giảm khi lượng dữ liệu tăng: nhiều người ước tính sai lệch trong thực tế trở nên ngày càng ít sai lệch với nhiều dữ liệu hơn (mặc dù điều này không được đảm bảo về mặt lý thuyết, vì khái niệm sai lệch rất rộng). Một ví dụ điển hình là công cụ ước tính khả năng tối đa của phương sai của phân phối khi độc lập rút ra từ phân phối đó. Công cụ ước tính ML lànxTôi

v^= =1nΣTôi= =1n(xTôi-x¯)2,

cho . Nó được biết rằng điều này là thiên vị; công cụ ước tính không thiên vị. Từ đâu, như , trở nên tiệm không thiên vị.x¯= =1nΣTôi= =1nxTôinn-1v^nv^nn-1v^

Tuy nhiên, thiên vị trong bối cảnh đo lường (nghĩa thứ hai) thường không thể giảm bằng cách thực hiện nhiều phép đo hơn: độ lệch vốn có trong chính quy trình đo. Người ta phải ước tính và giảm độ lệch bằng cách hiệu chỉnh quy trình đo hoặc so sánh nó với các quy trình khác được biết là không có (hoặc ít hơn), ước tính độ lệch và bù cho điều đó.

Mô tả ngắn gọn về thuật ngữ này vì nó được sử dụng cho suy luận thống kê không thay thế cho các câu trả lời mở rộng và chuyên sâu hơn đã được đăng. Thay vào đó, nó được dùng để giới thiệu cho họ và như một lời cảnh báo nhẹ để cảnh giác với những khái quát phổ quát được thực hiện trong bối cảnh hạn chế, chẳng hạn như "cả ba [thuật ngữ] đều tương đương với 'lỗi hệ thống'," rõ ràng có thể đúng chỉ theo nghĩa hẹp, bởi vì hai định nghĩa tôi đã trích dẫn không tương đương. Đọc các câu trả lời khác đã cảnh báo tôi về khả năng tài liệu trong các lĩnh vực chuyên ngành như dịch tễ học có thể đang sử dụng các thuật ngữ thống kê tiêu chuẩn, quen thuộc như "thiên vị" theo những cách bất ngờ, một số trong đó thực sự có thể mâu thuẫn với các định nghĩa thống kê. Đến cuối cùng,


1
Cảm ơn bạn cho một bài viết thú vị. Tôi nghi ngờ rằng rất nhiều nhà dịch tễ học "mượn" thuật ngữ từ các nhà thống kê, điều chỉnh chúng theo bối cảnh của họ và sau đó ... do thiếu cơ sở âm thanh ... nó trở nên hơi lộn xộn
Max Gordon

@Max Gordon: whuber cung cấp một câu trả lời tuyệt vời. Có lẽ các lĩnh vực khác đã không vay mượn các thuật ngữ từ thống kê toán học, nhưng xác định các thuật ngữ cho phù hợp với các mục tiêu của lĩnh vực này. Bất kể, rất hữu ích cho các nhà thống kê, nhà dịch tễ học và những người khác để nhận thức được những khác biệt tinh tế nhưng quan trọng về thuật ngữ này, đặc biệt là sự phổ biến của các nỗ lực hợp tác liên ngành.
jthetzel

+1 câu trả lời tuyệt vời! Rất rõ ràng, và vẫn nghiêm ngặt và súc tích.
gung - Tái lập Monica

@jthtzel, các số liệu thống kê toán học không cần phải được hiểu là một cái gì đó có một số ý nghĩa. Đây là một khoa học dẫn đầu ứng dụng ngụ ý rằng nó quan tâm đến các vấn đề liên quan đến đo lường (thống kê) và sự thật tức là toán học. Cho đến nay, tài liệu cho thấy rằng lỗi đo lường hành xử ngẫu nhiên và do đó, một thống kê (trung bình và phương sai) vẫn không bị ảnh hưởng. Và trong trường hợp trung bình, cái gọi là sai lệch không đổi có thể làm cho nó tăng hoặc thấp hơn so với ước tính thực. Nhưng, phương sai và SD vẫn không bị ảnh hưởng.
Subhash C. Davar

4

Nếu tôi đã học được bất cứ điều gì thông qua các nghiên cứu dịch tễ học của tôi thì đây là lĩnh vực mỏ không có đúng hay sai. Tôi thích số liệu thống kê vì ít nhất nó có một nền tảng cơ bản trong toán học trong khi dịch tễ học có nhiều ý kiến ​​hơn. Điều đó nói rằng tôi sẽ cố gắng trả lời câu hỏi của bạn.

Từ M. Porta Một từ điển dịch tễ học lần thứ 5. không có đề cập đến sai lệch hệ thốnglỗi hệ thống nói rằng See See BIAS. Điều này để lại sự thiên vị được mô tả là: Sự sai lệch có hệ thống của các kết quả hoặc suy luận từ sự thật. Nghiêng dẫn đến kết quả hoặc kết luận có hệ thống (trái ngược với ngẫu nhiên) khác với sự thật. Tôi sẽ nói rằng không có sự thiên vị phi hệ thống vì tất cả chúng đều làm sai lệch kết quả của bạn so với ước tính rủi ro thực sự. Điều quan trọng nhất về sự thiên vị là bạn không thể giảm nó bằng cách tăng kích thước mẫu .

Có nhiều loại sai lệch, tôi đã nghe nói rằng một trong những bài viết gốc về thiên vị chứa hơn 300 loại khác nhau. Điều quan trọng là xác định chúng trước khi bạn bắt đầu nghiên cứu và sau đó cố gắng thiết lập nghiên cứu / thử nghiệm của bạn để tránh sai lệch. Trong các nghiên cứu dịch tễ học, rất hữu ích để phân tách thành kiến ​​thành ba loại:

  • Lựa chọn thiên vị
  • Sai lệch thông tin
  • Gây bối rối

Lựa chọn thiên vị là khi bạn chọn sai loại cá nhân cho nghiên cứu của bạn. Giả sử bạn quan tâm xem liệu làm việc trong mỏ than có rủi ro hay không - nếu bạn tìm kiếm các cá nhân nghiên cứu tại mỏ than, bạn có thể thấy rằng họ khỏe mạnh hơn dân số nói chung chỉ vì thực tế là những người đó Bệnh không còn làm việc tại mỏ than tức là bạn chọn những người khỏe mạnh nhất và bạn không còn nghiên cứu về nguồn dân mà là mẫu phụ. Sai lệch lựa chọn thường là loại sai lệch ác tính nhất vì rất khó xác định.

Sai lệch thông tin là khi bộ sưu tập dữ liệu của bạn liên quan đến kết quả hoặc tiếp xúc bị lỗi. Một lỗi phổ biến là bác sĩ phẫu thuật hỏi bệnh nhân của mình nếu anh ta khỏe hơn sau phẫu thuật. Ở đây, cả bệnh nhân có thể không muốn làm bác sĩ phẫu thuật thất vọng và báo cáo kết quả tốt hơn là anh ta / cô ta sẽ không muốn thừa nhận rằng phẫu thuật là một thất bại, báo cáo và phỏng vấn thiên vị.

Sai lệch thông tin còn được gọi là thiên vị quan sát. Khi đó là một lỗi trong một biến liên tục, đó là lỗi đo lường trong khi trong cài đặt phân loại, bạn có sai lệch phân loại. Phân loại sai có nghĩa là một cá nhân nghiên cứu có thể kết thúc trong danh mục sai, người hút thuốc có thể bị phân loại sai là người không hút thuốc hoặc do tình cờ hoặc do báo cáo sai lệch. Ngay cả khi phân loại sai là do tình cờ (phân loại sai không phân biệt), nó vẫn sẽ có xu hướng đánh giá thấp rủi ro theo cách có hệ thống, đặc biệt là khi bạn có một vài loại. Mặc dù một nghiên cứu xuất sắc của Jurek et al. Năm 2005 cho thấy bạn nên cẩn thận đưa ra giả định này dựa trên một nghiên cứu duy nhất. Liên quan đến câu hỏi của bạn, tôi có thể tưởng tượng rằng đây là sự thiên vị phi hệ thống của người Hồi giáo mà sự thiên vị có hệ thống liên quan.

Gây bối rối là các yếu tố liên quan đến cả phơi nhiễm và kết quả và liên quan chặt chẽ đến mor với cá nhân nghiên cứu. Ví dụ Lambe et al. Năm 2006 cho thấy hút thuốc khi mang thai làm tăng nguy cơ thành tích học tập thấp nhưng khi nhìn vào anh chị em trong một khu dân cư nơi người mẹ đã ngừng hút thuốc trong lần mang thai thứ hai thì thành tích học tập của họ cũng tệ như vậy. Điều này cho thấy hút thuốc không phải là nguyên nhân dẫn đến kết quả học tập tồi mà có lẽ là yếu tố gây nhiễu cho các yếu tố xã hội khác.

Bài viết này của Sica et al. Năm 2006 đi vào chi tiết hơn. Những gì bạn phải chuẩn bị là thực sự thiếu sự đồng thuận trong lĩnh vực thuật ngữ. Ước mơ của tôi là một ngày nào đó WHO đưa ra một danh sách các định nghĩa dễ hiểu, có ý nghĩa trực quan và nơi cuộc tranh luận cuối cùng có thể kết thúc.


Nếu bạn nói rằng sự thiên vị không bao giờ giảm sau đó, làm thế nào bạn sẽ biện minh cho định nghĩa này? 'Công cụ ước lượng không thiên vị là một công cụ ước tính không thiên vị vì kích thước mẫu có xu hướng vô cùng.'
Biuler

Tôi đồng ý với @jthetzel, tôi không chắc là tôi hiểu câu hỏi của bạn. Một ước tính không thiên vị là một nơi không có sai lệch và bạn có thể dựa vào kích thước mẫu của mình, dựa lưng và để các số liệu thống kê thực hiện công việc (... và vâng, có lẽ nó không bao giờ xảy ra trong thực tế khi bạn luôn có một số sai lệch ). Tôi cố gắng làm cho nó đơn giản: thiên vị đối với tôi luôn là một lỗi hệ thống nhưng như tôi đã nói - có rất nhiều cuốn sách về vấn đề này và thật không may, nhiều người được viết bởi những người hầu như không nắm được số liệu thống kê. Hỏi một nhà dịch tễ học về sửa đổi hiệu ứng - nhiều người (hầu hết?) Nghĩ rằng đó là một loại phép thuật ...
Max Gordon

4

Thuật ngữ có thể thay đổi từ lĩnh vực này sang lĩnh vực khác. Tuy nhiên, sử dụng các thuật ngữ được xác định trong các ý kiến ​​dưới đây:

Có sự khác biệt nào giữa các điều khoản sau đây hay chúng giống nhau không?

Không, cả ba đều tương đương với 'lỗi hệ thống'.

Những lỗi này có thể được giảm khi tăng kích thước mẫu không?

Không, tăng kích thước mẫu giảm lỗi ngẫu nhiên, không phải lỗi hệ thống.

Bình luận

Các thuật ngữ này được lấy từ lĩnh vực dịch tễ học, đặc biệt từ thảo luận của Rothman và các đồng nghiệp về lỗi trong chương 9 và 10 của Dịch tễ học hiện đại .

Để tóm tắt:

Mục tiêu của một điều tra viên là đưa ra ước tính chính xác về một số biện pháp (ví dụ: trung bình, rủi ro tương đối, tỷ lệ nguy hiểm, et cetera) trong dân số. Một ước tính chính xác là một ước tính vừa hợp lệ vừa chính xác . Ước tính hợp lệ sẽ có ước tính điểm (ví dụ: trung bình, rủi ro tương đối, tỷ lệ rủi ro, et cetera) gần với giá trị thực trong dân số. Một ước tính chính xác sẽ có mức độ tin cậy hẹp xung quanh ước tính điểm. Ngoài ra, một ước tính có thể có giá trị nội bộ, liên quan đến dân số nghiên cứu và có giá trị bên ngoài, liên quan đến dân số tổng quát.

Khởi hành từ độ chính xác là do lỗi . Có hai loại lỗi chính: lỗi hệ thống và lỗi ngẫu nhiên .

Lỗi hệ thống, thường được gọi là sai lệch, dẫn đến các ước tính không hợp lệ. Lỗi hệ thống bao gồm lỗi do nhầm lẫn, sai lệch lựa chọn và sai lệch thông tin. Nhầm lẫn nói chung có thể được sửa chữa bằng các kỹ thuật như phân tầng hoặc hồi quy. Sự lựa chọn và sai lệch thông tin theo truyền thống đã bị bỏ qua hoặc chỉ được đánh giá định tính trong các phân tích, có thể là do không quen thuộc với các phân tích thiên vị thích hợp. Tuy nhiên, các phương pháp phân tích sai lệch định mức tồn tại (ví dụ Lash TL và AK Fink (2003) ).

Kết quả lỗi ngẫu nhiên trong các ước tính không chính xác. Lỗi ngẫu nhiên bao gồm lỗi lấy mẫu và lỗi đo ngẫu nhiên, trong số những người khác. Các phương pháp để tăng độ chính xác bao gồm tăng quy mô nghiên cứu, tăng hiệu quả nghiên cứu và phân tích thống kê tối ưu hóa chính xác như gộp chung và hồi quy.

Cập nhật

Để minh họa tại sao việc tăng kích thước mẫu không làm giảm lỗi hệ thống với sự tương tự của bảng phi tiêu (được sao chép từ bài CV này ):

Tương tự phi tiêu

Cho dù có bao nhiêu phi tiêu được ném lên bảng, ước tính điểm sẽ không chuyển sang mắt bò thật khi có 'độ lệch cao'. Ở đây 'bias' tương đương với 'lỗi hệ thống' và 'phương sai' tương đương với 'lỗi ngẫu nhiên'.


Nếu bạn nói rằng sự thiên vị không bao giờ giảm sau đó, làm thế nào bạn sẽ biện minh cho định nghĩa này? 'Công cụ ước lượng không thiên vị là một công cụ ước tính không thiên vị vì kích thước mẫu có xu hướng vô cùng.'
Biuler

@biostat: Công cụ ước tính không thiên vị không chứa lỗi hệ thống, nhưng có thể chứa lỗi ngẫu nhiên. Do đó, khi kích thước mẫu tăng, phương sai giảm và công cụ ước tính hội tụ vào giá trị thực của tham số trong dân số. Công cụ ước tính sai lệch sẽ chứa lỗi hệ thống và sẽ không hội tụ giá trị thực của tham số trong dân số (trừ khi nhiều sai lệch trong công cụ ước tính xảy ra để triệt tiêu lẫn nhau).
jthetzel

@biostat: Có lẽ là một cách khác để nghĩ về nó: 1) Phân phối xác suất của công cụ ước tính sai lệch có thể bao gồm giá trị thực ở các cỡ mẫu nhỏ, trong số các giá trị khác, nhưng sẽ hội tụ một giá trị khác với giá trị thực vì kích thước mẫu có xu hướng vô cùng . 2) Phân phối xác suất không thiên vị của công cụ ước lượng không thiên vị có thể bao gồm giá trị thực ở các cỡ mẫu nhỏ, trong số các giá trị khác, nhưng sẽ hội tụ về giá trị thực vì kích thước mẫu có xu hướng vô cùng.
jthetzel

Vậy thì Bias và Systematic Error có giống nhau không? bởi vì ở đây thiên vị có thể có lỗi ngẫu nhiên như bạn nói? Bạn sẽ nghĩ sao?
Biuler

@biostat: Như đã nêu ở trên, thuật ngữ có thể khác nhau tùy theo từng lĩnh vực. Tôi xác định sai lệch là lỗi hệ thống. Bạn dường như được xác định thiên vị là lỗi. Trong dịch tễ học, thiên vị là lỗi hệ thống, ít nhất là đối với những người theo thuật ngữ của sách giáo khoa kinh điển của Rothman. Có lẽ bạn có thể thêm ngữ cảnh vào câu hỏi ban đầu của mình để điều khiển các câu trả lời theo hướng thích hợp.
jthetzel

1

Những trích đoạn power point này có một số thông tin để bổ sung cho những gì jthetzel và Max Gordon đã đưa ra. Họ hướng đến dữ liệu khảo sát và chúng không nghiêm ngặt hoặc chính thức, nhưng sau đó nếu bạn muốn loại câu trả lời đó có lẽ bạn sẽ tìm trong sách giáo khoa về lý thuyết đo lường hoặc phương pháp khảo sát.


2
Trong khi chúng tôi đang ở đó, đây là một bộ slide khác từ Greenland.
jthetzel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.