Các từ phổ biến có ý nghĩa thống kê cụ thể


12

Tôi không phải là một nhà thống kê nhưng công việc nghiên cứu của tôi liên quan đến thống kê (phân tích dữ liệu, đọc tài liệu, v.v.). Một lần nữa tôi đã được nhắc nhở từ một bình luận về một trong những câu hỏi của tôi được đăng ở đây rằng có một số từ phổ biến có ý nghĩa hoặc ý nghĩa đặc biệt cụ thể cho những người thực hành tốt trong lĩnh vực thống kê.

Sẽ rất hữu ích khi có một danh sách các từ như vậy và có thể là cụm từ cùng với một số bình luận.


1
Âm thanh như một ứng cử viên cho Cộng đồng Wiki .
Glen_b -Reinstate Monica

@Glen_b Nó có thể biến thành một số đặc biệt lớn, với điều kiện là bất kỳ thuật ngữ nào trong thống kê hoặc toán học sẽ đủ điều kiện. Có cách nào để thu hẹp phạm vi của câu hỏi này một cách có ý nghĩa?
whuber

3
@whuber Vâng, có một mối nguy hiểm nó trở nên quá rộng. Liệu một cái gì đó như "thường tạo ra sự nhầm lẫn" đủ để thu hẹp phạm vi?
Glen_b -Reinstate Monica

Tôi nghĩ rằng các nhà thống kê có thẩm quyền thường có khả năng sử dụng tốt ngôn ngữ mẹ đẻ của họ và sẽ nhận thức rõ khi họ sử dụng biệt ngữ cần được giải thích chính xác cho khán giả.
Robert Jones

@Glen_b Tôi không chắc. Nó rộng đến mức tôi chỉ có thể bắt đầu một danh sách các từ cần được đề cập: độ chính xác, độ lệch, hiệu chuẩn, phân biệt đối xử, liên tục, phân phối, nguy hiểm, tồn tại, spline, mô hình, phản hồi, bootstrap, điều chỉnh, cụm, điều kiện, độ tin cậy, mật độ , ước tính, biến, chính tắc, tương quan, dự đoán, suy luận, kiểm duyệt, rủi ro, phù hợp, logistic, giới hạn, bảo hiểm, gây nhiễu, dự phòng, hội tụ, tương ứng, tự do, lệch lạc, cực đại, phạm vi, bình thường, thả , đã giải thích [biến thể], yếu tố, thất bại, điền vào, vừa vặn, vừa vặn, chức năng, ...
whuber

Câu trả lời:


12

" đáng kể " - ở đây, cách sử dụng ngôn ngữ phổ biến của từ này có nghĩa là "quan trọng" hoặc "có ý nghĩa". Ý nghĩa thống kê gần hơn với "có thể được phân biệt từ biến thể ngẫu nhiên về null"; nó không có nghĩa là sự khác biệt đủ lớn để quan trọng.

Dưới đây là một số ví dụ trong đó sự khác biệt này có thể là nguyên nhân của một số nhầm lẫn: 1 2

" tham số " - dường như thường xảy ra - đặc biệt là trong các thí nghiệm khoa học - rằng từ 'tham số' được sử dụng theo cách một nhà thống kê sẽ sử dụng từ 'biến'. Wikipedia đặt nó như vậy:

Tham số thống kê là tham số lập chỉ mục một họ phân phối xác suất. Nó có thể được coi là một đặc tính số của dân số hoặc mô hình

Ví dụ trong đó bài này có thể là một vấn đề: 1 - có lẽ là bài đăng dẫn đến câu hỏi này. (Tôi đã thấy một cái khác gần đây nhưng tôi không thể tìm thấy nó ngay bây giờ)


11

"Lỗi" - Trong thống kê, điều này thường có nghĩa là bất kỳ sai lệch nào giữa giá trị được quan sát và dự đoán. Trong cuộc sống thực, nó có nghĩa là một sai lầm.


11

Tôi tìm thấy một bài báo được giới thiệu từ năm 2010 xem xét câu hỏi này.

Anderson-Cook CM. Biệt ngữ ẩn: Từ hàng ngày với ý nghĩa cụ thể để thống kê.ICOTS8, Hội nghị quốc tế về thống kê giảng dạy, Ljubljana, Slovenia, 11-17 tháng 7 năm 2010.

Bài viết có sẵn trực tuyến miễn phí , vì vậy tôi chỉ cung cấp một danh sách một phần các điều khoản mà tác giả thảo luận:

 confounding, control, factor, independent, random, uniform

10

Tôi đã gặp phải vấn đề sử dụng "giả mạo" như trong "giả mạo một giả thuyết", trong khi những người khác nghĩ rằng tôi đang đề cập đến "tạo nên dữ liệu". Ngoài ra " thiên vị " là gần như không thể đề cập mà không gây nhầm lẫn.


6

"Bình thường" - Trong lời nói thông thường, phương tiện bình thường như mong đợi, không nằm ngoài điều bình thường. Trong thống kê, nếu một biến được phân phối bình thường, thì nó đề cập đến phân phối Gaussian. Tôi không tin rằng đó là tiêu chuẩn để viết hoa từ "bình thường" để phân biệt với ý nghĩa lời nói thông thường.

"Chuẩn hóa / chuẩn hóa" - Trong thống kê, để chuẩn hóa một biến có nghĩa là trừ đi giá trị trung bình và chia cho độ lệch chuẩn.

"Độ lệch chuẩn so với sai số chuẩn" - Độ lệch chuẩn thường được tính bằng toàn bộ dân số trong khi sai số chuẩn được tính bằng mẫu.


1
Tôi thực sự nghi ngờ rằng "lỗi tiêu chuẩn" là một từ "thông thường, không thống kê]" với ý nghĩa thống kê đặc biệt khác với các cách sử dụng khác của từ đó (cụm từ, thực sự). Ditto cho "bình thường hóa" và "độ lệch chuẩn."
whuber

Có thể không phải "bình thường hóa", nhưng "bình thường" là một điểm tốt, và do đó sẽ là "tiêu chuẩn hóa", cũng được sử dụng để mô tả các bài kiểm tra nhằm thiết lập các tiêu chuẩn quốc gia (ví dụ, trong giáo dục, chẳng hạn như ở Hoa Kỳ sau khi không còn trẻ em Phía sau). Tôi đồng ý rằng "độ lệch chuẩn" không có khả năng gây nhầm lẫn, mặc dù "độ lệch" theo cách nói chung có thể có nhiều khả năng mang ý nghĩa tiêu cực (đặc biệt là từ đồng nghĩa với "độ lệch").
Nick Stauner

Dưới đây là một cách khác để phân biệt SD và SEM. Độ lệch chuẩn định lượng sự biến đổi hoặc phân tán. Một lỗi tiêu chuẩn định lượng độ chính xác của một giá trị được tính toán.
Harvey Motulsky 31/12/13

@HarveyMotulsky Tôi nghĩ cách tốt nhất là nghĩ về một tiểu hành tinh (hình dạng không đều). Trung tâm khối lượng của tiểu hành tinh là gì? Đó là điểm tương đương với tất cả các điểm khác. Đó là ý nghĩa. Độ lệch chuẩn là gì? Đó là khoảng cách "trung bình" của mỗi điểm từ tâm, một thước đo kích thước. SEM là gì? Nó cho bạn biết bạn chắc chắn như thế nào về vị trí trung tâm của tiểu hành tinh.
31/12/13

Tôi thấy rằng lỗi tiêu chuẩn là độ lệch chuẩn được tính bằng cách sử dụng "mẫu" một chút đáng tiếc. Đó sẽ là căn bậc hai của phương sai mẫu đối với tôi, trong khi lỗi tiêu chuẩn là độ lệch chuẩn của thống kê kiểm tra. Ngoài ra, từ các thuật ngữ trên chỉ "bình thường" có vẻ thực sự phổ biến. Nhưng tôi đoán đó là bình thường ...
có nghĩa là

2

"Tham số" so với "Không tham số": loại kiểm tra yêu cầu dữ liệu "Bình thường" hoặc "không bình thường". Các xét nghiệm tham số được ưa thích để không tham số.

Các xét nghiệm phổ biến: T-test (ghép nối), Mann-Whitney U, ANOVA, Anderson-Darling, v.v.

Các điều khoản khác bao gồm "đáng kể". Đây là thước đo nếu dữ liệu chỉ ra giả thuyết của bạn có hợp lệ hay không. Khi bạn kiểm tra giả thuyết của mình ở một mức độ khả năng nhất định (thường là 95%), "giá trị p" dưới 0,05 sẽ chỉ ra rằng bạn sẽ từ chối "giả thuyết khống" (nghĩa là bộ dữ liệu không khác nhau) và chấp nhận " giả thuyết thay thế "(tức là các bộ dữ liệu là khác nhau).


2

Skewed trong thống kê ngụ ý không đối xứng trong phân phối.

Trong ngôn ngữ thông thường, và ngay cả trong khoa học, xiên thường được sử dụng (và ngày càng?) Có nghĩa là những gì người thống kê thường gọi là thiên vị , như trong "Kết quả về chiều cao trung bình bị lệch bởi rất nhiều cầu thủ bóng rổ".


2

Ước tính - Trong thống kê, nó là kết quả của một phép tính. Ví dụ, giá trị trung bình mẫu là ước tính trung bình dân số và khoảng tin cậy của giá trị trung bình là ước tính khoảng của trung bình dân số. Đây là cả hai kết quả tính toán chính xác. "Ước tính" là một khái quát chính xác của việc cố gắng suy luận về dân số từ dữ liệu trong một mẫu.

Trong sử dụng thông thường, ước tính từ có nghĩa là một phỏng đoán hoặc linh cảm, hoặc kết quả của một phép tính gần đúng.


2

Khả năng - theo cách nói thông thường là từ đồng nghĩa của xác suất , nhưng trong thống kê có mối quan hệ nghịch đảo cụ thể với xác suất, trong đó, đối với bất kỳ bộ tham số nàoθ và tập dữ liệu X, L(θ|X)= =Pr(X|θ).

Đại diện - có một số ý nghĩa đôi khi mâu thuẫn trong cả cách nói hàng ngày và khoa học. Tham khảo Kruskal & Mosteller 1979a , 1979b , 1979c1980 . Hầu hết các nhà thống kê mà tôi biết sẽ xem xét một đại diện mẫu nếu nó được lấy mẫu với xác suất đã biết; hầu hết giáo dân mà tôi biết sẽ coi đó là đại diện nếu các phân phối cận biên gần giống với dân số.


2
  • Mẫu : trong khi trong thống kê, điều này đề cập đến một tập hợp các trường hợp , trong nhiều ngành khác, một mẫu là một mẫu vật lý . Tất nhiên, cỡ mẫu cũng không rõ ràng, tham chiếu đến số lượng các trường hợp trong mẫu thống kê hoặc kích thước vật lý (khối lượng, thể tích, ...) của mẫu thử.

  • Độ nhạy : đối với chẩn đoán y khoa tỷ lệ các trường hợp bệnh được công nhận bởi xét nghiệm. Trong hóa học phân tích: độ dốc của đường chuẩn (xem bên dưới).

  • Tính đặc hiệu : trong chẩn đoán y khoa tỷ lệ các trường hợp không mắc bệnh này được công nhận chính xác bởi xét nghiệm. Trong hóa học phân tích, một phương pháp là cụ thể nếu không có độ nhạy chéo.

  • Hiệu chuẩn : thực sự, hai ý nghĩa đã được liệt kê để thống kê trong bài viết Wiki. Trong hóa học và vật lý, ý nghĩa hồi quy ngược là thông thường. Nhầm lẫn phát sinh, mặc dù:

    • Trong hóa học, mô hình hiệu chuẩn (chuyển tiếp) tín hiệu đo được Tôi phụ thuộc vào nồng độ c: Tôi= =f(c). Dự đoán sau đó giải quyết cho sự tập trungc: c= =f-1(Tôi). Mô hình hiệu chuẩn nghịch đảoc= =f(Tôi). Do đó, mô hình chuyển tiếp đồng ý với quan hệ nhân quả (nồng độ chất phân tích gây ra tín hiệu, không phải theo cách khác), nhưng mô hình nghịch đảo hướng được sử dụng cho các dự đoán.
      (Trong thực tế, thường có thể nói rằng lỗi trênc hoặc lỗi trên Tôi lớn hơn nhiều so với hướng khác và hướng mô hình thích hợp là / nên được chọn từ đó)
    • Tôi đã thấy các lô xác suất dự đoán so với xác suất thực được gọi là "các lô hiệu chuẩn" (số liệu thống kê người). Trong hóa học phân tích, đồ thị hiệu chuẩn tương ứng sẽ được dự đoán xác suất trên tín hiệu đo (thường là một số đơn vị khác). Biểu đồ dự đoán trên biến phụ thuộc thực thường sẽ được gọi là đường cong phục hồi .
  • Bộ xác thực : ở đây tôi muốn thu hút sự chú ý đến việc sử dụng các thuật ngữ có khả năng gây nhầm lẫn mà tôi nghĩ đã phát sinh trong các lĩnh vực liên quan đến thống kê khác nhau, mặc dù tôi lại tương phản. Trong bối cảnh xác thực lồng ghép / tối ưu hóa kép hoặc tối ưu hóa so với xác nhận / kiểm tra, một dòng thuật ngữ chia tách đào tạo - xác thực - kiểm tra và sử dụng bộ "xác thực" để tối ưu hóa siêu âm.
    Ví dụ, trong các yếu tố của học thống kê, p. 222 trong lần xuất bản thứ 2 :

    ... chia tập dữ liệu thành ba phần: tập huấn luyện, tập xác thực và tập kiểm thử. Bộ đào tạo được sử dụng để phù hợp với các mô hình; bộ xác nhận được sử dụng để ước tính lỗi dự đoán cho lựa chọn mô hình; bộ kiểm tra được sử dụng để đánh giá lỗi tổng quát hóa của mô hình được chọn cuối cùng.

    Ngược lại, ví dụ trong xác nhận hóa học phân tích là quy trình chứng minh rằng mô hình (thực ra, việc đánh giá mô hình cuối cùng chỉ là một phần của việc xác thực phương pháp phân tích) hoạt động tốt cho ứng dụng và đo lường hiệu suất của nó, xem ví dụ John K. Taylor: Xác nhận các phương pháp phân tích, Hóa học phân tích 1983 55 (6), 600A-608A hoặc hướng dẫn của các tổ chức như FDA. Đây sẽ là "thử nghiệm" trong dòng thuật ngữ khác, trong đó "xác nhận" thực sự được sử dụng để tối ưu hóa.
    Sự khác biệt quan trọng là, các kết quả "xác thực tối ưu hóa" sẽ được sử dụng để thay đổi (chọn) mô hình, trong khi thay đổi trong phương pháp phân tích được xác thực (bao gồm cả mô hình phân tích dữ liệu) có nghĩa là bạn phải xác nhận lại (tức là chứng minh rằng phương thức vẫn hoạt động như được cho là hoạt động).


Nếu bạn tình cờ phải nói chuyện với các nhà hóa học, một tài liệu tham khảo tốt về thuật ngữ hóa học phân tích là Danzer: Hóa học phân tích - Cơ sở lý thuyết và đo lường, DOI 10.1007 / b103950

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.