Lỗi tiêu chuẩn được sử dụng để làm gì?


9

Tôi đang sử dụng một hướng dẫn mà tôi đã tìm thấy và vẽ các giá trị trung bình cùng với các lỗi tiêu chuẩn để hiển thị dữ liệu của mình. Nhưng tôi có một vấn đề thảo luận về kết quả. Âm mưu của tôi là như dưới đây: một số lỗi tiêu chuẩn (được hiển thị dưới dạng thanh lỗi) khác nhau rất nhiều và một số trong số chúng rất gần với không.

nhập mô tả hình ảnh ở đây


2
Một vấn đề phụ ở đây là việc sử dụng các thanh có khả năng chứng minh sự khó hiểu. Một cách tầm thường, thanh hướng xuống là công việc khó hơn một chút so với thanh hướng lên. Về cơ bản hơn, các thanh bắt đầu từ 1e-3 là tùy ý. Tích cực hơn, hiển thị ước tính điểm bằng ký hiệu điểm và thêm thanh lỗi sẽ đơn giản hơn nhiều so với hiển thị thanh cộng với thanh lỗi. Google "âm mưu nổ" để biết thêm.
Nick Cox

Tôi không chắc câu hỏi là gì. Dựa trên câu trả lời bạn đã đánh dấu đúng và tiêu đề có thể chỉ cần biết lỗi tiêu chuẩn là gì. Nhưng dựa trên những gì bạn có ở đây, có vẻ như bạn cần trợ giúp để mô tả dữ liệu. Bạn có thể vui lòng làm rõ trong câu hỏi? Ngoài ra, nếu bạn muốn trợ giúp mô tả dữ liệu thì vui lòng liên hệ nhiều hơn về dữ liệu, không chỉ là hình. N trong mỗi nhóm và ý nghĩa của các giá trị sẽ hữu ích. Bất kỳ biến đổi được thực hiện cũng sẽ hữu ích.
Giăng

Câu trả lời:


10

Các thanh lỗi nói chung là để thuyết phục người đọc cốt truyện rằng sự khác biệt mà cô ấy / anh ấy nhìn thấy trên cốt truyện có ý nghĩa thống kê. Trong một phép tính gần đúng, bạn có thể tưởng tượng một gaussian nhỏ mà phạm vi được hiển thị dưới dạng thanh lỗi này - "tích hợp trực quan" của một sản phẩm của hai gaussian như vậy ít có khả năng hai giá trị đó thực sự bằng nhau.±1σ

Trong trường hợp cụ thể này, người ta có thể thấy rằng cả sự khác biệt giữa thanh màu đỏ và màu tím cũng như màu xám và màu xanh lá cây không quá đáng kể.


Những gì về lỗi tiêu chuẩn trong trường hợp này? như các thanh lỗi được vẽ.
berkay

Đó là một thanh lỗi kém nếu đó là mục đích. Không chồng lấp của các thanh là không đủ cho ý nghĩa thống kê và số lượng không chồng lấp cần thiết để thực sự khác biệt đáng kể ở 0,05 thay đổi với N. Và cái quái gì "không quá đáng kể" có nghĩa là gì? Cả hai điều kiện bên lề mà bạn chỉ ra sẽ thất bại trong bài kiểm tra t.
Giăng

@ John Như tôi đã viết, các thanh lỗi là một đầu mối trực quan để giúp đánh giá ad hoc trong khi điều tra cốt truyện; kiểm tra thực tế cần một số giả thuyết để được kiểm tra, do đó rõ ràng nên xảy ra trong văn bản.

11

Nói chung, lỗi tiêu chuẩn cho bạn biết mức độ không chắc chắn của bạn là giá trị thực của đỉnh thanh là nơi thanh nói. Khi có nhiều thanh, nó cũng có thể cho phép so sánh giữa các thanh, theo nghĩa của một bài kiểm tra thống kê. Tuy nhiên, diễn giải chúng theo cách này đòi hỏi một số giả định, được hiển thị dưới dạng đồ họa. Nếu bạn thực sự quan tâm đến việc so sánh các thanh để xem sự khác biệt có ý nghĩa thống kê hay không, thì bạn nên chạy thử nghiệm trên dữ liệu và hiển thị thử nghiệm nào có ý nghĩa, như thế này.

so sánh ý nghĩa

Ngoài ra, tôi sẽ đề nghị sử dụng khoảng tin cậy thay vì lỗi tiêu chuẩn.

Bài viết này rất đáng để đọc:

Cumming và Finch. "Suy luận bằng mắt: Khoảng tin cậy và cách đọc hình ảnh của dữ liệu." Là tâm lý. Tập 60, số 2, 170 bóng180.

Kết luận chung của họ là: "Tìm kiếm các thanh liên quan trực tiếp đến các hiệu ứng quan tâm, nhạy cảm với thiết kế thử nghiệm và diễn giải các khoảng thời gian."

Đối với các mẫu độc lập, sử dụng khoảng tin cậy, sự chồng chéo một nửa của các TCTD có nghĩa là sự khác biệt có ý nghĩa thống kê.

thanh độc lập

Thay vào đó, đối với các mẫu độc lập sử dụng các thanh lỗi tiêu chuẩn, biểu đồ sau cho bạn biết cách tìm ra ý nghĩa thống kê:

thanh độc lập, SE


Đây không thực sự là một câu trả lời (chưa). Bạn có phiền khi tăng trích dẫn này với một số thông tin về cách giúp trả lời câu hỏi của OP không? (btw, tôi không phải là người hạ bệ)
gung - Tái lập Monica

1
@gung Cuộc sống thực sự can thiệp nên tôi đăng câu trả lời một phần. Cập nhật.
Ari B. Friedman

6

Như mbq nói, các thanh lỗi là một cách để người đọc của bạn cảm nhận được nếu sự khác biệt giữa hai nhóm là đáng kể - tức là nếu sự khác biệt trong mỗi nhóm của bạn đủ nhỏ để tin rằng sự khác biệt bạn tìm thấy có nghĩa là giữa các nhóm của bạn.

Tất cả những thứ khác đều bằng nhau, các thanh lỗi lớn hơn có nghĩa là sự khác biệt trong nhóm nhiều hơn, nhưng có vẻ như trục y của âm mưu của bạn được chuyển đổi theo log, vì vậy các nhóm thấp hơn không hoàn toàn ở cùng tỷ lệ với các nhóm cao hơn.

Bạn nên lưu ý, nhiều độc giả của bạn sẽ không hiểu thanh lỗi đại diện cho điều gì, ngay cả khi bạn giải thích rõ ràng về nó! Thường thì bạn có thể đạt được cùng một mục tiêu với một dấu chấm bị xáo trộn hoặc một ô vuông (hoặc cả hai cùng nhau) để đạt được hiệu quả tương tự.


liên quan đến bài báo mà bạn đề cập, đó là một quan sát thú vị, tuy nhiên nó không gây ngạc nhiên cho tôi. Tôi thấy một phần đáng kể của các khái niệm thống kê và thực tiễn phổ biến là khó hiểu và hỗn độn (mặc dù tôi có một nền tảng vững chắc về toán học, và đã tham gia một số khóa học về thống kê toán học). Cá nhân tôi cảm thấy rất nhiều khái niệm sẽ dễ hiểu hơn nhiều nếu chúng được dạy trực quan và sử dụng các ví dụ, thay vì giải thích bằng lời nói dài và phức tạp.
posdef

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.