Số chữ số có nghĩa để báo cáo


12

Có cách nào khoa học hơn để xác định số chữ số có nghĩa để báo cáo về giá trị trung bình hoặc khoảng tin cậy trong một tình huống khá chuẩn - ví dụ: lớp học năm thứ nhất tại trường đại học.

Tôi đã thấy Số lượng các số liệu có ý nghĩa để đặt vào một bảng , Tại sao chúng ta không sử dụng các chữ số có nghĩaSố lượng các số liệu có ý nghĩa trong một hình vuông chi , nhưng những số này dường như không đặt ra vấn đề.

Trong các lớp học của tôi, tôi cố gắng giải thích với các học sinh của mình rằng thật lãng phí khi báo cáo 15 chữ số có nghĩa khi chúng có một lỗi tiêu chuẩn rộng như vậy trong kết quả của chúng - cảm giác ruột của tôi là nó nên được làm tròn đến một nơi nào đó theo thứ tự . Đây không phải là quá khác biệt so với những gì được nói bởi ASTM - Báo cáo kết quả kiểm tra đề cập đến E29, nơi họ nói rằng nó nên được giữa 0,05 σ0,5 σ .0.25σ0.05σ0.5σ

BIÊN TẬP:

Khi tôi có một bộ số như xdưới đây, tôi nên sử dụng bao nhiêu chữ số để in trung bình và độ lệch chuẩn?

set.seed(123)
x <- rnorm(30) # default mean=0, sd=1
# R defaults to 7 digits of precision options(digits=7)
mean(x) # -0.04710376 - not far off theoretical 0
sd(x) # 0.9810307 - not far from theoretical 1
sd(x)/sqrt(length(x)) # standard error of mean 0.1791109

CÂU HỎI: Đánh vần chi tiết độ chính xác là gì (khi có một vectơ số chính xác kép) cho giá trị trung bình và độ lệch chuẩn trong này và viết một hàm sư phạm R đơn giản sẽ in trung bình và độ lệch chuẩn cho số chữ số có nghĩa được phản ánh trong vector x.


Tôi không hiểu tại sao "Số lượng các số liệu quan trọng cần đặt trong một bảng" không giải quyết đầy đủ câu hỏi của bạn: câu hỏi đó bỏ sót điểm nào?
whuber

Tôi thích câu trả lời của bạn cho câu hỏi đó @whuber, nhưng tôi muốn biết thêm một chút chi tiết.
Sean

1
Nhưng chi tiết về cái gì? Trong mọi trường hợp, có vẻ như câu hỏi của bạn thực sự là một bản sao chính xác của câu hỏi đó và điều bạn muốn là nhìn thấy những cải tiến cho câu trả lời của nó . Tôi có đúng không? BTW, nếu bạn đang tìm kiếm hướng dẫn sư phạm, tôi muốn chỉ cho bạn một ví dụ (chuyên ngành) tôi đã đăng tại gis.stackexchange.com/questions/8650 về báo cáo tọa độ địa lý: ý tưởng đó là liên kết các con số có ý nghĩa chữ số với các đối tượng có kích thước hầu hết người đọc sẽ dễ dàng và nắm bắt bằng trực giác. Một cách tiếp cận tương tự có thể hoạt động tốt trong các ứng dụng khác.
whuber

1
@whuber vâng bạn đúng, và tôi thích ví dụ đó. Tôi cho rằng tôi đang tìm kiếm chi tiết hơn về độ chính xác liên quan đến độ lệch chuẩn. Ví dụ: trong R, x <- rnorm (30); trung bình (x); sd (x) # ở đây rõ ràng sd là khoảng 1 nhưng trong R, giá trị trung bình được in theo mặc định với 7 chữ số chính xác. sd (x) / 30 khoảng 0,18. Cảm ơn
Sean

Trong R(cũng như hầu hết tất cả các phần mềm), việc in ấn được kiểm soát bởi một giá trị toàn cầu (xem options(digits=...)), chứ không phải bởi bất kỳ sự xem xét nào về độ chính xác.
whuber

Câu trả lời:


9

Hướng dẫn về độ không đảm bảo trong đo lường (GUM) khuyến nghị rằng độ không đảm bảo được báo cáo không quá 2 chữ số và kết quả được báo cáo với số chữ số có nghĩa cần thiết để làm cho nó phù hợp với độ không đảm bảo. Xem Phần 7.2.2 dưới đây

http://www.bipm.org/utils/common/document/jcgm/JCGM_100_2008_E.pdf

Đoạn mã sau đây là nỗ lực của tôi để thực hiện khuyến nghị này trong R. Noe rằng R có thể không hợp tác với các nỗ lực giữ lại các số 0 ở đầu ra, ngay cả khi chúng có ý nghĩa.

gumr <- function(x.n,x.u) {
  z2 <- trunc(log10(x.u))+1
  z1 <- round(x.u/(10^z2),2)
  y1 <- round(x.n*10^(-z2),2)
  list(value=y1*10^z2,uncert=z1*10^z2)
}

x.val <- 8165.666
x.unc <- 338.9741
gumr(x.val,x.unc)

Để hoàn thiện: > gumr(x.val,x.unc) $value [1] 8170 $uncert [1] 340
rhombidodecahedron

@rhombidodecahedron không chắc chắn chỉ có một con số đáng kể ở đây? 82 ± 3 (× 10²)
JFS

@jfs đề xuất nói sử dụng hai con số quan trọng trong sự không chắc chắn, phải không?
rhombidodecahedron

@rhombidodecahedron câu trả lời cho biết "không quá 2" Các tiêu chí trong GUM không rõ ràng đối với tôi. Bảng 3 từ arxiv.org/pdf/1301.1034.pdf gợi ý 1 chữ số có nghĩa để báo cáo cho ít hơn 7 phép đo.
jfs

Mã ví dụ không tuân theo quy tắc GUM được đề xuất. Nếu val = 8165.666unc = 338.9741, đo lường phải được báo cáo như val = 8.17(34)*10^3(không val = 8170unc = 340như được đưa ra), để làm cho rõ ràng rằng chỉ có hai chữ số của sự không chắc chắn là rất lớn.
divenex

6

Nếu bạn hiển thị khoảng tin cậy cũng như giá trị của thống kê, thì không có vấn đề gì với việc đưa ra nhiều số liệu quan trọng như bạn muốn, vì trong trường hợp đó, một số lượng lớn các số liệu quan trọng không ngụ ý độ chính xác giả như khoảng tin cậy mang lại một dấu hiệu của độ chính xác thực tế có khả năng (một khoảng đáng tin cậy sẽ tốt hơn). Về cơ bản, đó là vấn đề làm cho bàn gọn gàng, súc tích và dễ đọc, do đó về cơ bản không có một quy tắc đơn giản nào phù hợp với tất cả các dịp.

Khả năng nhân rộng rất quan trọng trong các nghiên cứu khoa học, vì vậy lý tưởng nhất là có thể tái tạo kết quả cho bất kỳ số liệu nào có nguồn gốc (cho dù chúng có ý nghĩa thực tế hay không). Làm tròn đến một số lượng nhỏ các số liệu quan trọng có thể làm giảm sự tin tưởng vào một bản sao của một nghiên cứu vì các lỗi có thể được che dấu bằng cách làm tròn kết quả, do đó có thể có nhược điểm đối với làm tròn trong một số trường hợp.

Một lý do khác để không làm tròn quá xa là nó có thể khiến người khác không thể mở rộng nghiên cứu của bạn mà không thực sự lặp lại nó. Chẳng hạn, tôi có thể xuất bản một bài báo so sánh các thuật toán học máy khác nhau bằng cách sử dụng bài kiểm tra Friedman, tùy thuộc vào thứ hạng của các thuật toán khác nhau trên một tập hợp các bộ dữ liệu điểm chuẩn. Nếu số liệu thống kê cho các phân loại riêng lẻ trên mỗi tập dữ liệu được đưa ra cho một số số liệu quan trọng tùy thuộc vào lỗi tiêu chuẩn của chúng, điều này chắc chắn sẽ tạo ra nhiều mối quan hệ rõ ràng trong bảng xếp hạng. Điều này có nghĩa là (i) người đọc / người đánh giá bài báo sẽ không thể sao chép bài kiểm tra Friedman từ kết quả được đưa ra trong bài báo và (ii) người khác sẽ không thể đánh giá thuật toán của họ trên bộ dữ liệu điểm chuẩn và sử dụng Friedman kiểm tra để đưa nó vào bối cảnh của kết quả từ nghiên cứu của tôi.


4

Chắc chắn bất kỳ quyết định nào, được đưa ra một cách khách quan hay chủ quan, sẽ phụ thuộc mạnh mẽ vào những gì bạn đang đo và mức độ chính xác của công cụ đo lường của bạn. Cái sau chỉ là một phần của biến thể quan sát được, và không phải lúc nào cũng dễ dàng nhận ra hoặc tìm thấy bằng chứng hiện có. Vì vậy, tôi nghi ngờ không có quyết định áp dụng khách quan, phổ biến. Bạn chỉ cần sử dụng bộ não của bạn và đưa ra phán đoán tốt nhất trong từng tình huống.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.