Số lượng các số liệu quan trọng để đặt trong một bảng?


13

Có một quy tắc thành lập tốt cho số lượng các nhân vật quan trọng để công bố?

Dưới đây là một số ví dụ / câu hỏi cụ thể:

  • Có cách nào liên quan số lượng các số liệu có ý nghĩa với hệ số biến đổi không? Ví dụ: nếu ước tính là 12,3 và CV là 50%, điều đó có nghĩa là thông tin được biểu thị bằng '.3' tiếp cận bằng 0?

  • Nếu một khoảng tin cậy có một phạm vi các đơn đặt hàng có độ lớn, thì chúng vẫn có cùng số lượng các số liệu có ý nghĩa, ví dụ:

    12.3 (1.2, 123.4) so ​​với 12 (1.2, 120)

  • Số lượng các số liệu có ý nghĩa trong một ước tính lỗi là bằng hoặc ít hơn số lượng các số liệu có ý nghĩa trong một giá trị trung bình?


Nếu bạn có thể, đừng sử dụng bảng :) Đồ họa là IMO, hầu như luôn dễ đọc hơn bảng (ngoại lệ rõ ràng là nếu bạn không có nhiều số). Các tạp chí và người đánh giá của họ không phải lúc nào cũng đồng ý, thật không may ....
JMS

3
@JMS Điểm tốt, nhưng Bảng rất hữu ích để tóm tắt các đặc điểm chi tiết của các đơn vị thống kê (được phân loại chéo theo sở thích yếu tố, ví dụ chẩn đoán lâm sàng hoặc bất cứ điều gì), với các biến số của các loại khác nhau (liên tục, danh nghĩa và thứ tự) và các kết quả khác từ mô hình thống kê trên mỗi se (ma trận nhầm lẫn, hệ số hồi quy, v.v.) sẽ không phù hợp với Hình (hoặc không phải lúc nào cũng đúng nếu bạn nghĩ về phương pháp của Gelman để hiển thị reg. coef. như dotcharts). Chúng tôi cần cả hai; câu hỏi là khi nào chúng ta thực sự cần một Hình thay vì Bảng, IMO.
chl

@ Hội chợ. Tôi đã nói gần như luôn luôn :). Những thứ như bảng n-way lớn là không thể (hoàn toàn) sao chép đồ họa. Nó phụ thuộc vào diễn đàn mà tôi muốn nói. Các bảng có lợi ích là đầy đủ, chắc chắn, nhưng người đọc của bạn có thực sự tiếp thu tất cả thông tin bổ sung đó không? Nếu có quá nhiều tham số phù hợp với biểu đồ, tôi cho rằng một bảng thường ít nhất là khó đọc. Tuy nhiên, tôi nghĩ rằng kết quả hoàn chỉnh nên có thể truy cập được (trực tuyến, phụ lục, v.v.) nếu không có gì khác ngoài khả năng tái tạo. Trong trường hợp đó tôi cũng muốn dữ liệu & mã! OT lang thang, xin lỗi ..
JMS

Ngoài ra, tôi nghĩ rằng các hệ số hồi quy và sự nhầm lẫn (tương quan, hiệp phương sai, ...) ma trận thường phù hợp hơn với màn hình đồ họa, dấu chấm hoặc tương tự cho biểu đồ trước và biểu đồ nhiệt hoặc biểu đồ cho phần sau.
JMS

@JMS Tôi đồng ý với quan điểm của bạn, nhưng trong trường hợp này có giới hạn về con số, một số trường hợp khác có phí hình. Ngoài ra, trong trường hợp này nếu người đọc lướt qua bảng và tập trung vào các số liệu được trình bày, thì họ sẽ không lãng phí thời gian để cố gắng tìm ra điểm của một nhân vật bí truyền. Nhưng tôi hoàn toàn hỗ trợ khả năng tái tạo, và trong khi tôi ở đó, tôi có thể (nếu tôi đi xung quanh nó) thêm một hình ảnh trực quan của bảng vào mã được đính kèm.
David LeBauer

Câu trả lời:


19

Tôi nghi ngờ có một quy tắc phổ quát vì vậy tôi sẽ không làm cho bất kỳ. Tôi có thể chia sẻ những suy nghĩ này và lý do đằng sau chúng:

  • Khi bản tóm tắt phản ánh chính dữ liệu - tối đa, tối thiểu, thống kê đơn hàng, v.v .-- sử dụng cùng một số lượng các số liệu quan trọng được sử dụng để ghi lại dữ liệu ở vị trí đầu tiên. Điều này cung cấp một đại diện nhất quán trong toàn bộ tài liệu liên quan đến độ chính xác của dữ liệu.

  • nn3n3030<n300

    -Lưu ý rằng CV không cung cấp thông tin hữu ích về vấn đề này.

    -Một số ước tính có thể thu được với độ chính xác cao. Chúng không phải được làm tròn để khớp với thứ khác. Chẳng hạn, giá trị trung bình của 1.000.000 số nguyên có thể là 10.977 với sai số chuẩn là 0,00602. Quyết định của tôi để viết trung bình đến ba chữ số thập phân (và 4-5 fig figs) dựa trên thứ tự độ lớn của SE, cho biết chữ số cuối cùng đáng tin cậy một phần. Quyết định viết SE cho ba hình sig (năm chữ số thập phân) là tùy ý hơn: hai hình ghép sig sẽ hoạt động; một người có lẽ sẽ không; bốn quả sung sig cũng sẽ hoạt động và phù hợp với 4-5 quả sung sig trong trung bình; hơn bốn quả sung sig sẽ là quá mức cần thiết. (Người ta có thể ước tính lỗi tiêu chuẩn của chính SE về thời điểm thứ tư của dữ liệu và sử dụng điều đó để xác định số lượng làm tròn thích hợp, nhưng hầu hết chúng ta không gặp rắc rối như vậy ...)

  • Báo hiệu cho người đọc khi bạn đang làm tròn đáng kể . Đặc biệt cẩn thận khi báo cáo đang thảo luận về kiểm tra thống kê . Lý do là mọi người có thể sử dụng công việc của bạn để kiểm tra tính toán của riêng họ. Đôi khi ngay cả một sự khác biệt nhỏ cũng có thể tiết lộ một lỗi. Bạn không muốn gây rắc rối vì bạn đã làm tròn 123 đến 120 và người khác, kiểm tra công việc, nhận được 123 và nghi ngờ một trong hai bạn đã sai.

  • Hãy kiên định . Bạn có thể mất một số độc giả nếu bạn liệt kê một giá trị là 123 tại một thời điểm và sau đó tham chiếu nó là 120.

  • Đừng nực cười . (Tôi tự động nghi ngờ sự bất tài khi tôi gặp các báo cáo cung cấp kết quả thống kê cho 15 hình ghép sig khi dữ liệu chỉ có hai hình ghép sig.)


2
+1 rất lớn của tôi vì nó thực sự có rất nhiều lời khuyên tốt. Đồng quan điểm, tôi muốn cho các sinh viên thấy rằng việc tóm tắt dữ liệu thu thập được từ các khảo sát (hoặc phiếu) là% với rất nhiều số thập phân mà không xem xét kích thước mẫu (điều này ảnh hưởng đến sai số chuẩn).
chl

0

Tôi muốn đề xuất 12 (1.2, 123.4). Bỏ qua .3 vì nó gần như vô nghĩa, nhưng nhiều người khi họ nhìn thấy (1.2, 120) sẽ cho rằng '0' cuối cùng trong 120 là đáng kể.


Tại sao bạn đề nghị bỏ qua một số thập phân cho thống kê quan tâm nếu bạn đồng ý hiển thị chúng trong các TCTD (nghĩa là, nếu nó vô nghĩa đối với 12, tại sao nó lại có ý nghĩa đối với 123.4)?
chl

@chl: nó không có nhiều ý nghĩa, nhưng bỏ qua nó có thể gây hiểu nhầm. Nếu tôi đặt vào 123.4, một người nào đó như bạn sẽ thấy các chữ số phụ và chỉ cần bỏ qua chúng, không có tác hại gì. Nếu tôi đặt vào 120, nhiều độc giả sẽ nghĩ rằng điều này chính xác đến 3 chữ số - xấu.
AVB

vẫn không rõ lý do tại sao bạn đề xuất 123.4 thay vì 123 (tại sao bỏ qua .3 nhưng không phải là .4 trong ví dụ?)
David LeBauer
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.