Nếu chúng ta muốn thấy rõ sự phân phối của một dữ liệu liên tục, thì nên sử dụng dữ liệu nào trong biểu đồ và pdf?
Sự khác biệt, không phải là công thức khôn ngoan, giữa biểu đồ và pdf là gì?
Nếu chúng ta muốn thấy rõ sự phân phối của một dữ liệu liên tục, thì nên sử dụng dữ liệu nào trong biểu đồ và pdf?
Sự khác biệt, không phải là công thức khôn ngoan, giữa biểu đồ và pdf là gì?
Câu trả lời:
Để làm rõ điểm Dirks:
Nói rằng dữ liệu của bạn là một mẫu phân phối bình thường. Bạn có thể xây dựng cốt truyện sau:
Đường màu đỏ là ước tính mật độ thực nghiệm, đường màu xanh là pdf lý thuyết của phân phối chuẩn bên dưới. Lưu ý rằng biểu đồ được thể hiện ở mật độ chứ không phải tần số ở đây. Điều này được thực hiện cho mục đích âm mưu, nói chung tần số được sử dụng trong biểu đồ.
Vì vậy, để trả lời câu hỏi của bạn: bạn sử dụng phân phối theo kinh nghiệm (nghĩa là biểu đồ) nếu bạn muốn mô tả mẫu của mình và pdf nếu bạn muốn mô tả phân phối cơ bản được giả thuyết.
Cốt truyện được tạo bởi mã sau trong R:
x <- rnorm(100)
y <- seq(-4,4,length.out=200)
hist(x,freq=F,ylim=c(0,0.5))
lines(density(x),col="red",lwd=2)
lines(y,dnorm(y),col="blue",lwd=2)
Một biểu đồ là ước tính tuổi trước máy tính của mật độ. Một ước tính mật độ là một thay thế.
Ngày nay chúng ta sử dụng cả hai, và có một tài liệu phong phú về việc mặc định người ta nên sử dụng.
Mặt khác, pdf là một biểu thức dạng đóng cho một phân phối nhất định . Điều đó khác với việc mô tả tập dữ liệu của bạn với mật độ hoặc biểu đồ ước tính .
Không có quy tắc cứng và nhanh ở đây. Nếu bạn biết mật độ dân số của bạn, thì PDF là tốt hơn. Mặt khác, thông thường chúng ta xử lý các mẫu và biểu đồ có thể truyền tải một số thông tin mà mật độ ước tính bao phủ. Ví dụ, Andrew Gelman đưa ra quan điểm này:
Một lợi ích chính của biểu đồ là, như một biểu đồ của dữ liệu thô, nó chứa các hạt giống của đánh giá lỗi của chính nó. Hoặc, nói một cách khác, sự lởm chởm của biểu đồ hơi thiếu sáng thực hiện một dịch vụ hữu ích bằng cách chỉ ra trực quan biến thiên lấy mẫu. Đó là lý do tại sao, nếu bạn nhìn vào biểu đồ trong sách và các bài báo đã xuất bản, tôi chỉ luôn sử dụng rất nhiều thùng. Tôi cũng gần như không bao giờ thích những ước tính mật độ hạt nhân mà đôi khi mọi người sử dụng để hiển thị phân phối một chiều. Tôi muốn xem biểu đồ và biết dữ liệu ở đâu.
Biểu đồ tần số tương đối ( rời rạc )
Biểu đồ mật độ ( rời rạc )
Hàm mật độ xác suất PDF ( liên tục )
Các tài liệu tham khảo này rất hữu ích :) http://stattrek.com/statistic/dipedia.aspx?def định = Beatability_d mật_feft
Contin_probability_distribution từ trang web trên
http://www.geog.ucsb.edu/~joel/g210_w07/lecture_notes/lect04/oh07_04_1.html