Tôi chỉ xem một bài giảng về suy luận thống kê ("so sánh tỷ lệ và phương tiện"), một phần của phần giới thiệu về khóa học trực tuyến thống kê. Các tài liệu ít có ý nghĩa đối với tôi như mọi khi (đến bây giờ tôi phải thấy công cụ này hàng chục lần, trải ra trong ba thập kỷ qua).
Tôi đang tìm một cuốn sách về "Chỉ số cơ bản-101" (ước tính điểm, đánh giá ước tính, suy luận thống kê, kiểm tra giả thuyết, thiết kế nghiên cứu) thực sự nghiêm trọng trong vấn đề thuyết phục người đọc hoài nghi ...
Dưới đây tôi đưa ra một số ví dụ về loại câu hỏi mà tác giả tôi đang tìm kiếm sẽ nghiêm túc và biết cách giải quyết một cách thuyết phục.
Nhưng trước tiên hãy để tôi dành một phút để nhấn mạnh rằng trong bài đăng này tôi không hỏi những câu hỏi này. Làm ơn đừng trả lời họ! Tôi cung cấp cho họ chỉ là ví dụ và bằng cách "thử nghiệm litmus" (đối với loại tác giả tìm kiếm).
Nếu một "tỷ lệ" chỉ đơn giản là giá trị trung bình của biến Boolean (tức là chỉ lấy các giá trị 0 và 1), tại sao các quy trình khác nhau được dạy để thực hiện suy luận thống kê với "tỷ lệ" và với "phương tiện"?
Nếu phân phối bình thường mạnh đến mức giả sử tính bình thường cho kết quả tốt ngay cả trong trường hợp khi dữ liệu đó không được phân phối hoàn toàn bình thường và nếu phân phối t trông rất bình thường, tại sao tất cả lại băn khoăn về việc sử dụng phân phối t thay vì bình thường?
Chính xác là gì là "bậc tự do", và tại sao chúng ta lo lắng về chúng?
Điều đó có nghĩa gì khi nói về giá trị "thực" của một tham số, xem xét rằng chúng ta chỉ đang sử dụng các bản phân phối có vẻ giống với dữ liệu?
Làm thế nào đến "phân tích dữ liệu thăm dò" là một điều tốt, trong khi "rình mò dữ liệu" là một điều xấu?
Như tôi đã nói, tôi bị loại bỏ bởi thái độ ngụ ý từ việc bỏ qua những câu hỏi như vậy. Đó không phải là "lập trường nhận thức luận" mà tôi muốn thấy ở một người đang dạy tôi điều gì đó. Tôi đang tìm kiếm các tác giả tôn trọng sự hoài nghi và tính hợp lý của người đọc, và những người biết cách giải quyết chúng (mà không nhất thiết phải đi sâu vào các trang và các trang về hình thức và kỹ thuật).
Tôi nhận ra rằng đây là một trật tự cao, và có lẽ đặc biệt là như vậy khi nói đến thống kê. Do đó, tôi không hy vọng rằng nhiều tác giả sẽ thành công với nó. Nhưng hiện tại tôi hài lòng với việc chỉ tìm một .
Hãy để tôi thêm rằng tôi không phải là người không thích toán học. Trái lại, tôi yêu môn toán. (Tôi cảm thấy thoải mái với phân tích [hay còn gọi là "tính toán nâng cao"], đại số tuyến tính, lý thuyết xác suất, thậm chí cả lý thuyết đo lường cơ bản.)
Điều đó nói rằng, mối quan tâm của tôi tại thời điểm này là các số liệu thống kê "áp dụng", "thực tế", "hàng ngày", "thế giới thực" (trái ngược với các đặc điểm lý thuyết). (Nhưng tôi cũng không muốn có một cuốn sách nấu ăn!)
FWIW, tôi đã đọc một vài chương đầu tiên của phân tích dữ liệu bằng mô hình hồi quy và mô hình đa cấp / phân cấp của Gelman và Hill, và tôi thích giọng điệu của các tác giả. Trọng tâm của họ là thực tế, nhưng đi vào lý thuyết khi cần thiết. Họ cũng thường lùi lại, và đánh giá các thực hành tiêu chuẩn một cách nghiêm túc, và đưa ra những ý kiến thẳng thắn thu hút sự phản đối của người đọc hoài nghi. Thật không may, các tác giả này đã không viết một cuốn sách dành cho chủ đề tôi đang hỏi trong bài này (công cụ "Thống kê 101", như được mô tả ở trên). Tôi cũng biết rằng một trong những tác giả này (Gelman) là đồng tác giả của phân tích dữ liệu Bayes được đánh giá cao , nhưng, một lần nữa, đây không phải là điều tôi đang tìm kiếm vào lúc này.
BIÊN TẬP:
Dikran Marsupial đưa ra sự phản đối sau đây:
Tôi không nghĩ rằng có bất cứ điều gì sai khi bỏ qua các câu hỏi, có một điểm mà việc giải quyết mọi câu hỏi làm mất đi sự giải thích các khái niệm cơ bản thường quan trọng hơn (đặc biệt là trong một cuốn sách thống kê 101!).
Tôi đồng ý với điều đó. Sẽ chính xác hơn đối với tôi khi nói rằng tôi đang tìm kiếm "cái nhìn thứ hai về các số liệu thống kê cơ bản". Trong thực tế, với điều này là động lực của tôi, tôi đã xem các sách giáo khoa được sử dụng trong các khóa học sau đại học về suy luận (và nói) và thấy rằng chúng quá lơ là những câu hỏi như những gì tôi đã liệt kê. Nếu có bất cứ điều gì, họ dường như thậm chí ít có xu hướng đi sâu vào những câu hỏi như vậy (để họ có thể tập trung vào các vấn đề như điều kiện cho một số hội tụ-hoặc-khác của điều này hoặc điều đó ...).
Vấn đề là những cuốn sách tiên tiến hơn được đề cập đến một nhóm độc giả hoàn toàn khác , một trong đó "sự hoài nghi của người ngoài cuộc" đã bị cạn kiệt nghiêm trọng. IOW, những người đang lấy số liệu thống kê cấp độ sau đại học đã qua thời điểm bị làm phiền bởi những câu hỏi làm phiền tôi . Họ không còn hoài nghi về bất kỳ thứ gì trong số này nữa. (Làm thế nào mà họ vượt qua được sự hoài nghi? Lấy số liệu thống kê sau đó. Những người khác có thể đã có những giáo viên điền vào chỗ sách giáo khoa của họ bị thiếu. Một số người có thể đủ thông minh để tìm ra câu trả lời cho những câu hỏi như vậy cho chính họ. Ai biết được.)