Suy luận cho người đọc hoài nghi (nhưng không phản đối toán học)


14

Tôi chỉ xem một bài giảng về suy luận thống kê ("so sánh tỷ lệ và phương tiện"), một phần của phần giới thiệu về khóa học trực tuyến thống kê. Các tài liệu ít có ý nghĩa đối với tôi như mọi khi (đến bây giờ tôi phải thấy công cụ này hàng chục lần, trải ra trong ba thập kỷ qua).

Tôi đang tìm một cuốn sách về "Chỉ số cơ bản-101" (ước tính điểm, đánh giá ước tính, suy luận thống kê, kiểm tra giả thuyết, thiết kế nghiên cứu) thực sự nghiêm trọng trong vấn đề thuyết phục người đọc hoài nghi ...

Dưới đây tôi đưa ra một số ví dụ về loại câu hỏi mà tác giả tôi đang tìm kiếm sẽ nghiêm túc và biết cách giải quyết một cách thuyết phục.

Nhưng trước tiên hãy để tôi dành một phút để nhấn mạnh rằng trong bài đăng này tôi không hỏi những câu hỏi này. Làm ơn đừng trả lời họ! Tôi cung cấp cho họ chỉ là ví dụ và bằng cách "thử nghiệm litmus" (đối với loại tác giả tìm kiếm).

  1. Nếu một "tỷ lệ" chỉ đơn giản là giá trị trung bình của biến Boolean (tức là chỉ lấy các giá trị 0 và 1), tại sao các quy trình khác nhau được dạy để thực hiện suy luận thống kê với "tỷ lệ" và với "phương tiện"?

  2. Nếu phân phối bình thường mạnh đến mức giả sử tính bình thường cho kết quả tốt ngay cả trong trường hợp khi dữ liệu đó không được phân phối hoàn toàn bình thường và nếu phân phối t trông rất bình thường, tại sao tất cả lại băn khoăn về việc sử dụng phân phối t thay vì bình thường?

  3. Chính xác là là "bậc tự do", và tại sao chúng ta lo lắng về chúng?

  4. Điều đó có nghĩa gì khi nói về giá trị "thực" của một tham số, xem xét rằng chúng ta chỉ đang sử dụng các bản phân phối có vẻ giống với dữ liệu?

  5. Làm thế nào đến "phân tích dữ liệu thăm dò" là một điều tốt, trong khi "rình mò dữ liệu" là một điều xấu?

Như tôi đã nói, tôi bị loại bỏ bởi thái độ ngụ ý từ việc bỏ qua những câu hỏi như vậy. Đó không phải là "lập trường nhận thức luận" mà tôi muốn thấy ở một người đang dạy tôi điều gì đó. Tôi đang tìm kiếm các tác giả tôn trọng sự hoài nghi và tính hợp lý của người đọc, và những người biết cách giải quyết chúng (mà không nhất thiết phải đi sâu vào các trang và các trang về hình thức và kỹ thuật).

Tôi nhận ra rằng đây là một trật tự cao, và có lẽ đặc biệt là như vậy khi nói đến thống kê. Do đó, tôi không hy vọng rằng nhiều tác giả sẽ thành công với nó. Nhưng hiện tại tôi hài lòng với việc chỉ tìm một .

Hãy để tôi thêm rằng tôi không phải là người không thích toán học. Trái lại, tôi yêu môn toán. (Tôi cảm thấy thoải mái với phân tích [hay còn gọi là "tính toán nâng cao"], đại số tuyến tính, lý thuyết xác suất, thậm chí cả lý thuyết đo lường cơ bản.)

Điều đó nói rằng, mối quan tâm của tôi tại thời điểm này là các số liệu thống kê "áp dụng", "thực tế", "hàng ngày", "thế giới thực" (trái ngược với các đặc điểm lý thuyết). (Nhưng tôi cũng không muốn có một cuốn sách nấu ăn!)

FWIW, tôi đã đọc một vài chương đầu tiên của phân tích dữ liệu bằng mô hình hồi quy và mô hình đa cấp / phân cấp của Gelman và Hill, và tôi thích giọng điệu của các tác giả. Trọng tâm của họ là thực tế, nhưng đi vào lý thuyết khi cần thiết. Họ cũng thường lùi lại, và đánh giá các thực hành tiêu chuẩn một cách nghiêm túc, và đưa ra những ý kiến ​​thẳng thắn thu hút sự phản đối của người đọc hoài nghi. Thật không may, các tác giả này đã không viết một cuốn sách dành cho chủ đề tôi đang hỏi trong bài này (công cụ "Thống kê 101", như được mô tả ở trên). Tôi cũng biết rằng một trong những tác giả này (Gelman) là đồng tác giả của phân tích dữ liệu Bayes được đánh giá cao , nhưng, một lần nữa, đây không phải là điều tôi đang tìm kiếm vào lúc này.

BIÊN TẬP:

Dikran Marsupial đưa ra sự phản đối sau đây:

Tôi không nghĩ rằng có bất cứ điều gì sai khi bỏ qua các câu hỏi, có một điểm mà việc giải quyết mọi câu hỏi làm mất đi sự giải thích các khái niệm cơ bản thường quan trọng hơn (đặc biệt là trong một cuốn sách thống kê 101!).

Tôi đồng ý với điều đó. Sẽ chính xác hơn đối với tôi khi nói rằng tôi đang tìm kiếm "cái nhìn thứ hai về các số liệu thống kê cơ bản". Trong thực tế, với điều này là động lực của tôi, tôi đã xem các sách giáo khoa được sử dụng trong các khóa học sau đại học về suy luận (và nói) và thấy rằng chúng quá lơ là những câu hỏi như những gì tôi đã liệt kê. Nếu có bất cứ điều gì, họ dường như thậm chí ít có xu hướng đi sâu vào những câu hỏi như vậy (để họ có thể tập trung vào các vấn đề như điều kiện cho một số hội tụ-hoặc-khác của điều này hoặc điều đó ...).

Vấn đề là những cuốn sách tiên tiến hơn được đề cập đến một nhóm độc giả hoàn toàn khác , một trong đó "sự hoài nghi của người ngoài cuộc" đã bị cạn kiệt nghiêm trọng. IOW, những người đang lấy số liệu thống kê cấp độ sau đại học đã qua thời điểm bị làm phiền bởi những câu hỏi làm phiền tôi . Họ không còn hoài nghi về bất kỳ thứ gì trong số này nữa. (Làm thế nào mà họ vượt qua được sự hoài nghi? Lấy số liệu thống kê sau đó. Những người khác có thể đã có những giáo viên điền vào chỗ sách giáo khoa của họ bị thiếu. Một số người có thể đủ thông minh để tìm ra câu trả lời cho những câu hỏi như vậy cho chính họ. Ai biết được.)


2
Hầu hết những câu hỏi đó - những câu hỏi mà chúng tôi không trả lời - đã có câu trả lời tốt ở đây trên CV. Một số trong những câu hỏi thậm chí có câu trả lời khá tầm thường. Nhưng có hàng ngàn câu hỏi mà mọi người đưa ra trong bất kỳ chủ đề nào - bạn sẽ không bao giờ tìm thấy lời giải thích bao gồm tất cả các câu hỏi có thể, bạn sẽ không tìm thấy câu hỏi nào chỉ dự đoán những câu hỏi cụ thể mà bạn có trong khi xem hoặc đọc hiểu. Chà, bạn có thể đánh một hoặc hai chỉ một cách tình cờ, nhưng nhìn chung đó là một tiêu chuẩn không thể. Tại sao không chỉ đặt câu hỏi khi chúng phát sinh? Trên một trang web trả lời câu hỏi?
Glen_b -Reinstate Monica

2
Tôi sẽ nói những câu hỏi tương tự xuất hiện khi mọi người thống kê (và một số cuốn sách trả lời một số trong số chúng), nhưng hầu hết chúng không phải là những câu hỏi thực tế liên quan đến sự hoài nghi - chủ yếu là những câu hỏi hiểu đơn giản. ví dụ: "mức độ tự do là gì và tại sao chúng ta quan tâm" không nghi ngờ gì cả, nó yêu cầu sự rõ ràng về giải thích và động lực. Những lý do khiến người dùng thống kê tiên tiến không lo lắng về điều đó là vì họ đã hiểu tại sao chúng rất có giá trị.
Glen_b -Reinstate Monica

Câu trả lời:


6

Bạn đã có một số gợi ý tốt. Dưới đây là một số chi tiết. Đầu tiên, hai blog mà tôi đọc một cách rời rạc, và nơi những câu hỏi như bạn tự hỏi đôi khi được thảo luận. Vì chúng là blog, bạn thậm chí có thể đặt câu hỏi và nhận được một số câu trả lời rất tốt! Họ đến đây:

http://andrewgelman.com/ (Andrew Gelman)

http://errorstatistic.com/ (Deborah Mayo)

Và một vài cuốn sách tôi nghĩ sẽ giúp bạn: Box, Hunter & Hunter: Thống kê cho những người thử nghiệm.

Như tiêu đề đã nói, đây là một khóa học ("đầu tiên", nhưng thực sự, thực sự ... thứ hai) dành cho những người muốn thiết kế thử nghiệm của riêng họ, và vì vậy hãy phân tích chúng. Rất cao về phần "tại sao".

Sau đó: DR Cox: Nguyên tắc suy luận thống kê, một cuốn sách rất hay khác về "tại sao" không phải là "làm thế nào".

Và, vì bạn hỏi tại sao phương tiện và tỷ lệ được đối xử khác nhau, đây là một cuốn sách không làm điều đó: http://www.amazon.com/Statistic-4th-David-Freedman/dp/0393929728/ref=sr_1_1?s = sách & eg = UTF8 & qid = 1373395118 & sr = 1-1 & Keywords = freedman + thống kê

Thấp về toán, cao về nguyên tắc.


8

Tôi khá nghi ngờ sẽ có một cuốn sách phù hợp với bạn vì những người riêng lẻ có xu hướng hoài nghi về những điều khác nhau, và những cuốn sách được viết cho đối tượng mục tiêu, thay vì cho cá nhân. Đây là một trong những điều tốt về việc được dạy bởi một người, thay vì chỉ là một cuốn sách, đó là bạn có thể đặt câu hỏi khi bạn đi. Đây là một điều khá khó để làm trong một văn bản tuyến tính.

Tôi không nghĩ rằng có bất cứ điều gì sai khi bỏ qua các câu hỏi, có một điểm mà việc giải quyết mọi câu hỏi làm mất đi sự giải thích các khái niệm cơ bản thường quan trọng hơn (đặc biệt là trong một cuốn sách thống kê 101!).

Tôi nghi ngờ cách tiếp cận tốt nhất là có được một cuốn sách hay và sau đó tìm kiếm câu trả lời cho những câu hỏi chưa được trả lời ở nơi khác. Tôi đã có một giá sách chứa đầy các văn bản thống kê trước mặt, đơn giản vì không ai trong số chúng bị cô lập là tất cả những gì tôi cần (thậm chí không phải là sách của Jaynes; o).

Đối với người mới bắt đầu tuyệt đối, tôi nghĩ cuốn sách "Hiểu số liệu thống kê" của Grant Foster là một nơi tốt để bắt đầu, nhưng tôi nghi ngờ nó khá cơ bản trong trường hợp này.


1
"Tôi không nghĩ rằng có bất cứ điều gì sai trái khi bỏ qua các câu hỏi ..." Tôi nghĩ rằng đây là một sự phản đối công bằng; Tôi đã thêm một EDIT vào bài viết của mình để giải quyết nó.
kjo

7

Hãy thử một con đường hoàn toàn khác với chủ đề: lấy "Lịch sử thống kê toán học (từ 1750 đến 1930)", bởi Anders Hald, và tìm hiểu về lịch sử của môn học của chúng tôi. Một khi bạn nắm bắt được sự xuất hiện chậm của khái niệm mô hình thống kê , các câu hỏi của bạn sẽ có vẻ tầm thường. Hai phần của một mô hình thống kê phải được hiểu rõ ràng: dữ liệu quan sát đượcX và tham số không quan sát được Θ. Phân phối mẫu củaX|Θ được quy định, và mục tiêu của chúng tôi là tìm hiểu về Θ đưa ra một số giá trị của X. Nhìn vào một số câu hỏi của bạn: 1) Các mô hình khác nhau; 2)t phân phối là phân phối lấy mẫu của một thống kê cụ thể (một chức năng của dữ liệu X) khi dữ liệu được cho là bình thường; 3) Mức độ tự do đặc trưng cho phân phối lấy mẫu của một thống kê giả sử rằng các giá trị củaΘbị ràng buộc (bởi một giả thuyết được gọi là null), v.v. Ngoài ra, chọn một số vấn đề suy luận đơn giản (như dữ liệu bình thường với phương sai đã biết) và giải quyết nó theo cả hai cách cổ điển và Bayes. Tương phản sự khác biệt. Đó có thể là chiếu sáng.


5
+1 phần lớn lý do tại sao các quy trình thống kê có vẻ đáng nghi ngờ là vì chúng khá phản trực giác và sự đánh giá lịch sử về cách thống kê kết thúc như vậy, có lẽ là một cách tiếp cận tốt cho người hoài nghi.
Dikran Marsupial

2
@DikranMarsupial: Trên thực tế, tôi đã đọc chính xác "Lịch sử thống kê" của Stigler để hiểu rõ hơn về những khó khăn của tôi với các số liệu thống kê. Và nó đã giúp một số. Thật không may, nó bỏ đi phần lớn thời đại của Fisher vs Neyman, khi (tôi nghi ngờ) phần lớn sự kỳ quái trỗi dậy nảy sinh. Tôi đã thử khoảng 50 trang sách của Hald, nhưng không thể theo dõi các dẫn xuất của ông: chúng được gửi đến những độc giả có chuyên môn thống kê quan trọng ... Hãy nghĩ về nó, tôi nghĩ rằng một cuốn sách gửi đến giáo dân có giáo dục và có tiêu đề "Tại sao Thống kê có gì lạ không? " sẽ bán tốt ... :)
kjo

4
IMHO tính trực giác của số liệu thống kê trước ngày kỷ nguyên Fisher vs Neyman (mặc dù trực giác không ngụ ý tính hữu dụng hoặc ngược lại). Những cuốn sách của Ian Hacking có thể đáng để thử, tôi rất thích "Sự xuất hiện của xác suất". Tôi thấy các số liệu thống kê Bayes dễ hiểu hơn về mặt khái niệm so với các số liệu thống kê thường xuyên, nhưng khó thực hiện hơn nhiều trong thực tế. Hiểu được sự khác biệt giữa phương pháp tiếp cận Bayes và người thường xuyên đã giúp tôi rất nhiều trong việc hiểu cách tiếp cận thường xuyên.
Sao Hỏa Dikran

1
Cảm ơn, tôi sẽ kiểm tra hack. Những cuốn sách của anh ấy đã nằm trong tầm ngắm của tôi trong một thời gian dài, mặc dù tôi đã ngừng đọc anh ấy nghĩ rằng anh ấy tập trung nhiều hơn vào triết lý của lý thuyết xác suất (một chủ đề mà tôi thấy hấp dẫn theo đúng nghĩa của nó). Điều đó nói rằng, tôi nhận ra rằng ít nhất một vài vấn đề của tôi với số liệu thống kê ảnh hưởng đến việc giải thích xác suất, vì vậy có lẽ việc đọc Hacking sẽ quan tâm đến ít nhất một số phản đối của tôi.
kjo

2
@kjo Tôi đã đọc Logic suy luận thống kê của Hacking và thấy nó rất 'triết học' - anh ấy đã nảy ra ý tưởng về khả năng là 'hỗ trợ' và từ chối Neyman-Pearson nhưng vẫn tiếp tục với các ví dụ đơn giản - không thảo luận về các thông số phiền toái, đa suy luận tham số, hoặc bất cứ điều gì khó khăn (trừ khi tôi quên). Đáng đọc, chắc chắn, nhưng tôi sẽ không khuyên bạn nên bắt đầu với.
Scortchi - Phục hồi Monica

6

Abelson (1995), Thống kê như lý luận nguyên tắc là giới thiệu & có một câu hỏi thú vị về một số câu hỏi thường gây nhầm lẫn cho người học.

Nhưng có lẽ bạn chỉ cần đọc một số sách về thống kê lý thuyết (bỏ qua tất cả nội dung về hội tụ, không gian số liệu, & c.) & Ngay cả khi họ không trả lời các câu hỏi cụ thể như ví dụ của bạn, bạn sẽ có thể trả lời hầu hết chính họ, và tìm kiếm phần còn lại, như @Dikran gợi ý.

Tôi đã đề nghị trong một chủ đề khác đọc Cox & Hinkley, Thống kê lý thuyết hoặc Cox, Nguyên tắc suy luận thống kê cùng với Casella & Berger, Suy luận thống kê để hiểu về các quan điểm khác nhau.


1
Tôi thấy nó thú vị nhưng tôi không nghĩ nó ở mức mà OP mong đợi.
Gala

@Gael Có lẽ bạn đúng, đặc biệt là trong quan điểm chỉnh sửa.
Scortchi - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.