Tôi nên dạy Bayesian hoặc thống kê thường xuyên đầu tiên?


32

Tôi đang giúp các chàng trai của tôi, hiện đang học trung học, hiểu số liệu thống kê và tôi đang xem xét bắt đầu với một số ví dụ đơn giản mà không bỏ qua một số cái nhìn thoáng qua về lý thuyết.

Mục tiêu của tôi là cung cấp cho họ cách tiếp cận trực quan nhưng mang tính xây dựng nhất để học thống kê từ đầu, nhằm kích thích sự quan tâm của họ trong việc tiếp tục theo đuổi thống kê và học định lượng.

Tuy nhiên, trước khi bắt đầu, tôi có một câu hỏi cụ thể với ý nghĩa rất chung chung:

Chúng ta nên bắt đầu giảng dạy thống kê bằng cách sử dụng khuôn khổ Bayes hay thường xuyên?

Nghiên cứu xung quanh tôi đã thấy rằng một cách tiếp cận phổ biến đang bắt đầu với một giới thiệu ngắn gọn về thống kê thường xuyên, sau đó là một cuộc thảo luận chuyên sâu về thống kê Bayes (ví dụ Stangl ).


5
Câu hỏi của bạn rất khó trả lời nếu không có thêm ngữ cảnh. Bạn muốn đạt được điều gì?
Glen_b -Reinstate Monica

4
Cha mẹ không tốt khi dạy cho trẻ em các chỉ số Bayes, giống như việc rót rượu vodka cho chúng hoặc thắp sáng xì gà. Lưu ý rằng cả vodka và xì gà đều tốt cho người lớn miễn là họ tự mình khám phá chúng
Aksakal

2
@Aksakal Tôi thực sự có kế hoạch dạy cho họ định lý Bayes trong khi nhấm nháp vodka và phồng phồng ... ;-)
Joe_74

2
Đó là một cách tốt để giữ đứa trẻ tránh xa các chỉ số Bayes trong một vài năm. Bạn nói với họ rằng đó chỉ là các ứng dụng định lý Bayes. Định lý hoạt động tốt trong các số liệu thống kê thường xuyên
Aksakal

5
Cuốn sách "Tín hiệu và tiếng ồn" của Nate Silver là một trường hợp để dạy cho những người trẻ tuổi thống kê Bayes.
Lloyd Giáng sinh

Câu trả lời:


25

Cả thống kê Bayes và thống kê thường xuyên đều dựa trên lý thuyết xác suất, nhưng tôi muốn nói rằng trước đây phụ thuộc nhiều hơn vào lý thuyết ngay từ đầu. Mặt khác, chắc chắn khái niệm về khoảng tin cậy là trực quan hơn so với khoảng tin cậy, một khi học sinh có hiểu biết tốt về khái niệm xác suất. Vì vậy, bất cứ điều gì bạn chọn, tôi ủng hộ trước hết là tăng cường nắm bắt các khái niệm xác suất của họ, với tất cả các ví dụ dựa trên súc sắc, thẻ, roulette, nghịch lý Monty Hall, v.v.

Tôi sẽ chọn cách tiếp cận này hay cách khác dựa trên cách tiếp cận hoàn toàn thực dụng: họ có nhiều khả năng nghiên cứu thống kê thường xuyên hay Bayes ở trường không? Ở nước tôi, họ chắc chắn sẽ học khuôn khổ thường xuyên trước tiên (và cuối cùng: chưa bao giờ nghe nói về học sinh trung học được dạy về chỉ số Bayes, cơ hội duy nhất là ở trường đại học hoặc sau đó, bằng cách tự học). Có lẽ trong bạn nó khác. Hãy nhớ rằng nếu họ cần phải đối phó với NHST (Kiểm tra ý nghĩa giả thuyết Null), điều đó sẽ phát sinh một cách tự nhiên hơn trong bối cảnh thống kê thường xuyên, IMO. Tất nhiên bạn cũng có thể kiểm tra các giả thuyết trong khuôn khổ Bayes, nhưng có nhiều nhà thống kê hàng đầu Bayes ủng hộ không sử dụng NHST, theo khuôn khổ thường xuyên hoặc khung Bayes (ví dụ, Andrew Gelman từ Đại học Columbia).

Cuối cùng, tôi không biết về trình độ của học sinh trung học ở nước bạn, nhưng ở tôi, sẽ rất khó để học sinh đồng hóa thành công (những điều cơ bản) về lý thuyết xác suất và phép tính tích phân cùng một lúc. Vì vậy, nếu bạn quyết định đi theo thống kê Bayes, tôi thực sự sẽ tránh trường hợp biến ngẫu nhiên liên tục và dính vào các biến ngẫu nhiên rời rạc.


2
Tôi đã rất ấn tượng (từ việc đọc blog của anh ấy) rằng Andrew Gelman sẽ ủng hộ chống lại NSHT thường xuyên cũng như chống lại Bayesian.
psarka

2
@psarka vâng, chắc chắn - Tôi chưa bao giờ nói ngược lại.
DeltaIV

3
"Ở nước tôi, họ chắc chắn sẽ học khuôn khổ thường xuyên trước tiên" - Điều này (hoặc bỏ qua thảo luận hoàn toàn về chủ nghĩa Bayes) là cách tiếp cận truyền thống trên toàn thế giới.
Chuyên gia Kodi

1
@Kodiologist Tôi nghi ngờ nhiều. Ít nhất, có thể có một số hệ thống giáo dục, sau khuôn khổ thường xuyên, cũng là hệ thống Bayes được giới thiệu ở trường trung học. Nhưng đó không phải là trường hợp ở đây.
DeltaIV

22

Bayes và người thường xuyên đặt câu hỏi khác nhau. Bayesian hỏi giá trị tham số nào là đáng tin cậy, dựa trên dữ liệu được quan sát. Người thường xuyên hỏi về xác suất của dữ liệu mô phỏng tưởng tượng nếu một số giá trị tham số giả thuyết là đúng. Các quyết định thường xuyên được thúc đẩy bằng cách kiểm soát lỗi, các quyết định Bayes được thúc đẩy bởi sự không chắc chắn trong các mô tả mô hình.

Vậy bạn nên dạy cái nào trước? Chà, nếu một hoặc một trong những câu hỏi đó là điều bạn muốn hỏi trước tiên, thì đó là câu trả lời của bạn. Nhưng về khả năng tiếp cận và sư phạm, tôi nghĩ rằng Bayesian dễ hiểu hơn nhiều và trực quan hơn nhiều. Ý tưởng cơ bản của phân tích Bayes là phân bổ lại độ tin cậy qua các khả năng, giống như Sherlock Holmes đã nói một cách nổi tiếng, và điều mà hàng triệu độc giả đã hiểu bằng trực giác. Nhưng ý tưởng cơ bản của phân tích thường xuyên là rất khó khăn: Không gian của tất cả các bộ dữ liệu có thể xảy ra nếu một giả thuyết cụ thể là đúng và tỷ lệ của các bộ dữ liệu tưởng tượng đó có thống kê tóm tắt là cực đoan hơn so với tóm tắt thống kê đã được thực sự quan sát.

Một chương giới thiệu miễn phí về các ý tưởng Bayes có ở đây . Một bài viết đặt các khái niệm thường xuyên và Bayes cạnh nhau là ở đây . Bài báo giải thích các cách tiếp cận thường xuyên và Bayes để kiểm tra giả thuyết và ước tính (và rất nhiều thứ khác). Khung của bài viết có thể đặc biệt hữu ích cho những người mới bắt đầu cố gắng có được cái nhìn về phong cảnh.


Bao gồm các tiêu đề của chương và bài viết có thể hữu ích trong trường hợp các liên kết bị chết trong tương lai.
Richard Hardy

8

Câu hỏi này có nguy cơ dựa trên ý kiến, vì vậy tôi sẽ cố gắng thực sự ngắn gọn với ý kiến ​​của tôi, sau đó đưa ra gợi ý cho bạn về cuốn sách. Đôi khi nó đáng để thực hiện một cách tiếp cận cụ thể bởi vì đó là cách tiếp cận mà một cuốn sách đặc biệt hay.

Tôi đồng ý rằng số liệu thống kê Bayes trực quan hơn. Phân biệt khoảng tin cậy và khoảng tin cậy đáng tin cậy tổng hợp khá nhiều: mọi người thường nghĩ theo cách "cơ hội mà ..." thay vì cách tiếp cận khoảng tin cậy. Cách tiếp cận Khoảng tin cậy nghe có vẻ giống như cách nói tương tự như Khoảng tin cậy ngoại trừ theo nguyên tắc chung, bạn không thể thực hiện bước cuối cùng từ "95% thời gian" đến "95% cơ hội", có vẻ rất thường xuyên nhưng bạn không thể làm điều đó Nó không nhất quán, chỉ là không trực quan.

Cân bằng điều đó là thực tế là hầu hết các khóa học đại học họ sẽ tham gia sẽ sử dụng phương pháp tiếp cận thường xuyên ít trực quan hơn.

Điều đó nói rằng tôi thực sự thích cuốn sách Suy nghĩ lại thống kê: Một khóa học Bayes với các ví dụ trong R và Stan của Richard McElreath. Nó không rẻ, vì vậy vui lòng đọc về nó và tìm hiểu về nó trên Amazon trước khi bạn mua. Tôi thấy đó là một cách tiếp cận đặc biệt trực quan, tận dụng lợi thế của cách tiếp cận Bayes, và rất thực tế. (Và vì R và Stan là những công cụ tuyệt vời cho thống kê Bayes và chúng miễn phí, đó là cách học thực tế.)

EDIT: Một vài ý kiến ​​đã đề cập rằng cuốn sách có thể vượt ra ngoài một học sinh trung học, ngay cả với một gia sư có kinh nghiệm . Vì vậy, tôi sẽ phải đặt một cảnh báo thậm chí còn lớn hơn: nó có một cách tiếp cận đơn giản ngay từ đầu, nhưng nhanh chóng tăng tốc. Đó là một cuốn sách tuyệt vời, nhưng bạn thực sự, thực sự sẽ phải lướt qua nó trên Amazon để cảm nhận về những giả định ban đầu của nó và nó nhanh chóng tăng tốc như thế nào. Tương tự đẹp, công việc thực hành tuyệt vời trong R, dòng chảy và tổ chức đáng kinh ngạc, nhưng có thể không hữu ích cho bạn.

Nó giả định kiến ​​thức cơ bản về lập trình và R (gói thống kê miễn phí), và một số tiếp xúc với các khái niệm cơ bản về xác suất và thống kê. Nó không phải là truy cập ngẫu nhiên và mỗi chương được xây dựng trên các chương trước. Nó bắt đầu rất đơn giản, mặc dù khó khăn tăng lên ở giữa - nó kết thúc bằng hồi quy đa cấp. Vì vậy, bạn có thể muốn xem trước một số nội dung đó tại Amazon và quyết định xem bạn có thể dễ dàng trình bày những điều cơ bản hay không nếu nó nhảy quá xa trên đường.

EDIT 2: Điểm mấu chốt của sự đóng góp của tôi ở đây và cố gắng biến nó từ ý kiến ​​thuần túy là một cuốn sách giáo khoa tốt có thể quyết định cách tiếp cận nào của bạn. Tôi thích cách tiếp cận của Bayes và cuốn sách này thực hiện tốt điều đó, nhưng có lẽ với tốc độ quá nhanh.


2
Cuốn sách của McElreath là tuyệt vời, nhưng tôi sẽ thực sự ngạc nhiên nếu học sinh trung học có thể tuân theo mức độ đối xử đó, ngay cả với một gia sư tài năng.
DeltaIV

2
@DeltaIV: Phản hồi tốt, tôi sẽ chỉnh sửa câu trả lời của mình. Tôi đã bị lừa nhiều lần bởi cách dễ đọc và tương tự như lúc ban đầu. Nó đi vào một đường cong học tập dốc khoảng nửa chừng, và có lẽ sớm hơn thế nhiều.
Wayne

1
Một lưu ý khác: Tôi nghĩ rằng có một khoảng cách lớn hơn giữa các nguyên tắc cơ bản (nghĩa là lý thuyết xác suất) và ứng dụng trong các phương pháp Thường xuyên so với các phương pháp Bayes. Đó là, tôi gặp khó khăn khi tưởng tượng ai đó thực sự hiểu lý thuyết MLE, bằng chứng về CLT, v.v., mà không có trình độ học vấn sau đại học, điều cần thiết cho ngay cả những thủ tục cơ bản nhất của Quy trình thường xuyên. Một khi bạn biết xác suất có điều kiện, về cơ bản bạn hiểu cách suy luận Bayes hoạt động. Lý thuyết MCMC hơi phức tạp, nhưng thực sự đơn giản hơn nhiều so với việc thực sự hiểu lý thuyết MLE ...
Cliff AB

... và vì việc thu hẹp khoảng cách giữa xác suất và ứng dụng thống kê trong khuôn khổ Bayes dễ dàng hơn, ít nhất, tôi nghĩ rằng điều đó làm cho mọi thứ thỏa mãn hơn về mặt tinh thần nhanh hơn. Tôi ghét TA-ing các khóa học mà chúng tôi phải nói "và tin tưởng chúng tôi, lý thuyết MLE hoạt động với các mẫu lớn", vì tôi cảm thấy phải phần nào giết chết sự tò mò khoa học của ai đó, hoặc đòi hỏi một cam kết tinh thần lớn hơn nhiều.
Vách đá AB

... Nhưng trực giác đằng sau mle là đủ tự nhiên ... stats.stackexchange.com/questions/112451/ Lần
kjetil b halvorsen

5

Tôi đã được dạy cách tiếp cận thường xuyên trước, sau đó là phương pháp Bayes. Tôi không phải là một nhà thống kê chuyên nghiệp.

Tôi phải thừa nhận rằng tôi đã không tìm thấy kiến ​​thức trước đây của mình về cách tiếp cận thường xuyên là hữu ích quyết định trong việc hiểu cách tiếp cận Bayes.

Tôi dám nói điều đó phụ thuộc vào những ứng dụng cụ thể mà bạn sẽ thể hiện cho học sinh của mình tiếp theo, và bạn sẽ dành bao nhiêu thời gian và công sức cho chúng.

Đã nói điều này, tôi sẽ bắt đầu với Bayes.


3

Khung Bayes được kết hợp chặt chẽ với các kỹ năng tư duy phê phán chung. Đó là những gì bạn cần trong các tình huống sau:

  1. Bạn nghĩ về việc áp dụng cho một công việc cạnh tranh. Cơ hội của bạn để có được trong là gì? Những gì bạn mong đợi từ việc áp dụng?
  2. Một tiêu đề cho bạn biết điện thoại di động gây ung thư ở người trong thời gian dài. Họ có bao nhiêu bằng chứng cho việc này?
  3. Bạn nên quyên góp từ thiện nào nếu bạn muốn nó có hiệu quả lớn nhất?
  4. Ai đó đề nghị lật một đồng xu với mức cược 0,90 đô la từ bạn và 1,10 đô la từ họ. Bạn sẽ cho họ tiền? Tại sao tại sao không?
  5. Bạn đã mất chìa khóa (hoặc bom nguyên tử). Bạn bắt đầu tìm kiếm ở đâu?

Ngoài ra, điều này thú vị hơn nhiều so với việc ghi nhớ công thức cho một bài kiểm tra hai mẫu: p. Điều này làm tăng cơ hội học sinh sẽ quan tâm đủ lâu để bận tâm với tài liệu kỹ thuật ngày càng tăng.


3

Không ai đã đề cập đến khả năng, đó là nền tảng cho thống kê Bayes. Một lập luận ủng hộ việc dạy Bayes trước tiên là dòng chảy từ xác suất, đến khả năng, đến Bayes, khá liền mạch. Bayes có thể được thúc đẩy từ khả năng bằng cách lưu ý rằng (i) hàm khả năng trông (và hành động) giống như hàm phân phối xác suất, nhưng không phải vì khu vực dưới đường cong không phải là 1.0 và (ii) Wald thô, thường được sử dụng khoảng thời gian giả định một hàm khả năng tỷ lệ thuận với phân phối bình thường, nhưng các phương pháp Bayes dễ dàng vượt qua giới hạn này.

Một lập luận khác ủng hộ Bayes trước tiên là mối quan tâm P (A | B) so với P (B | A) về giá trị p có thể được giải thích dễ dàng hơn, như được đề cập bởi những người khác.

Tuy nhiên, một lập luận khác ủng hộ "Bayes trước" là nó buộc sinh viên phải suy nghĩ kỹ hơn về các mô hình xác suất có điều kiện, rất hữu ích ở những nơi khác, ví dụ, trong phân tích hồi quy.

Xin lỗi vì đã tự quảng cáo, nhưng vì nó hoàn toàn thuộc chủ đề, tôi không ngại nói rằng đây chính xác là cách tiếp cận mà Keven Henning và tôi đã thực hiện trong cuốn sách "Tìm hiểu các phương pháp thống kê nâng cao" ( https: // peterwestfall. wixsite.com/book-1 ) có đối tượng dự định là những người không thống kê.


2

Bạn đang dạy cho niềm vui và cái nhìn sâu sắc hoặc để sử dụng thực tế? Nếu đó là về giảng dạy và hiểu biết, tôi sẽ đi Bayes. Nếu vì mục đích thực tế, tôi chắc chắn sẽ đi thường xuyên.

Trong nhiều lĩnh vực - và tôi cho rằng hầu hết các lĩnh vực - khoa học tự nhiên, mọi người được sử dụng để xuất bản các bài báo của họ với giá trị p. "Các chàng trai" của bạn sẽ phải đọc giấy tờ của người khác trước khi họ tự viết. Để đọc các bài báo của người khác, ít nhất là trong lĩnh vực của tôi, họ cần hiểu các giả thuyết không có giá trị p, bất kể chúng có thể xuất hiện ngu ngốc như thế nào sau các nghiên cứu của Bayes. Và ngay cả khi họ sẵn sàng xuất bản bài báo đầu tiên, họ có thể sẽ có một số nhà khoa học cao cấp lãnh đạo nhóm và rất có thể, họ thích Chủ nghĩa Thường xuyên.

Điều đó đang được nói, tôi muốn đồng tình với @Wayne, trong đó việc xem xét lại thống kê cho thấy một cách rất rõ ràng đối với thống kê Bayes như một cách tiếp cận đầu tiên và không dựa trên kiến ​​thức hiện có về Chủ nghĩa thường xuyên. Thật tuyệt vời khi cuốn sách này không cố gắng thuyết phục bạn trong cuộc chiến về số liệu thống kê tốt hơn hay xấu hơn. Lập luận đã nêu của tác giả cho Bayes là (IIRC) rằng ông đã dạy cả hai loại và Bayes dễ dạy hơn.


2

Tôi sẽ tránh xa Bayesian, đi theo những người khổng lồ.

Xô Viết đã có một bộ sách tuyệt vời dành cho học sinh trung học, tạm dịch sang tiếng Anh là "Thư viện nhỏ". Kolmogorov đã đóng góp một cuốn sách với các đồng tác giả có tiêu đề "Giới thiệu về một lý thuyết xác suất". Tôi không chắc nó đã từng được dịch sang tiếng Anh, nhưng đây là liên kết đến bản gốc tiếng Nga của nó.

Họ tiếp cận giải thích các xác suất thông qua tổ hợp, mà tôi nghĩ là cách tuyệt vời để bắt đầu. Cuốn sách rất dễ tiếp cận đối với một học sinh trung học có môn toán đàng hoàng. Lưu ý, rằng Liên Xô đã dạy toán khá rộng rãi, vì vậy, học sinh trung học phương Tây trung bình có thể không được chuẩn bị tốt, nhưng với đủ sự quan tâm và sức mạnh ý chí vẫn có thể xử lý nội dung, theo ý kiến ​​của tôi.

Nội dung rất thú vị đối với sinh viên, nó có các bước đi ngẫu nhiên, hạn chế phân phối, quy trình sinh tồn, luật số lượng lớn, v.v ... Nếu bạn kết hợp phương pháp này với mô phỏng máy tính, nó sẽ trở nên thú vị hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.