Điều gì nên được dạy đầu tiên: Xác suất hoặc Thống kê?


19

Tôi mới tham gia với tư cách là giảng viên khoa toán. của một tổ chức có uy tín. Tôi sẽ giảng dạy khóa học Xác suất và Thống kê ở cấp đại học. Tổ chức này đã có một giáo trình cho khóa học này mà tôi không hài lòng lắm. Trong giáo trình đó, số liệu thống kê được đề cập trước tiên, phần thiếu ước tính cũng bị thiếu. Tôi luôn nghĩ những điều cơ bản về xác suất nên được dạy trước khi dạy thống kê. Ai đó có thể cho một số ý kiến ​​về điều này? Ngoài ra một gợi ý cho các chủ đề nên được đề cập trong một khóa học như vậy được đánh giá rất cao.


3
Dường như với tôi, sự hiểu biết cơ bản (không nhất thiết là các khái niệm quá toán học) về xác suất là cần thiết để có được logic và trực giác đằng sau các kỹ thuật thống kê được chứng minh bằng thực tế là hầu hết các sách thống kê cấp tiểu học đều bắt đầu bằng xác suất. Trong lớp học nâng cao kinh doanh của tôi là tốt, đầu tiên chúng tôi được dạy xác suất và sau đó thống kê.
rsl

4
Là lý thuyết, hay thống kê áp dụng ..? Phần lớn các số liệu thống kê được áp dụng có thể được suy nghĩ mà không cần giới thiệu chi tiết về xác suất. Nó cũng có thể là một apetizer tốt đẹp cho xác suất và thống kê lý thuyết sau này. Vì vậy, nó không phải là ý tưởng tồi.
Tim

3
Những sinh viên theo chương trình cấp bằng nào? Họ có phải là chuyên ngành toán học, hay mô-đun được cung cấp chủ yếu cho sinh viên từ các khoa khác, nói xã hội học hay kinh doanh?
Robert Long

@RobertLong: Người ta nói rằng engg cơ. sinh viên và học sinh giỏi toán của chúng tôi sẽ tham dự khóa học. Những người khác từ kinh tế điện engg. và sinh viên khoa học máy tính cũng có thể tham dự.
Ashok

Câu trả lời:


22

Nó dường như không còn là một câu hỏi về ý kiến ​​nữa: thế giới dường như đã tiến xa hơn "truyền thống xác suất và sau đó dạy thống kê như là một ứng dụng của nó". Để hiểu được việc giảng dạy thống kê sẽ diễn ra ở đâu, hãy xem danh sách các tiêu đề giấy trong ấn bản đặc biệt năm ngoái của The American Statistician (được sao chép dưới đây): không phải là một trong số chúng đề cập đến xác suất.

Họ thảo luận về việc giảng dạy xác suất và vai trò của nó trong chương trình giảng dạy. Một ví dụ điển hình là bài báo của George Cobb và các phản hồi của nó . Dưới đây là một số trích dẫn có liên quan:

Thực tiễn thống kê hiện đại rộng hơn nhiều so với được công nhận bởi sự nhấn mạnh ngoại khóa truyền thống của chúng tôi vào suy luận dựa trên xác suất.

Những gì chúng ta dạy chậm trễ hàng thập kỷ đằng sau những gì chúng ta thực hành. Mô hình ngoại khóa của chúng tôi nhấn mạnh suy luận chính thức từ định hướng thường xuyên, dựa trên định lý giới hạn trung tâm ở cấp đầu vào hoặc, trong khóa học cho các chuyên ngành toán học, trên một tập hợp nhỏ các mô hình xác suất tham số cho vay đối với các giải pháp dạng đóng có nguồn gốc bằng phép tính . Khoảng cách giữa chương trình giảng dạy cũ nửa thế kỷ của chúng tôi và thực tiễn thống kê đương đại của chúng tôi tiếp tục mở rộng.

Luận án của tôi ... là một nghề nghiệp, chúng tôi chỉ mới bắt đầu khám phá các khả năng. Lịch sử của chủ đề của chúng tôi cũng ủng hộ luận điểm này: Không giống như xác suất, một nhánh của toán học, số liệu thống kê mọc lên từ đất của khoa học.

Xác suất là một khái niệm nổi tiếng trơn. Khoảng cách giữa trực giác và điều trị chính thức có thể rộng hơn bất kỳ nhánh toán học ứng dụng nào khác. Nếu chúng tôi khẳng định rằng tư duy thống kê nhất thiết phải dựa trên một mô hình xác suất, làm thế nào để chúng tôi dung hòa được yêu cầu đó với các mục tiêu tạo ra ý tưởng trung tâm, đơn giản và dễ tiếp cận và điều tối thiểu hóa các điều kiện tiên quyết để nghiên cứu điều chỉnh?

Là một thử nghiệm tư duy, chạy qua các khái niệm cơ bản và lý thuyết ước tính. Lưu ý rằng hầu như tất cả chúng có thể được giải thích và minh họa bằng cách chỉ sử dụng phép tính học kỳ đầu tiên, với xác suất được đưa ra trên đường đi.

Tất nhiên chúng tôi muốn sinh viên học tính toán và xác suất, nhưng thật tuyệt nếu chúng tôi có thể tham gia tất cả các ngành khoa học khác trong việc giảng dạy các khái niệm cơ bản của môn học cho sinh viên năm thứ nhất.

Có nhiều hơn như thế này. Bạn có thể tự đọc nó; các tài liệu có sẵn miễn phí.

Tài liệu tham khảo

Vấn đề đặc biệt của Thống kê Hoa Kỳ về "Thống kê và Chương trình giảng dạy Đại học" (tháng 11 năm 2015) có sẵn tại http://amstat.tandfonline.com/toc/utas20/69/4 .

Dạy thế hệ thống kê tiếp theo Học sinh nghĩ về dữ liệu: Vấn đề đặc biệt về thống kê và chương trình giảng dạy đại học Nicholas J. Horton & Johanna S. Hardin DOI: 10.1080 / 00031305.2015.1094283

Việc cải tạo chỉ là quá ít quá muộn: Chúng ta cần phải xem xét lại chương trình giảng dạy đại học của mình từ khi bắt đầu George Cobb DOI: 10.1080 / 00031305.2015.1093029

Thống kê giảng dạy tại Google-quy mô Nicholas Chamandy, Omkar Muralidharan & Stefan Wager trang 283-291 DOI: 10.1080 / 00031305.2015.1089790

Những khám phá trong nghiên cứu thống kê: Cách tiếp cận để giúp các sinh viên phân tích dữ liệu xác thực Deborah Nolan & Duncan Temple Lang DOI: 10.1080 / 00031305.2015.1073624

Vượt quá bình thường: Chuẩn bị sinh viên cho lực lượng lao động trong tư vấn thống kê Capstone Byran J. Smucker & A. John Bailer DOI: 10.1080 / 00031305.2015.1077731

Khung để truyền kinh nghiệm dữ liệu xác thực trong các khóa học thống kê Scott D. Grimshaw DOI: 10.1080 / 00031305.2015.1081106

Thúc đẩy sự hiểu biết khái niệm trong thống kê toán học Jennifer L. Green & Erin E. Blankenship DOI: 10.1080 / 00031305.2015.1069759

Khóa học thứ hai về Thống kê: Thiết kế và Phân tích Thí nghiệm? Natalie J. Blades, G. Bruce Schaalje & William F. Christensen DOI: 10.1080 / 00031305.2015.1086437

Một khóa học về khoa học dữ liệu dành cho sinh viên: Suy nghĩ với dữ liệu Ben Baumer DOI: 10.1080 / 00031305.2015.1081105

Khoa học dữ liệu trong chương trình giảng dạy thống kê: Chuẩn bị cho học sinh nghĩ về dữ liệu J. J. Hardin, R. Hoerl, Nicholas J. Horton, D. Nolan, B. Baumer, O. Hall-Holt, P. Murrell, R. Peng, P Roback, D. Temple Lang & MD Phường DOI: 10.1080 / 00031305.2015.1077729

Sử dụng Mô phỏng dựa trên trò chơi trực tuyến để tăng cường sự hiểu biết của sinh viên về các vấn đề thống kê thực tế trong phân tích dữ liệu trong thế giới thực Shonda Kuiper & Rodney X. Sturdivant DOI: 10.1080 / 00031305.2015.1075421

Kết hợp tư duy chống thống kê bằng các phương pháp dựa trên mô phỏng trong suốt chương trình giảng dạy đại học, Nathan Tintle, Beth Chance, George Cobb, Soma Roy, Todd Swanson & Jill VanderStoep DOI: 10.1080 / 00031305.2015.1081619

Những gì giáo viên nên biết về Bootstrap: Lấy mẫu lại trong chương trình giảng dạy thống kê đại học Tim C. Hesterberg DOI: 10.1080 / 00031305.2015.1089789

Kết hợp các nghiên cứu điển hình về tư vấn thống kê trong các khóa học về thời gian giới thiệu Davit Khachatryan DOI: 10.1080 / 00031305.2015.1026611

Phát triển Chương trình đại học phân tích tính toán liên ngành mới: Phương pháp tiếp cận định tính - định lượng - định tính Scotland Leman, Leanna House & Andrew Hoegh DOI: 10.1080 / 00031305.2015.1090337

Từ hướng dẫn chương trình giảng dạy đến kết quả học tập: Đánh giá ở cấp độ chương trình Beth Chance & Roxy Peck DOI: 10.1080 / 00031305.2015.1077730

Đánh giá chương trình cho một thống kê đại học Major Allison Amanda Moore & Jennifer J. Kaplan DOI: 10.1080 / 00031305.2015.1087331


3
(+1) Tôi nghĩ rằng đây là một phản ứng tuyệt vời. Vấn đề với lý thuyết xác suất giảng dạy trước tiên, là nó mang lại ấn tượng rằng các số liệu thống kê liên quan đến đặc điểm kỹ thuật, sự phù hợp và chẩn đoán của các mô hình xác suất. Đây không chỉ là một phần nhỏ của thống kê, mà nó bỏ qua một số vấn đề cơ bản nhất khi nghĩ về dữ liệu: làm thế nào để hình dung nó và làm thế nào để tóm tắt nó. Các giá trị tương đối của trung bình hoặc trung bình để xác định vị trí của một tập dữ liệu là gì? Làm thế nào chúng ta nên lập bảng chéo kết quả của chúng tôi? Đồ thị nào là phù hợp, và chúng cho chúng ta biết gì về dữ liệu?
Cá bạc

@Silverfish, nó rất khác so với cách những người như Bernoulli tiếp cận thống kê. Hãy xem bài báo tuyệt đẹp này của anh ấy Một nỗ lực phân tích mới về tỷ lệ tử vong do bệnh đậu mùa và về những lợi ích của tiêm chủng để ngăn chặn nó . Về cơ bản, ông bắt đầu dịch tễ học hiện đại với nó. Nếu anh ta cố định vào những điều bạn đề cập như trực quan hóa, v.v., anh ta sẽ không mang lại cái nhìn sâu sắc về sự hiểu biết về quy trình cơ bản.
Aksakal

@Aksakal Tôi không nói rằng mô hình hóa là không quan trọng, cũng không phải là một lý thuyết xác suất tốt không quan trọng. Nhưng số liệu thống kê rộng hơn thế này. Tôi nghĩ rằng đó là một sai lầm khi xem lý thuyết xác suất là nền tảng: hoặc trong phạm vi của nó, điều này có nghĩa là nó phải được dạy trước tiên. Người ta có thể thấy số vô tỷ như hoặc lần đầu tiên ở trường trung học, nhưng họ không giới thiệu chúng qua các lần cắt của Dedekind! Hiểu dữ liệu là điều mà phần lớn sinh viên dễ tiếp cận mà không có nền tảng ưu tiên toán học và việc tìm ra các mẫu quan trọng hơn súp giá trị p. 2π
Cá bạc

Để có những bước đột phá đầu tiên trong dịch tễ học, tôi sẽ nêu cho bạn nghiên cứu của John Snow về sự bùng phát dịch tả đường phố năm 1854 - một điều được tìm thấy trong nhiều cuốn sách hay giới thiệu trực quan hóa dữ liệu và các quá trình suy nghĩ chắc chắn phải thuộc về trung tâm của Chỉ số 101.
Silverfish

1
@Aksakal Tôi đánh giá cao việc bạn đề cập đến Bernoulli. Tuy nhiên, làm thế nào những người tiên phong và các nhà toán học vĩ đại tiếp cận và giải quyết vấn đề hoàn toàn là một điều khác với cách các giải pháp nên được dạy. Tôi muốn nhấn mạnh rằng không ai (afaik) ủng hộ việc không dạy xác suất: câu hỏi quan tâm khi những ý tưởng đó nên được đưa ra trong chương trình giảng dạy (đại học) và ở mức độ nào chúng nên được theo đuổi. Có những lý do sư phạm mạnh mẽ (căn cứ vào tâm lý học cũng như kinh nghiệm giảng dạy) để giới thiệu nhiều ý tưởng thống kê trước tiên.
whuber

7

Số nhiều của giai thoại không phải là dữ liệu, nhưng trong hầu hết mọi khóa học tôi đã thấy, ít nhất là những điều cơ bản của xác suất xuất hiện trước khi thống kê.

Mặt khác, trong lịch sử, bình phương tối thiểu bình thường đã được phát triển trước khi phân phối bình thường được phát hiện! Phương pháp thống kê được đưa ra đầu tiên, sự biện minh dựa trên xác suất chặt chẽ hơn về lý do tại sao nó hoạt động lại đứng thứ hai!

Lịch sử thống kê của Stephen Stigler : Đo lường sự không chắc chắn trước năm 1900 đưa người đọc đi qua sự phát triển lịch sử:

  • Các nhà toán học, nhà thiên văn học hiểu cơ học cơ bản và định luật hấp dẫn. Họ có thể mô tả chuyển động của các thiên thể như là một hàm của một số tham số.
  • Họ cũng đã có hàng trăm quan sát của các thiên thể, nhưng các quan sát nên được kết hợp như thế nào để phục hồi các thông số?
    • Một trăm quan sát cung cấp cho bạn một trăm phương trình, nhưng nếu chỉ có ba ẩn số để giải quyết, thì đây là một hệ thống quá hạn ...
  • Legendre là người đầu tiên phát triển phương pháp giảm thiểu tổng sai số bình phương. Sau này, điều này được kết nối với công việc xác suất của Gauss và Laplace, rằng bình phương tối thiểu thông thường theo một nghĩa nào đó tối ưu được đưa ra với các lỗi phân phối thông thường.

Tại sao tôi lại mang cái này lên?

Có một sự tao nhã logic nhất định để xây dựng bộ máy toán học cần thiết để rút ra, hiểu một số phương pháp, để đặt nền móng trước khi bạn xây dựng ngôi nhà.

Trong thực tế của khoa học, ngôi nhà thường đến trước, nền tảng thứ hai: P.

Tôi muốn thấy kết quả từ các tài liệu giáo dục. Điều gì hiệu quả hơn cho việc giảng dạy? Vậy thì tại sao? Hay tại sao sau đó những gì?

(Tôi có thể là một kẻ lập dị, nhưng tôi đã tìm thấy câu chuyện về cách các hình vuông nhỏ nhất được phát triển để trở thành một công cụ lật trang thú vị! Câu chuyện có thể làm cho những thứ trừu tượng, nhàm chán trở nên sống động ...)


2
Các tài liệu giáo dục thống kê dường như nhất quán và không rõ ràng về vấn đề này: xác suất không phải là thống kê, thống kê nhiều hơn xác suất và thống kê (ít nhất là ở cấp K-12 và đại học) nên được giới thiệu như suy nghĩ với dữ liệu thay vì một ứng dụng của xác suất. Ngoài các tài liệu tham khảo mà tôi đã cung cấp trong câu trả lời của mình, hãy xem một số tài nguyên có sẵn miễn phí khác như CauseWeb , GAISEJ. Statistics Education .
whuber

4

Tôi nghĩ rằng nó nên là một quá trình lặp đi lặp lại cho hầu hết mọi người: bạn học một ít xác suất, sau đó một chút thống kê, sau đó xác suất nhiều hơn một chút, và thêm một chút thống kê, v.v.

Ví dụ, hãy xem các yêu cầu của Tiến sĩ Stat tại GWU. Khóa học Xác suất cấp tiến sĩ 8257 có mô tả ngắn gọn sau:

STAT 8257. Probability. 3 Credits.
Probabilistic foundations of statistics, probability distributions, random variables, moments, characteristic functions, modes of convergence, limit theorems, probability bounds. Prerequisite: STAT 6201– STAT 6202, knowledge of calculus through functions of several variables and series.

Lưu ý, làm thế nào nó có các khóa học thống kê cấp độ Thạc sĩ 6201 và 6202 trong các điều kiện tiên quyết. Nếu bạn đi sâu vào chỉ số xác suất hoặc khóa học xác suất ở mức thấp nhất trong GWU, bạn sẽ có được Giới thiệu về Thống kê kinh tế và kinh tế 1051 hoặc Giới thiệu về thống kê trong khoa học xã hội 1053 . Đây là mô tả cho một trong số họ:

STAT 1051. Introduction to Business and Economic Statistics. 3 Credits.
Lecture (3 hours), laboratory (1 hour). Frequency distributions, descriptive measures, probability, probability distributions, sampling, estimation, tests of hypotheses, regression and correlation, with applications to business.

Lưu ý, làm thế nào khóa học có tiêu đề "Thống kê" nhưng nó dạy một xác suất trong đó. Đối với nhiều người, đây là cuộc chạm trán đầu tiên với lý thuyết Xác suất sau khóa học "Thống kê" của trường trung học.

Điều này hơi giống với cách nó được dạy trong thời của tôi: các khóa học và sách giáo khoa thường có tiêu đề "Lý thuyết xác suất và thống kê toán học", ví dụ văn bản của Gmurman .

Tôi không thể tưởng tượng nghiên cứu lý thuyết xác suất mà không có bất kỳ số liệu thống kê nào. Khóa học trình độ tiến sĩ trên 8257 giả định rằng bạn đã biết số liệu thống kê. Vì vậy, ngay cả khi bạn lần đầu tiên dạy xác suất, sẽ có một số thống kê học tập liên quan. Đây chỉ là khóa học đầu tiên có lẽ có ý nghĩa để cân nhắc nhiều hơn về thống kê và cũng sử dụng nó để giới thiệu lý thuyết xác suất.

Cuối cùng, đó là một quá trình lặp đi lặp lại như tôi đã mô tả lúc đầu. Và như trong bất kỳ quy trình lặp tốt nào, bước đầu tiên không quan trọng, dù khái niệm đầu tiên là từ số liệu thống kê hay xác suất sẽ không thành vấn đề sau vài lần lặp: bạn sẽ đến cùng một vị trí.

Lưu ý cuối cùng, phương pháp giảng dạy phụ thuộc vào lĩnh vực của bạn. Nếu bạn đang học vật lý, bạn sẽ có được những thứ như cơ học thống kê, thống kê Fermi-Dirac, mà bạn sẽ không đối phó với khoa học xã hội. Ngoài ra, trong vật lý, các phương pháp tiếp cận thường xuyên là tự nhiên, và trên thực tế chúng là cơ sở của một số lý thuyết cơ bản. Do đó, thật hợp lý khi có một lý thuyết xác suất độc lập được dạy sớm, không giống như các ngành khoa học xã hội nơi nó có thể không có ý nghĩa nhiều khi dành thời gian cho nó và thay vào đó cân nhắc nhiều hơn về thống kê.


2
Một chương trình giảng dạy tiến sĩ, về mặt này, dường như sẽ cung cấp rất ít hướng dẫn liên quan đến cách dạy một môn học cho sinh viên đại học. Các mục tiêu và khán giả là hoàn toàn khác nhau. Tôi sẽ thêm một lưu ý cá nhân: trong các tương tác của tôi với một số bộ phận thống kê đã thành lập, tôi đã thấy rằng chương trình giảng dạy phản ánh những ý tưởng sư phạm và tiến bộ 30 năm và sẽ tiếp tục như vậy cho đến khi một thế hệ giáo sư mới tiếp quản. Có lẽ chúng ta nên thận trọng khi sử dụng các chương trình giảng dạy như các mô hình quy phạm về những gì nên được thực hiện.
whuber

1
@whuber Và sau đó, chương trình giảng dạy sẽ phản ánh những ý tưởng 30 năm tuổi ... nhưng ít nhất chúng sẽ không phải là những ý tưởng 60 tuổi. Nhưng dù sao, như đã nói, khoa học tiến bộ, tang lễ bằng tang lễ.
Mark L. Stone
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.