Sử dụng mô phỏng máy tính để hiểu rõ hơn các khái niệm thống kê ở cấp độ sau đại học


11

Xin chào Tôi đang tham gia một khóa học sau đại học về Thống kê và chúng tôi đã đề cập đến thống kê Kiểm tra và các khái niệm khác.

Tuy nhiên, tôi thường có thể áp dụng các công thức và phát triển một loại trực giác về cách thức hoạt động của công cụ nhưng tôi thường cảm thấy rằng có lẽ nếu tôi sao lưu nghiên cứu của mình bằng các thí nghiệm mô phỏng, tôi sẽ phát triển trực giác tốt hơn trong các vấn đề trong tay .

Vì vậy, tôi đã nghĩ đến việc viết các mô phỏng đơn giản để hiểu rõ hơn một số khái niệm chúng ta thảo luận trong lớp. Bây giờ tôi có thể sử dụng nói Java để:

  1. Tạo ra một quần thể ngẫu nhiên với độ lệch chuẩn và trung bình bình thường.
  2. Sau đó lấy một mẫu nhỏ và cố gắng tính toán theo kinh nghiệm các lỗi Loại I và Loại II.

Bây giờ các câu hỏi tôi có là:

  1. Đây có phải là một cách tiếp cận hợp pháp để phát triển trực giác?
  2. Có phần mềm để làm điều này ( SAS?, R?)
  3. Đây có phải là một môn học trong Thống kê liên quan đến lập trình như vậy: thống kê thử nghiệm không?, thống kê tính toán? mô phỏng?

1
Tôi sử dụng mô phỏng mọi lúc để cố gắng hiểu rõ hơn những gì đang diễn ra. Bạn có thể sử dụng khá nhiều ngôn ngữ lập trình hoặc chương trình thống kê để thực hiện các loại thử nghiệm này (thậm chí cả Excel).
Giăng

1
+1, mô phỏng và số liệu là 2 trong số các kỹ thuật hữu ích nhất để xây dựng trực giác. Tôi đã sử dụng chúng thường xuyên để giúp người khác và bản thân tôi hiểu mọi thứ. Có rất nhiều câu trả lời cho các câu hỏi CV sử dụng sim để minh họa. Nếu bạn muốn một số liên kết, tôi có thể dễ dàng liệt kê một số câu trả lời của riêng tôi đã sử dụng sim theo cách này. Bạn cũng có thể đặt câu hỏi ở đây trên CV theo hướng này; ví dụ: 'Tôi đang cố gắng hiểu _____, nhưng tôi đang gặp khó khăn, ai đó có thể đưa ra lời giải thích với một sim sẽ làm cho nó rõ ràng hơn không?' hoặc, 'Tôi đã làm chiếc sim này và nó gợi ý rằng nó hoạt động theo cách này, đúng không?'
gung - Tái lập Monica

4
Trong nỗ lực đáp ứng các tiêu chuẩn và kỳ vọng cao của trang web này, tôi sử dụng mô phỏng (cũng như các dẫn xuất lý thuyết và minh họa) trong mọi câu trả lời sẽ có lợi từ nó. Một phần lớn các câu trả lời gần đây của tôi sẽ bao gồm một số hình thức mô phỏng, đặc biệt là hầu hết mọi câu trả lời cho câu hỏi với thẻ r . Ví dụ: bạn có thể xem qua chúng từ trang tìm kiếm nếu bạn quan tâm.
whuber

2
Bạn sẽ tìm thấy rất nhiều câu hỏi hay bằng cách xem qua các câu trả lời của @ whuber. Vì các câu trả lời của tôi (& khả năng lập trình) có xu hướng ít phức tạp hơn, nên chúng có thể tạo ra bước đầu tiên tốt đẹp. Tôi sử dụng một sim để chỉ ra rằng thật khó để sử dụng mô hình phù hợp để chọn liên kết tốt nhất trong GLiM ở đây: sự khác biệt giữa mô hình logit và mô hình probit . Ở đây tôi sử dụng một sim để chỉ ra cách giảm sức mạnh khi kích thước nhóm trở nên không đồng đều trong thử nghiệm t: làm thế nào để diễn giải việc so sánh các phương tiện từ các kích cỡ mẫu khác nhau .
gung - Phục hồi Monica

2
Câu hỏi CV này: giải thích về mô phỏng thống kê , cũng có thể được độc giả quan tâm của chủ đề này.
gung - Phục hồi Monica

Câu trả lời:


7

Tôi thích câu hỏi của bạn nhưng không có câu trả lời cụ thể cho 2 và 3? Tôi tưởng tượng rằng các gói phần mềm như SAS (nói rộng ra các sản phẩm của SAS và không chỉ là SAS / STAT) có thể có các công cụ hỗ trợ mô phỏng nhưng tôi không thể nói chắc chắn. Tôi không nghĩ rằng loại điều này phù hợp như một nhánh của toán học hoặc thống kê.

Bây giờ câu hỏi 1 là những gì tôi muốn tập trung vào. Mô phỏng có thể giúp học thống kê ở tất cả các cấp và có thể hỗ trợ nghiên cứu thống kê nói chung. Thật vậy, có những tạp chí tập trung vào mô phỏng và tính toán. Ngay cả FDA cũng nhận ra sự thiếu sót của mô phỏng trong việc thiết kế các thử nghiệm lâm sàng và để giúp dự đoán kết quả.

Trong những năm 1960, Julian Simon đã dạy các số liệu thống kê giới thiệu sử dụng mô phỏng như một động lực. Mặc dù gây tranh cãi, sau đó ông tuyên bố rằng ông đã thực hiện việc lấy lại mẫu (hoán vị và bootstrap) trước Efron. Ông đã xuất bản một cuốn sách sử dụng những ý tưởng này vào năm 1969. Nó chắc chắn thiếu lý thuyết và chỉ là một trợ giúp giảng dạy và không phải là một cách tiếp cận mới để ước tính thống kê. Ông không phát triển bất kỳ tính chất toán học nào đi kèm và sau Efron.

Tôi nghĩ đối với thống kê giới thiệu, rất hữu ích khi thực hiện mô phỏng để chứng minh phân phối lấy mẫu, cho thấy định lý giới hạn trung tâm xuất hiện và mô phỏng vật lý thông qua quincunx chứng minh phiên bản DeMoivre - Laplace của định lý giới hạn trung tâm.

Đôi khi nó tăng cường trực giác. Tôi nghĩ rằng vấn đề Monty Hall là khó hiểu và có vẻ nghịch lý ngay cả với các nhà toán học như Paul Erdos. Nhưng mô phỏng trò chơi thường rất thuyết phục. Có rất nhiều vấn đề trong xác suất là phản trực giác và mô phỏng có thể, tôi nghĩ giúp.

Vào năm 1978 khi tôi đang làm luận án tiến sĩ về lý thuyết giá trị cực trị, tôi đã có một ý tưởng trực quan cho một định lý giới hạn mà tôi đang cố gắng chứng minh. Tôi vật lộn với toán học. Sau đó, tôi quyết định mô phỏng quá trình ngẫu nhiên và mô phỏng "xác nhận" kết quả của tôi. Điều này đã cho tôi sự tự tin để thúc đẩy chứng minh điều đó.

Vì vậy, ngay cả ở cấp độ sau đại học và ngoài mô phỏng có thể hữu ích theo hai cách.

  1. Để giúp phát triển trực giác như bạn đề xuất trong câu hỏi 1 mà còn

  2. Để xác nhận trực giác như tôi đã làm trong luận án của mình


Tôi đã tìm thấy ai đó đã giải quyết vấn đề Monty Hall ở SAS và R ở đây sas-and-r.blogspot.com/2010/01/ ám - enjoy
user1172468

Susan Holmes tại Đại học Stanford đã đưa mô phỏng trò chơi Monty Hall lên trang web của mình vài năm trước. Cảm ơn đã nhắc nhở chúng tôi @ user1172468 rằng nhiều người có thể và có thể đang đưa các mô phỏng lên các trang web lý thuyết.
Michael R. Chernick

Vấn đề Monty Hall với R (rất dễ theo dõi): bodowinter.com/tutorial/bw_doodling_monty_hall.pdf
vasili111

8
  1. Đúng. Sau tất cả, đó là về trực giác của bạn .
  2. R sẽ phù hợp với bạn tốt. Mã hóa sẽ khá dễ dàng cho bạn nếu bạn đã biết Java (hoặc bất kỳ "ngôn ngữ lập trình chuẩn" nào khác cho vấn đề đó).
  3. Thống kê tính toán liên quan đến việc thiết kế các thuật toán để thực hiện các phương pháp thống kê, có lẽ đó là gần nhất với những gì bạn cố gắng mô tả ở đây.

Hãy vui vẻ với khóa học của bạn!


Tôi nghĩ rằng câu trả lời của bạn khen ngợi tôi. Tôi đã trả lời chi tiết cho 1 và bạn đã cung cấp câu trả lời dứt khoát hơn cho 2 và 3. Bạn dường như đang trả lời câu hỏi trong vòng vài phút của tôi. Chúng tôi có lẽ chồng chéo. Dù sao bạn đã đưa ra 2 câu trả lời hay và tôi đã đưa ra những lời khen ngợi cho họ!
Michael R. Chernick

Cảm ơn cho ngón tay cái lên! Có vẻ như bạn là một bước đi trước tôi trong việc trả lời. :)
usεr11852

Hãy tiếp tục trả lời. Tôi sẽ nghỉ ngơi Tôi đã gần đạt đến giới hạn đại diện hàng ngày của tôi rồi.
Michael R. Chernick

Các bạn, tôi nghĩ cả hai câu trả lời đều tốt. Tôi đã chọn câu trả lời của @ Michael vì tôi chỉ có thể chọn một câu trả lời đúng và tôi cảm thấy đã giải quyết được một số vấn đề cơ bản hơn.
dùng1172468

1
@ user1172468 Bạn thực sự không cần phải giải thích nhưng thật tuyệt khi bạn đã làm như vậy.
Michael R. Chernick

4

Gói Dạy học dành cho R được sinh ra từ quá trình suy nghĩ tương tự như của bạn, cố gắng hình dung và hiểu các khái niệm theo những cách khác nhau. Có các chức năng trong gói sử dụng mô phỏng để giúp hiểu một số khái niệm chính. Phiên bản phát triển (R-forge, nhưng chưa có trên CRAN) bao gồm chức năng "simfun" có thể được sử dụng để tạo các chức năng mô phỏng để tiếp tục trợ giúp mô phỏng.



1
Ngoài ra danh sách các liên kết Dạy và học khác để thống kê với R: cran.r-project.org/web/view/TeachingStatistic.html
vasili111
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.