Làm cho ý nghĩa của lý thuyết và ứng dụng thống kê


13

Gần đây tôi đã tốt nghiệp thạc sĩ về mô hình y học và sinh học, đi kèm với toán kỹ thuật làm nền tảng. Mặc dù chương trình giáo dục của tôi bao gồm một số lượng đáng kể các khóa học về thống kê toán học (xem danh sách bên dưới), mà tôi đã quản lý với điểm số khá cao, tôi vẫn thường xuyên bị mất hoàn toàn khi nhìn xuống cả lý thuyết và ứng dụng thống kê. Tôi phải nói rằng, so với toán học "thuần túy", số liệu thống kê thực sự có ý nghĩa rất nhỏ đối với tôi. Đặc biệt là các ký hiệu và ngôn ngữ được sử dụng bởi hầu hết các nhà thống kê (bao gồm cả các giảng viên trước đây của tôi) rất khó chịu và hầu như không có tài nguyên nào tôi thấy cho đến nay (bao gồm cả wikipedia) có các ví dụ đơn giản mà người ta có thể dễ dàng liên quan và liên kết với lý thuyết được đưa ra. ..

Đây là nền tảng; Tôi cũng nhận ra một thực tế cay đắng rằng tôi không thể có sự nghiệp là một nhà nghiên cứu / kỹ sư mà không nắm vững các số liệu thống kê, đặc biệt là trong lĩnh vực tin sinh học.

Tôi đã hy vọng rằng tôi có thể nhận được một số lời khuyên từ các nhà thống kê / toán học có kinh nghiệm hơn. Làm thế nào tôi có thể khắc phục vấn đề này tôi đã đề cập ở trên? Bạn có biết bất kỳ nguồn lực tốt; chẳng hạn như sách, sách điện tử, các khóa học mở (thông qua iTunes hoặc OpenC thuyết minh cho ex) v.v.

EDIT: Như tôi đã đề cập, tôi khá thiên vị (tiêu cực) đối với phần lớn các tài liệu theo tiêu đề chung về thống kê, và vì tôi không thể mua một số lượng lớn các khóa học (và đắt tiền) cho mỗi nhánh thống kê, những gì tôi cần về mặt cuốn sách là một cái gì đó tương tự như những gì Tipler & Mosca dành cho Vật lý, nhưng thay vào đó là về thống kê.

Đối với những người không biết về Tipler; đó là một cuốn sách giáo khoa lớn bao gồm phần lớn các môn học mà người ta có thể gặp trong các nghiên cứu cao hơn, và trình bày chúng từng phần từ giới thiệu cơ bản đến chi tiết sâu hơn một chút. Về cơ bản là một cuốn sách tham khảo hoàn hảo, đã mua nó trong năm đầu tiên của tôi ở uni, thỉnh thoảng vẫn sử dụng nó.


Các khóa học tôi đã thực hiện về thống kê:

  • một khóa học giới thiệu lớn,
  • quá trình ngẫu nhiên cố định,
  • Quá trình Markov,
  • Phương pháp Monte Carlo
  • Phân tích sống còn

Câu trả lời:


4

Tôi hoàn toàn có thể hiểu tình hình của bạn. Mặc dù tôi là nghiên cứu sinh, đôi khi tôi cảm thấy khó khăn với lý thuyết và ứng dụng liên quan. Nếu bạn sẵn sàng đắm mình trong việc hiểu lý thuyết, chắc chắn sẽ rất bổ ích khi bạn nghĩ về các vấn đề trong thế giới thực. Nhưng quá trình có thể gây bực bội.

Một trong nhiều tài liệu tham khảo mà tôi thích là Phân tích dữ liệu của Gelman và Hill bằng cách sử dụng các mô hình phân cấp / đa cấp . Họ tránh lý thuyết nơi họ có thể diễn đạt khái niệm cơ bản bằng cách sử dụng mô phỏng. Nó chắc chắn sẽ có lợi cho bạn khi bạn có kinh nghiệm về MCMC, v.v. Như bạn nói, bạn đang làm việc trong lĩnh vực tin sinh học, có lẽ Chiến lược mô hình hồi quy của Mitchell cũng là một tài liệu tham khảo tuyệt vời.

Tôi sẽ biến nó thành wiki cộng đồng và để người khác thêm vào nó.


Cảm ơn sự quan tâm của bạn về vấn đề này. Thật tuyệt khi thấy rằng tôi không phải là người duy nhất bị lẫn lộn về những thứ này. Điều đó đang được nói, tôi nghĩ rằng bạn đã đánh giá quá cao tình hình của tôi; trong khi tôi đã tham gia một số khóa học và quen thuộc với sự tồn tại của một số cách phân tích thống kê khác nhau; họ không bao giờ gắn bó với tôi sau các khóa học. Một vài tháng sau kỳ thi, tôi cứ thấy mình băn khoăn; "Tôi đã thấy / nghe thấy điều này ở đâu đó, nhưng làm thế nào nó thực sự hoạt động?" Điều này với tôi gợi ý rằng tôi cần xé nát tất cả và bắt đầu xây dựng nó với một nền tảng vững chắc hơn.
posdef

Tôi sẽ thêm một "đồng ý" vang dội cho văn bản (ghi chú chính tả) của Mitchell. Nó là tuyệt vời như là sự kết hợp hai gói của mã R đi kèm với nó. Tôi cũng nghĩ rằng "Thống kê ứng dụng hiện đại với S" của Venables và Ripley sẽ là một sự mua lại tốt. Tôi đã có một nền tảng trình độ thạc sĩ (với bằng đại học về vật lý) trước khi sử dụng MASS để học R. Có rất nhiều trí tuệ ứng dụng trong văn bản đó.
DWin

Cuốn sách hồi quy Gelman là tuyệt vời, ông giải thích tất cả rất tốt, và cung cấp mã R thực sự hữu ích để kiểm tra sự hiểu biết của bạn về tài liệu.
richiemorrisroe

2

Bạn có quen thuộc với Phân tích dữ liệu Bayes (của Gelman, Carlin, Stern và Rubin) không? Có lẽ đó là những gì bạn cần một liều.


2

Tất cả các vấn đề thống kê cần thiết để thực hiện theo 4 bước (mà tôi đã mượn từ câu trả lời @whuber cho một câu hỏi khác ):

  1. Ước tính tham số.

  2. Đánh giá chất lượng của ước tính đó.

  3. Khám phá dữ liệu.

  4. Đánh giá sự phù hợp.

Bạn có thể trao đổi tham số từ với mô hình từ .

Sách thống kê thường trình bày hai điểm đầu tiên cho các tình huống khác nhau. Vấn đề mà mỗi ứng dụng trong thế giới thực đòi hỏi cách tiếp cận khác nhau, do đó mô hình khác nhau, do đó một phần lớn các cuốn sách kết thúc việc phân loại các mô hình khác nhau này. Điều này có tác dụng không mong muốn là dễ dàng đánh mất chính mình trong các chi tiết và bỏ lỡ bức tranh lớn.

Cuốn sách ảnh lớn mà tôi chân thành giới thiệu là thống kê tiệm cận . Nó đưa ra một cách xử lý nghiêm ngặt về chủ đề và về mặt toán học là "thuần túy". Mặc dù tiêu đề của nó đề cập đến các số liệu thống kê tiệm cận, nhưng bí mật lớn chưa được tiết lộ là phần lớn các phương pháp thống kê cổ điển về bản chất dựa trên các kết quả tiệm cận.


2

Tôi nghĩ rằng điều quan trọng nhất ở đây là phát triển một trực giác về thống kê và một số khái niệm thống kê chung. Có lẽ cách tốt nhất để làm điều này là có một số tên miền mà bạn có thể "sở hữu". Điều này có thể cung cấp một vòng phản hồi tích cực trong đó việc hiểu về tên miền giúp bạn hiểu thêm về các số liệu thống kê cơ bản, giúp bạn hiểu thêm về tên miền, v.v.

Đối với tôi miền đó là số liệu thống kê bóng chày. Tôi hiểu rằng một người đánh bóng đi 3 cho 4 trong một trò chơi không phải là một "hitter" đúng .750. Điều này giúp hiểu được điểm chung hơn là dữ liệu mẫu không giống với phân phối cơ bản. Tôi cũng biết rằng anh ta có lẽ gần với một người chơi trung bình hơn là một người chơi .750, vì vậy điều này giúp hiểu các khái niệm như hồi quy trung bình. Từ đó tôi có thể đi đến suy luận Bayes đầy đủ trong đó phân phối xác suất trước của tôi có ý nghĩa của cầu thủ bóng chày trung bình và bây giờ tôi có 4 mẫu mới để cập nhật phân phối sau của mình.

Tôi không biết tên miền đó là gì cho bạn, nhưng tôi đoán nó sẽ hữu ích hơn một cuốn sách giáo khoa. Các ví dụ giúp hiểu lý thuyết, giúp hiểu các ví dụ. Một cuốn sách giáo khoa với các ví dụ là tốt, nhưng trừ khi bạn có thể làm cho các ví dụ đó là "của bạn" thì tôi tự hỏi liệu bạn sẽ nhận được đủ từ chúng hay không.



1

Mọi người học khác nhau, nhưng tôi nghĩ thật an toàn khi nói rằng các ví dụ, ví dụ, ví dụ, giúp ích rất nhiều cho việc thống kê. Đề nghị của tôi sẽ là học R (chỉ những điều cơ bản là đủ để giúp đỡ rất nhiều) và sau đó bạn có thể thử bất kỳ và mọi ví dụ cho đến khi mắt bạn chảy máu. Bạn có thể sắp xếp nó, phù hợp với nó, vẽ nó, bạn đặt tên cho nó. Và, vì R hướng đến thống kê, khi bạn học R, bạn sẽ học thống kê. Những cuốn sách mà bạn liệt kê sau đó có thể bị tấn công theo quan điểm "chỉ cho tôi".

Vì R là miễn phí và rất nhiều tài liệu nguồn là miễn phí, tất cả những gì bạn cần đầu tư là thời gian của bạn.

http://www.mayin.org/ajayshah/KB/R/index.html

http://math.illinoisstate.edu/dhkim/r ware / rututor.html

http://www.cyclismo.org/tutorial/R/

http://www.stat.pitt.edu/stoffer/tsa2/R_time_series_quick_fix.htmlm

http://www.statmethods.net/about/books.html

Có nhiều cuốn sách hay về R mà bạn có thể mua, đây là cuốn sách tôi đã sử dụng:

http://www.amazon.com/Intributiontory-Statistic-R-Peter-Dalgaard/dp/0387954759

Chỉnh sửa ============

Tôi quên thêm một vài liên kết. Nếu bạn đang sử dụng Windows, một trình soạn thảo tốt để cung cấp R là Tinn-R (người khác có thể thêm liên kết cho người chỉnh sửa trên máy Mac hoặc Linux).

http://www.sciviews.org/Tinn-R/

http://cran.r-project.org/web/packages/TinnR/


cảm ơn vì các liên kết, tôi sẽ cố gắng và vượt qua chúng nhiều nhất có thể trong những tuần tới ... Tôi đã được tiếp xúc với R một lần trước đó, trong khóa học phân tích sinh tồn, trong đó chúng tôi đã thực hiện nhiều hồi quy đa biến (cox và aelen mô hình) và một loạt các thứ khác tôi thực sự không thể nhớ lại. Ấn tượng của tôi về R, với tư cách là một người rất quen thuộc với MATLAB khá tiêu cực, nhưng tôi đã làm được rất nhiều điều với thực tế là chúng tôi ít nhiều bị ném xuống đáy vực sâu, và sau đó mong đợi được học tự mình bơi, điều này tất nhiên dẫn đến việc tôi ghét phần mềm từ đó trở đi :) Đã đến lúc thay đổi điều đó có lẽ
posdef

1

Cá nhân tôi thích cái này có sự kết hợp tốt giữa lý thuyết và ứng dụng (với rất nhiều ví dụ). Đó là một kết hợp tốt với casella và berger cho một cách tiếp cận theo định hướng lý thuyết hơn. Và cho một tổng quan bàn chải rộng này .


Cả hai cuốn sách dường như có đánh giá tốt trên amazon, bất cứ ai cũng có thể thêm bất kỳ ý kiến ​​nào (có thể chi tiết hơn một chút) về những điều này? btw; bởi casella & berger, ý bạn là "Suy luận thống kê"?
posdef

Có "suy luận thống kê". Đối với tôi, một bước tiến lớn là từ việc hiểu các mô hình xác suất để hiểu cách sử dụng dữ liệu để kiểm tra các mô hình và ước tính các tham số của các mô hình. Đặc biệt là cuốn sách Davison thực sự tập trung vào điểm này.
alwaysean
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.