Chuyển từ sử dụng phần mềm thống kê để hiểu các phương trình toán học?


12

Bối cảnh:

Tôi là một sinh viên tiến sĩ tâm lý. Cũng như nhiều sinh viên tiến sĩ tâm lý học, tôi biết cách thực hiện các phân tích thống kê khác nhau bằng phần mềm thống kê, cho đến các kỹ thuật như PCA, cây phân loại và phân tích cụm. Nhưng nó không thực sự thỏa mãn bởi vì mặc dù tôi có thể giải thích tại sao tôi đã phân tích và ý nghĩa của các chỉ số, tôi không thể giải thích cách thức hoạt động của kỹ thuật này.

Vấn đề thực sự là việc làm chủ phần mềm thống kê rất dễ, nhưng nó còn hạn chế. Để học các kỹ thuật mới trong các bài viết đòi hỏi tôi phải hiểu cách đọc các phương trình toán học. Hiện tại tôi không thể tính giá trị riêng hoặc phương tiện K. Phương trình giống như một ngôn ngữ nước ngoài đối với tôi.

Câu hỏi:

  • Có một hướng dẫn toàn diện giúp hiểu các phương trình trong các bài báo?

Biên tập:

Tôi nghĩ rằng câu hỏi sẽ tự giải thích nhiều hơn: trên một sự phức tạp nhất định, ký hiệu thống kê trở nên vô nghĩa đối với tôi; giả sử tôi muốn mã hóa các hàm của riêng mình trong R hoặc C ++ để hiểu một kỹ thuật nhưng có một rào cản. Tôi không thể chuyển đổi một phương trình thành một chương trình. Và thực sự: Tôi không biết tình hình ở các trường tiến sĩ Hoa Kỳ, nhưng ở tôi (Pháp), các khóa học duy nhất tôi có thể theo dõi là về một phong trào xả rác ở thế kỷ 16 ...


@Coronier Xin lỗi, tôi nghi ngờ có một hướng dẫn toàn diện để hiểu các bài viết tâm lý sử dụng mô hình thống kê. Nhưng tất cả các nền tảng cần thiết phải ở cấp độ thạc sĩ về thống kê. Nếu chương trình của bạn sẽ trả tiền cho nó, hãy xem xét nhận MA trong thống kê. Tùy chọn tốt nhất tiếp theo cho mục đích của bạn có thể là lấy lại phiên bản thống kê đa biến của bộ phận thống kê - thông thường họ cung cấp các ghi chú với nền toán học cho PCA, phân cụm, cây, v.v. Bạn sẽ cần một nền tảng về đại số tuyến tính và toán học cơ bản thống kê bất kể
khóa

Hãy đặt câu hỏi cụ thể hơn.

4
Tôi cũng là một sinh viên tiến sĩ tâm lý học, và tôi đã lựa chọn học một số lượng đáng kể toán học trong những năm đại học của mình vì có rất nhiều tiến sĩ tâm lý học không biết PCA (ví dụ) được tính toán như thế nào. Điều đầu tiên bạn cần làm là thực hiện theo cách của bạn thông qua bất kỳ sách giáo khoa đại số tuyến tính phong nha. Một cuốn sách giáo khoa đại số tuyến tính là gì? Gilbert Strang là quả bom và anh ta có các bài giảng bằng video về khóa học đại số tuyến tính của mình trên trang web của MIT để khởi động. Bạn thậm chí có thể lấy chúng trên iTunes.
Phillip Cloud

1
Câu hỏi quá rộng đến nỗi nó sẽ không nhận được câu trả lời thỏa mãn trong một vài đoạn. Thống kê giống như các câu hỏi: sẽ dễ dàng hơn nếu bạn chia nó thành một số thành phần có thể quản lý được.
Cha

Tôi chỉ có thể đồng ý với các ý kiến ​​trên. Hoặc bạn sẽ phải tập trung vào một vấn đề cụ thể, hoặc bạn chỉ cần làm việc thông qua một số sách giáo khoa hoặc tài liệu trực tuyến trước. Một cuốn sách giáo khoa phù hợp bao gồm các khái niệm cơ bản cho thống kê đa biến với các hình minh họa là Công cụ toán học để phân tích đa biến ứng dụng , của Carroll và Green (AP, 1997, Rev. Ed.). Một số khác là Mô hình toán học và thống kê đa biến ứng dụng , bởi Tinsley và Brown (AP, 2000).
chl

Câu trả lời:


9

Tổng quat:

  • Ấn tượng của tôi là kinh nghiệm của bạn là phổ biến cho rất nhiều sinh viên trong các ngành khoa học xã hội.
  • Điểm khởi đầu là một động lực để học hỏi.
  • Bạn có thể đi xuống hoặc các tuyến hướng dẫn tự học hoặc chính thức .

Hướng dẫn chính thức:

Có nhiều lựa chọn về vấn đề này. Bạn có thể xem xét một thạc sĩ về thống kê hoặc chỉ tham gia một vài môn học trong một bộ phận thống kê. Tuy nhiên, có lẽ bạn muốn kiểm tra xem bạn có nền tảng toán học cần thiết hay không. Tùy thuộc vào khóa học, bạn có thể thấy rằng bạn cần phải xem lại toán học tiền tính toán, và có lẽ một số tài liệu như tính toán và đại số tuyến tính trước khi giải quyết các môn học thống kê nghiêm ngặt về toán học ở cấp đại học.

Tự học

Ngoài ra, bạn có thể đi xuống tuyến đường tự học. Có rất nhiều tài nguyên tốt trên internet. Trong đó, đọc và làm bài tập trong sách giáo khoa toán học rất quan trọng, nhưng có lẽ không đủ. Điều quan trọng là lắng nghe những người hướng dẫn nói về toán học và xem họ giải quyết vấn đề.

Điều quan trọng nữa là phải suy nghĩ về các mục tiêu toán học của bạn và các điều kiện tiên quyết toán học cần có để đạt được các mục tiêu đó. Nếu phương trình giống như một ngôn ngữ nước ngoài đối với bạn, thì bạn có thể thấy rằng trước tiên bạn cần học toán tiểu học.

Tôi đã chuẩn bị một số tài nguyên nhằm hỗ trợ những người đang thực hiện quá trình chuyển đổi từ sử dụng phần mềm thống kê sang tìm hiểu toán học cơ bản.


Cảm ơn, các nguồn tài nguyên bạn cung cấp là tuyệt vời. Btw, blog của bạn hoàn toàn hấp dẫn (Tôi là sinh viên I / OP và sử dụngR, nó giống như một sự mặc khải đối với tôi).
Đăng quang

@Coronier Thật tuyệt khi gặp một người khác kết hợp R với I / O Psych.
Jeromy Anglim

3

Tôi có ấn tượng rằng bạn nghĩ rằng bạn có thể hiểu rõ hơn về một phương trình thống kê bằng cách lập trình nó thành R hoặc C ++; bạn không thể Để hiểu một phương trình thống kê, hãy tìm một cuốn sách giáo khoa "đại học" với rất nhiều bài toán về nhà ở cuối mỗi chương có chứa phương trình, và sau đó làm bài tập về cuối chương có chứa phương trình.

Ví dụ, để hiểu PCA, bạn cần hiểu rõ về đại số tuyến tính và đặc biệt là phân tách giá trị số ít. Trong khi học điện toán lượng tử thông qua cuốn sách của Michael Nielsen, tôi thấy rõ rằng tôi cần phải xem lại đại số tuyến tính. Tôi đã xem qua các video của Gilbert Strang, chúng cực kỳ hữu ích trong việc thiết lập sự hiểu biết cơ bản về các khái niệm. Tuy nhiên, sắc thái của tài liệu không thể vượt qua cho đến khi tôi tìm thấy một cuốn sách đại số tuyến tính chứa rất nhiều vấn đề bài tập về nhà, và sau đó tôi cần phải làm chúng.


4
@ schenectady trong khi tôi đồng cảm với quan điểm của bạn, đối với tôi, ít nhất, mã R cung cấp một cầu nối mà tôi có thể sử dụng để hiểu rõ hơn về các phương trình và toán học liên quan. Điều đó đang được nói, tôi hoàn toàn đồng ý với nhu cầu về các vấn đề, số liệu thống kê và toán học nói chung là điều mà chỉ có thể học được bằng cách làm.
richiemorrisroe

2

Tôi hiểu khó khăn của bạn khi tôi gặp vấn đề tương tự khi tôi cố gắng làm điều gì đó mới trong thống kê (Tôi cũng là học sinh tốt nghiệp, nhưng trong một lĩnh vực khác). Tôi đã thấy việc kiểm tra mã R khá hữu ích để có ý tưởng về cách tính toán một cái gì đó. Ví dụ, gần đây tôi đã học cách sử dụng kmeansphân cụm và có nhiều câu hỏi cơ bản, cả về khái niệm và cách thực hiện. Sử dụng một Rcài đặt (tôi khuyên bạn nên R Studio, http://www.rstudio.org/ , nhưng bất kỳ cài đặt nào cũng hoạt động), chỉ cần nhập kmeansvào dòng lệnh. Đây là một ví dụ về một phần của đầu ra:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Tôi không chắc chắn việc kiểm tra nguồn thực tế như thế nào mỗi lần, nhưng nó thực sự giúp tôi biết được chuyện gì đang xảy ra, giả sử bạn có chút quen thuộc với cú pháp.

Một câu hỏi trước đây tôi đã hỏi về stackoverflow đã chỉ cho tôi theo hướng này, nhưng cũng hữu ích nói với tôi rằng các ý kiến ​​về mã đôi khi được đưa vào đây .


Tổng quát hơn, Tạp chí Phần mềm Thống kê minh họa mối liên kết này giữa lý thuyết và thực hiện, nhưng nó thường là về các chủ đề nâng cao (cá nhân tôi gặp khó khăn trong việc hiểu), nhưng là một ví dụ hữu ích.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.